盘算机毕业设计hadoop+spark+hive动漫推荐系统 漫画推荐系统 漫画分析可视 ...

小小小幸运  金牌会员 | 2024-6-13 14:59:21 | 来自手机 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 507|帖子 507|积分 1521

流程:
1.DrissionPage采集知音漫客约2万条国产动漫数据存入mysql数据库;
2.Mapreduce对采集的动漫数据进行数据洗濯、拆分数据项等,转为.csv文件上传hadoop的hdfs集群;
3.hive建库建表导入.csv动漫数据;
4.一半指标使用hive_sql分析得出,一半指标使用Spark之Scala完成;
5.sqoop对分析结果导入mysql数据库;
6.Flask+echarts搭建可视化大屏;
创新点:Python全新DrissionPage爬虫使用、海量数据、爬虫、可视化大屏、离线hive+实时Spark双实现
可选装:推荐系统、猜测系统、知识图谱、配景管理等。



核心算法代码分享如下:
  1. /*
  2. Navicat MySQL Data Transfer
  3. Source Server         : Win7本地测试_localhost_3306_123456_版本5.7
  4. Source Server Version : 50714
  5. Source Host           : localhost:3306
  6. Source Database       : hive_zymk
  7. Target Server Type    : MYSQL
  8. Target Server Version : 50714
  9. File Encoding         : 65001
  10. Date: 2023-08-30 11:43:34
  11. */
  12. SET FOREIGN_KEY_CHECKS=0;
  13. -- ----------------------------
  14. -- Table structure for tb_zymk
  15. -- ----------------------------
  16. DROP TABLE IF EXISTS `tb_zymk`;
  17. CREATE TABLE `tb_zymk` (
  18.   `id` int(11) NOT NULL AUTO_INCREMENT,
  19.   `title` text COLLATE utf8mb4_bin COMMENT '漫画名称',
  20.   `update_times` text COLLATE utf8mb4_bin COMMENT '每周更新时间',
  21.   `tags` text COLLATE utf8mb4_bin COMMENT '标签',
  22.   `content` text COLLATE utf8mb4_bin COMMENT '内容',
  23.   `readings` text COLLATE utf8mb4_bin COMMENT '阅读量',
  24.   `subscribes` text COLLATE utf8mb4_bin COMMENT '订阅量',
  25.   `rewards` text COLLATE utf8mb4_bin COMMENT '打赏',
  26.   `monthtickets` text COLLATE utf8mb4_bin COMMENT '月票',
  27.   `recommends` text COLLATE utf8mb4_bin COMMENT '推荐次数',
  28.   `comments` text COLLATE utf8mb4_bin COMMENT '评论量',
  29.   `scores` text COLLATE utf8mb4_bin COMMENT '评分',
  30.   `author` text COLLATE utf8mb4_bin COMMENT '作者',
  31.   `zps` text COLLATE utf8mb4_bin COMMENT '代表作',
  32.   `ctime` text COLLATE utf8mb4_bin COMMENT '章节最后更新时间',
  33.   `img` text COLLATE utf8mb4_bin,
  34.   `url` text COLLATE utf8mb4_bin,
  35.   PRIMARY KEY (`id`)
  36. ) ENGINE=InnoDB AUTO_INCREMENT=1437 DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;
复制代码


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

小小小幸运

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表