首页 >  Python毕业设计  > 正文

大数据环境下的优酷视频数据分析与推荐系统

近年来,互联网与移动终端的普及,网络上的电影娱乐信息数量海量增加。这其中自然不乏关注视频的民众,而现在正处于大数据时代,随着信息量的增多,为用户提供便捷的搜索服务也更加具有挑战性。大规模存储信息并精确搜索的代价是巨大的,人们需要在信息搜索的快捷性与成本中找到平衡,网络视频标题的抽取已经成为了信息抽取和网络爬虫不可避免的一个环节。因此设计并实现一个具有良好健壮性和扩展性的系统非常有必要。
本系统主要开发工具是PyCharm,主要技术为html、css以及django开源框架的结合,前端使用 vue+elementui后端使用python+django.本系统主要实现了用户注册,登录, 以及优酷视频的抓取,当前视频热门分析,视频类别占比分析等。
本系统很大程度上增加用户搜索相关视频标题关键词的准确度,减少用户的搜索时间,提高效率。不需要依据用户对对象的评价意见.对象使用通过特征提取方法得到的对象内容特征来表示, 系统基于用户所评价对象的特征, 学习用户的兴趣, 从而考察用户资料与待预测项目相匹配的程度,能够为用户带来最直观的感受。
abstract 4
目    录 5
独创性声明 2
摘要 3
摘要 3 5
abstract 4 5
目    录 5 5
第一章 绪论 7
1.1 研究背景及意义 7
1.1.1 研究背景 7
1.1.2研究意义 7
1.2 研究现状 8
第二章 可行性分析 8
2.1社会可行性 8
2.2技术可行性 9
2.3操作可行性 9
2.4系统的技术介绍 9
2.4.1 Python介绍 9
2.4.2 Django介绍 9
2.4.3 Vue介绍 10
2.4.4 Scrapy架构 11
2.5系统文件结构介绍 11
2.6 scrapy爬虫主要文件介绍 12
2.7系统开发环境搭建 13
第三章  需求分析和设计 14
3.1 系统功能概述和分析 14
3.2功能模块设计 15
3.3爬虫设计 15
3.4系统文件结构介绍 17
3.5 scrapy爬虫主要文件介绍 18
第四章 系统实现 18
4.1 数据爬取模块实现 18
4.1.1 优酷视频数据的爬取 18
4.2 功能模块实现 21
4.2.1 注册和登录功能 21
4.2.2 主页功能模块 22
4.2.3 系统推荐模块 24
4.3 分析模块实现 25
4.3.1 当前视频热点分析模块 25
4.3.2 视频类别占比模块 27
第五章 系统测试 28
5.1 软件测试的环境 28
5. 2 登录功能测试 29
  30
5.3 系统推荐测试 31
5.4 分析模块测试 31
结束语 33
参考文献 35
致谢 37
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服QQ:242219979

上一篇:python高校实验中心管理系统的设计与实现

下一篇:最后一页