首页 >  Python毕业设计  > 正文

基于python的豆瓣电影数据分析可视化系统

本论文主要站在电影票房与电影类型的角度,对数据进行采集、清洗、归纳并数形结合,对数据进行图形的可视化展示,让用户对电影类型趋势走向有较好的把握。
本论文采用模块化处理方式,对系统分功能、分模块。将系统分成:1、 系统用户登录功能:可对个人账户进行管理,账户信息与MySQL数据库连接。2、系统首页展示3、爬取电影网页的数据展示功能:用表格的形式对电影数据信息进行排版,使用户清晰地了解各个电影的票房、评分、演员表等一系列重要信息。4、电影数据词云图展示功能。可以将评论、标题、演员等数据以词云图的形式展现出来。5、电影种类分布功能:可根据种类展示出各个种类电影的分布情况。6、各类型电影的评分变化展示功能:根据不同类型电影分类,可以将用户对电影的评分以折线图表现出来。
本文重点阐述了对豆瓣电影网的中国近10年电影数据的爬取,通过对豆瓣的网站分析,进一步对程序进行详细的设计以及对数据的可视化分析。运用Python语言以及其强大的多功能模块进行开发设计。通过环境概述、分析目标网站、进行数据采集清洗、数据可视化分析这几个部分,详细的说明了对豆瓣的中国近10年电影数据爬虫的开发过程,以及对电影数据进行相应的热度、喜爱种类类型、喜爱的导演等多方面进行可视化的数据分析。为电影行业提供相应的参考数据。
二、完成的主要任务及要求
1. 查阅文献资料,明确毕业设计题目的意义及目的,查阅参考文献不少于30篇;
2. 学习并掌握Python,可视化相关知识;
3. 完成基于Python的豆瓣电影数据分析可视化系统设计与实现; 
4. 提出多个可行性方案,分析比较后,选择其中一个方案进行具体设计; 
5. 在设计过程中,对各个部分进行详细分析;
6. 撰写毕业设计说明书及毕业设计简介;
7. 按照学院要求规范撰写毕业设计文档。
三、完成任务的时间节点
第七学期,第5周-7周:确定选题,开始查阅参考文献,并按照任务要求展开研究。
第七学期,第8周-14周:阅读大量参考文献,形成自己设计方案,提出开题答辩申请。 
第七学期,第15周-16周:完成开题答辩。
寒假,自主进行研究,与指导老师线上沟通。
第八学期,第1-2周:完成豆瓣电影数据分析可视化系统的框架研究。
第八学期,第3-4周:完成总体框架设计及各功能模块设计。
第八学期,第5-6周:细化研究子模块,调试代码,测试数据。
第八学期,第7-9周:完成毕业设计文档撰写工作,并对文档进行查重,完成毕业设计定稿。
第八学期,第10周:将毕业设计提交指导教师评审,评阅人评审。
第八学期,第11周-12周:完成毕业答辩。
四、必读参考文献
[1]高巍,孙盼盼,李大舟,等.基于Python爬虫的电影数据可视化分析[J].沈阳化工大学学报,2020(9):167-169.
[2]王国华.基于python的豆瓣电影网络爬虫设计与分析[A]. 天津市电子学会.第三十六届中国(天津)2022’IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C].天津市电子学会:天津市电子学会,2022:212-215.
[3]程夏敏.对“豆瓣电影”网站数据和内容的分析——以2021年国产电影为例[J]. 中国电影市场,2022,(07):23-30.
[4]蔡文乐,周晴晴,刘玉婷,秦立静. 基于Python爬虫的豆瓣电影影评数据可视化分析[J]. 现代信息科技,2021,5(18):86-89+93.
[5]张荑阳,毛红霞.基于python的豆瓣电影数据采集与分析可视化[J]. 电子制作,2021,(16):47-49.
[6]高巍,孙盼盼,李大舟.基于Python爬虫的电影数据可视化分析[J]. 沈阳化工大学学报,2020,34(01):73-78.
[7]杨孟姣,杜棋东.基于Python爬虫网站数据分析系统设计与实现[J]. 计算机时代,2022,(11):81-83+88.
[8]王辛浩,单艳.探究Python语言下网络爬虫的技术特点及应用[J]. 数字技术与应用,2022,40(10):85-87.
[9]黄蓉,毛红霞.基于豆瓣网某系列电影数据采集与可视化分析[J]. 现代信息科技,2020,4(23):4-7.
[10]王志.电影网站数据挖掘可视化系统设计与实现[D].华中科技大学,2019.
[11]邱俊杰.基于Python定向爬虫技术对微博数据可视化设计与实现[J].电脑知识与技术:学术版,2020(22):43-44.
[12] HERR B W,KE W,HARDY E,et al.Movies and Actors:Mapping the Internet MovieDatabase[C]//200711thInternationalConferenceInformationVisualization (Ⅳ’07).New York:IEEE,2007:465-469.
[13]HAUGHTON D,MCLAUGHLIM M D,MENTZER K,et al.Movie Analytics:Visualization of the Co-Starring Network[C]//2014 IEEE 4th Symposium on Large Data Analysis and Visualization (LDAV).New York:IEEE,2014:115-116.
[14] NEMETH B,TAKACS G,PILASZY I,et al.Visualization of Movie Features in Collaborative Filtering[C]//2013 12th International Conference on Intelligent Software Methodologies,Tools and Techniques (SoMeT).New York:IEEE,2013:229-233.
[15]许冰晗,尚鸿运,马灿,等.基于Movielens电影数据的可视分析[J].计算机工程与科学,2017,39(11):2086-2094.
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服微信:ztopmind  > 或者加QQ 840612233

上一篇:python房屋租赁管理系统的设计与实现

下一篇:基于python的高校学生毕业实习双选系统