目前各大招聘网站,App层出不穷,令求职者,招聘者都是无法快速筛选出自己需要的信息,所以我想要做一个网络爬虫,方便网络用户在各大平台获取到自己真正需要的信息。
(一)主要内容
本课题的研究内容是设计并实现了网络爬虫的数据抓取。本系统可进行数据抓取,系统操作简单,功能基本符合其数据抓取与分析,方便的对求职招聘、求职所需信息、求职岗位进行筛选,了解岗位所招聘的人数和招聘的个人情况等。同时本系统还要求查找方便、可靠性高、存储量大、保密性好、寿命长、成本低等。这些优点能够极大的提高筛选操作的效率,节省了很大一部分时问,可以让用户做更多别的有意义的事情。
(二)解决方案
本文将网络爬取招聘信息进行可视化分析并作机器学习作为研究重点。在开发之前,通过对技术分析及其所需开发程序的分析。最后,运用python和python的pandas实现对招聘信息爬取的分析运行。该程序通过现代计算机技术开发,将庞大的数据信息与计算机操作相结合,实现了操作便利,开发软件易获得,开发技术不封闭的功能优。使其不需要管理员的参与可自主实现客户需求的一系列功能操作。
该招聘信息爬取网站是一款适用于求职者操作便利快捷、快捷、实用的信息服务查询网站。该系统的开发满足了求职者的需求,省去了以往求职时的繁琐程序便利了人们的生活。该体系大致包括二个部分:招聘和求职。对招聘的人来说,具有筛选各大平台求职者个人详细信息的功能;其次对于求职者来说可以查询各大平台发布的招聘信息,从而进行高质量的分析。让求职者对于工作大环境有更深的理解和把握。
(三)预期目标
在该网站中需要实现对招聘信息的抓取与分析。
1、通过python实现数据爬取;
2、熟悉网站的设计所需开发软件;
3、该网站实现词云,可视化效果,对求职者的求职岗位实现高度匹配。
4、提高求职者对招聘信息查找及筛选的工作效率,减轻求职者的劳动负担;
四、总体安排与进度
2022年12月:通过与老师沟通,确定论文题目。
2023年1月到2月:查阅资料和观看视频学习有关论文知识,参考相关文献进行撰写。
2023年2月到3月:把整体论文框架构建出来,通过问卷调查设计,问卷调查的方式,得出结论。
2023年3月到4月:把得出的结论,进行汇总。基本完成论文