首页 >  开题报告  > 正文

基于大数据分析的药品推荐购买系统 开题报告

互联网是一个庞大的非结构化的数据库,将数据有效组织起来呈现出有着巨大的使用前景。但是,这些通用性搜索引擎也存在着一定的局限性。不同地方、不同背景或者不同领域的用户具有不同的检索和需求。现在大数据时代已经来到,网络爬虫技术成为本世纪不可或缺的一部分,很多时候需要数据来分析用户行为,规划与分析自己产品的不足之处,分析竞争对手的信息等等,但是这些的首要条件就是数据的收集。因此采集数据是一个很重要的环节,之后的对数据的分析都建立在采集的基础上。当前,由于处方类药品销售限制,在非处方药品推荐的要求下,开发一款整体式结构的非处方药品推荐系统,将复杂的系统进行拆分,能够实现对需求的变化快速响应、系统稳定性的保障,能保证平台可持续、规模化发展的要求。
本系统包括数据采集、数据分析、商品推荐三个模块,数据采集、数据分析采用Python语言开发,商品推荐功能在基于数据分析的基础上,开发一套药品推荐购买系统,系统前端界面涉及的技术主要有VUE,HTML,JQUERY等等,通过这些技术可以实现前端页面的美观和动态效果使之符合广大群众的审美观,后台主要使用的技术主要有Java编程语言,Mysql数据库。系统能够有效的帮助用户快速购买到性价比、认可度最高的药品。
主要研究内容
(一)数据采集分析
本项目数据采集使用Python爬虫工具,爬取天猫医药馆中关于药品的各个店铺销售数据。其中收集数据项包括:商品id、商品名称、品牌名称、价格、商品原价、商品销售量、商品销售额、商品url、类目id、类目、商品评价数、商品收藏数、商品库存、商品发货地、商品产地国家、商品参数、店铺ID、店铺名称、店铺省份、店铺城市、店铺开店时间、店铺开店年数。分析采用Python的Numpy以及Pandas中含有的数据分析包,来对其中的数据进行可视化分析。
在进行数据分析前,先需要对数据进行清洗,可以通过Jupyter进行数据分析时使用is_null()方法来找出异常的空值。内容如下:
1、店铺分布统计:按全国省份分布统计店铺数量。
2、店铺总销售额情况:通过pandas先获取表格数据,然后再使用sort_values()函数对现有的数据进行排序最终再获取前10的排名。
3、商品价格与商品销量统计:通过排列、筛查等手段洗去极值后,建立价格范围(1-100元)所对应的商品销售量数据。
4、开店年数与商品销量统计:经过数据清洗完极端值与空值后,建立以店铺开店年数与商品销量所对应的品销售量数据。
5、商品收藏数与商品销售量统计:建立以店铺收藏数与商品销量所对应的品销售量数据。
6、药品推荐:根据上述统计分析后,找出店铺销售额最高、商品价格与销量最平衡、开店年数与商品销量最高、商品收藏数与商品销售量最匹配的药品推荐给用户。
(二)系统功能
本题旨在实现一个基于大数据分析的药品推荐购买系统,系统整体采用B/S模式,网站前台界面采用VUE技术。网站后台使用Java语言编写,采用MySql数据库,运用SpringBoot框架以下是项目的主要模块。
(1)前台功能:
1. 用户的注册;
2. 用户资料的修改;
3. 用户登录;
4. 药品智能推荐:根据大数据分析后,找出店铺销售额最高、商品价格与销量最平衡、开店年数与商品销量最高、商品收藏数与商品销售量最匹配的药品推荐给用户。
5. 药品的购买;
6. 药品的搜索;
7. 药品的分页查看;
8. 药品的分类搜索;
9. 购物车中药品的删除与药品数量的修改;
10. 订单提交及收货人信息的修改;
(2)后台功能:
1. 管理员登录及密码修改;
2. 药品的管理,包括药品的增、删、改、查;
3. 订单的管理,包括订单的发货及删除;
4. 管理员管理,包括管理员的添加及管理员密码重置。
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服微信:ztopmind  > 或者加QQ 840612233

上一篇:开题报告 住院患者管理系统

下一篇:最后一页