首页 >  Python毕业设计  > 正文

某淘宝书店广告投入与销售收入关系分析模型设计与实现

回归问题是机器学习三大基本模型中很重要的一环,回归问题包括常见的线性回归和逻辑回归,虽然都是得到结果值,但根据值域的不同,线性回归和逻辑回归通常用来解决实际中连续值域上的预测问题以及离散值域上的分类问题。其功能是建模和分析变量之间的关系回归问题多用来预测一个具体的数值,如预测房价、未来的天气情况等等。例如我们根据一个地区的若干年的PM2.5数值变化来估计某一天该地区的PM2.5值大小,预测值与当天实际数值大小越接近,回归分析算法的可信度越高。
此次毕业设计采取回归模型构建广告与销售额之间的回归方程,选取广告投入数据以及图书销售数据集进行预测。通过本次广告投入与销售收入关系分析预测模型的建立,能够得到不同的类型的广告投入方式所获取的投入与销售额之间关系也不一样,电视广告投放、电台广告投放、报纸广告投放这些不同特征也能够影响投入与销售额之间的关系该模型为将来企业提供合理的广告媒体投入建议。
该投入与销售额回归分析和预测模型可以帮助企业分析出广告媒体投入与销售额之间的关系,找出广告媒体投入最适合的数目,我们就可以更好地分配广告开支并且使销售额最大化。
二、国内外发展现状
机器学习是指通过计算机学习数据中的内在规律性信息,获得新的经验和知识,以提高计算机的智能性,使计算机能够像人那样去决策。随着各行业对数据的需求量增多,对处理和分析数据的效率要求变高,一系列机器学习算法应运而生。机器学习算法主要是指通过数学及统计方法求解最优化问题的步骤和过程。针对不同的数据和不同模型需求,选择和使用适当的的机器学习算法可以更高效地解决一些实际问题。本文将从机器学习的起源出发,逐步介绍70多年来机器学习领域的若干重大突破及国内外研究现状,并指出未来机器学习算法面临的挑战。[5]。
机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能中最具智能特征,最前沿的研究领域之一。自 20世纪80年代以来,机器学习作为实现人工智能的途径,在人工智能界引起了广泛的兴趣,特别是近十几年来,机器学习领域的研究工作发展很快,它已成为人工智能的重要课题之一。机器学习不仅在基于知识的系统中得到应用,而且在自然语言理解、非单调推理、机器视觉、模式识别等许多领域也得到了广泛应用。一个系统是否具有学习能力已成为是否具有“智能”的一个标志。机器学习的研究主要分为两类研究方向:第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;第二类是大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识[5]。
三、本课题的研究内容:
线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为,a为误差服从均值为0的正态分布。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。基本思想是求某连续可导函数最小值,初始以该函数某个顶点作为基准,求得该点的梯度,然后沿着梯度相反方向调整顶点坐标,得到新的顶点,循环反复,直到达到该函数的局部最小值,如果该函数是凸函数,则局部最小值为全局最小值。
课题采用一元线性回归构建广告与销售额之间的回归方程,来完成7月份的广告投入预算。在数据处理阶段利用pandas载入半年广告投入数据集和半年各类图书销售数据集,完成缺失数据补全、错误数据修正、噪声数据平滑工作。分别对快车广告投入数据已经所有平台销售书数据按月进行统计。在广告投入关系表中抽取投放日期和支出字段;在图书销售数据关系表中抽取业务日期、金额字段。利用matplotlib绘制散点图,判断分布情况。用最小二乘法并对模型进行估计和检验。将模型预测结果进行可视化。
四、主要方法步骤如下:
1.数据处理
导入包文件,利用pandas载入半年广告投入数据集和半年各类图书销售数据集,完成缺失数据补全、错误数据修正、噪声数据平滑工作。利用train_test_split函数将数据集划分为训练集和测试集,并返回划分好的训练集测试集样本和训练集测试集样本[15-19]。
2.训练集与测试及数据处理
对自变量进行特征分析,并画出散点图,广告费用作为自变量与销售收入作为因变量的相关性,把不相关的数据剔除。
3.建立线性回归模型
线性回归模型通过最小二乘法即最小平方法,构建损失函数,利用最小误差的方法寻求数据的最佳匹配函数,求得未知的数据,起到预测的作用,并且达到预测的数据与实际数据之间的误差平方和达到最小。
4.模型预测
采用回归方程进行预测,对回归模型进行诊断,最终预测准确率不低于样本均值。
五、研究方法和研究手段
1.调查法:有目的、有计划的搜集有关该线性回归模型的相关信息。
2.文献研究法:查阅文献和书籍资料,了解相关技术的发展,以此确定研究课题,获得比较全面的资料。
3.实验研究:通过在各种数据集上进行实验,对比和分析不同机械学习回归模型的表现和性能。实验研究可以检验模型的可行性和有效性,同时也可以为模型的改进和优化提供依据。
4.案例研究:针对具体的应用场景和问题,选择一些典型的案例进行深入的研究和分析。通过案例研究,可以更加深入地理解机械学习回归模型在实际问题中的应用和表现,同时也可以为模型的推广和应用提供参考。
六、研究步骤
1.完成机械算法回归问题以及相关知识的学习与研究
2.完成实验环境的搭建以及项目的创建
3.完成线性回归模型的建立
4.完成对比试验,分析实验数据得出实验结论
5.完成设计书的撰写。
 

以上是本题目部分介绍,若需要完整版或不符合您的要求,请联系客服微信:ztopmind  > 或者加QQ 840612233

上一篇:基于大数据技术的高考志愿智能推荐系统 数据爬虫可视化分析

下一篇:最后一页