python-hadoop个性化音乐推荐系统的设计与实现

选题依据：

在互联网时代，各类音乐网站极大的方便了人们对于音乐的需求。然而，大型的音乐门户网站能够保存上千万首歌曲，在面对海量且不断增长的音乐作品，人们往往难以从中找到符合自己“口味”的歌曲。信息过载成为最直接的问题，提高用户体验的需求变得十分迫切。信息过载的有效解决方法之一就是个性化推荐系统，它能够帮助人们从繁杂信息中发掘感兴趣的内容。因此，个性化推荐系统与互联网音乐的结合成为音乐发展的必然趋势。

研究综述：

传统的搜索引擎只适合应用在用户有明确的目标并且能够用关键词准确的表达出来的信息检索问题。同时，音乐是一个典型的具有“长尾”现象的物品—只有极少部分的歌曲会被用户下载，绝大部分音乐往往无人问津。因此，个性化音乐推荐系统正是为了在没有明确需求的情况下，挖掘处于长尾部分音乐，帮助人们找到其喜爱的歌曲。

2．课题的基本内容

推荐系统是信息过滤系统的一种，它的主要功能是预测用户对某个物品的喜爱程度。

在个性化音乐推荐领域，主流的推荐方法有两类，一是基于内容的推荐，二是基于协同的推荐。其中，正确的计算音乐之间的相似度是这两类推荐方法的关键所在。然而，这两种方法都存在某些不足之处，如基于内容的推荐存在推荐准确率不高的问题，基于协同的推荐倾向于为用户推荐热门的歌曲。

通过对这两类推荐算法较为全面和深入的分析，发现这两类算法之间的存在一定的互补关系。因此，本文提出了一种将基于内容和基于协同过滤相混合的推荐算法—语义增强型的协同过滤算法。

语义增强型的协同过滤算法首先分析了歌词中隐含的语义信息，并计算歌曲歌词之间的语义相似度，然后基于用户的音乐下载历史计算歌曲的共现相似度。因为歌词代表着一首歌曲想要传达给听众的思想感情，所以通过结合这两种不同的相似度信息，本推荐算法可以改善基于协同过滤算法的不足之处。本文研究对象是带有歌词的歌曲，在后文中，音乐、歌曲都指代含有歌词的一类歌曲。在推荐冷门音乐时，本文提出的混合推荐算法比纯粹的基于内容和基于协同的推荐方法都更加有效。为满足当前为庞大用户群推荐海量音乐的需求，本系统在开发时使用了目前主流的大数据分布式计算平台Hadoop。借助Hadoop优异的扩展性，本推荐系统能够有效的完成几十万用户的计算工作。

3．课题的重点、难点及创新点

课题的重点：

研究用户的歌曲下载数据，根据歌曲下载次数的分布，将歌曲分为热门音乐和冷门音乐两类，并且分析歌词中隐含的语义信息，更加细致、有针对性的分析推荐算法的推荐性能。

课题的难点：

语义增强型的协同过滤算法在传统的协同过滤算法中引入了歌曲歌词的语义信息，以此缓解协同过滤算法的不足。使用Hadoop相关技术实现语义增强型的协同过滤算法，使推荐算法能够完成大规模的用户推荐计算。

课题的创新点：

语义增强型的协同过滤算法首先分析了歌词中隐含的语义信息，并计算歌曲歌词之间的语义相似度，然后基于用户的音乐下载历史计算歌曲的共现相似度。因为歌词代表着一首歌曲想要传达给听众的思想感情，所以通过结合这两种不同的相似度信息，来提高音乐推荐系统的个性化，语义增强型的协同过滤算法可以改善基于协同过滤算法的不足之处。

4．论文提纲

第一章绪论

1.1 推荐系统的研究背景

1.2 个性化音乐推荐系统的研究意义

1.3 推荐系统的研究现状

1.4 本文主要研究工作

1.5 论文组织结构

第二章推荐系统方法及原理综述

2.1 推荐系统简介

2.2 基于内容的推荐系统

2.3 基于协同过滤的推荐系统

2.4 本章小结

第三章语义增强型协同过滤算法的研究

3.1 用户音乐下载数据分析

3.2 语义增强型的协同过滤算法

3.3 歌曲歌词的隐语义分析

3.4 歌曲的协同信息分析

3.5 用户歌曲推荐列表计算

3.6 语义增强型的协同过滤算法对比实验及结果分析

3.7 语义增强型的协同过滤算法总结

3.8 本章小结

第四章个性化音乐推荐系统的设计与实现

4.1 个性化音乐推荐系统需求分析

4.2 个性化音乐推荐系统的设计

4.3 个性化音乐推荐系统的实现

4.4 系统测试

4.5 本章小结

第五章总结与展望

5.1 论文工作总结

5.2 未来展望

参考文献

致谢

首页 > Python毕业设计 > 正文

快捷导航

最近更新

热门作品