导读
在互联网飞速发展的今天,我们几乎都会使用淘宝和抖音,它们会给我们推荐各种各样的商品或者视频,难道你们就不好奇它们是如何进行推荐的吗?接下来小编就带你走进推荐系统的世界。
1.什么是推荐系统
为了更好地发现用户的喜好,推荐系统应运而生。推荐系统主要通过分析用户的历史行为或者用户的兴趣偏好或者用户的人口统计学特征来产生用户可能感兴趣的项目列表,通过推荐系统定义可看出推荐系统的任务主要分为预测和推荐两部分。现如今推荐系统已在互联网中得到了广泛的应用,例如:
- 新闻推荐:今日头条
- 视频推荐:抖音
- 音乐推荐:网易云音乐
- 电商推荐:淘宝、京东和当当
在简单介绍了推荐系统之后,让我们跟着小编来了解一下推荐系统的核心——推荐算法吧!
2.推荐算法分类
推荐算法是整个推荐系统的灵魂,随着推荐系统不断发展,推荐算法的种类逐渐增加,具体分类如下图所示:
2.1 基于内容的推荐
最早使用的推荐算法是基于内容的推荐,它跟传统信息检索技术类似。本质是分析内容,建立特征。把项目按照内容进行分类,例如电影有科幻片、爱情片、动作片、古装片、玄幻片、战争片、恐怖片、纪录片等;食品有垃圾食品、保健食品、烘焙食品、休闲食品、发酵食品、功能性食品等。该技术用于推荐比较直观,它根据用户对某种特征的内容感兴趣,然后分析一个内容具备什么特征来进行推荐。基于内容的推荐方法步骤:
(1)内容的提取,也就是特征提取,提取例如电影、视频等相关待推荐项目的特征形成分类标签。
(2)进行用户偏好计算,利用用户的历史上所喜好或者非喜好的特点数据,来综合学习这些用户的偏好特征。
(3)内容的召回,通过比较上一步得到用户偏好特征和待推荐项目的特征,提取用户最可能喜欢的项目集。通过与用户上一步获得的偏好特征及待推荐项目的特征进行比较,并将其中的一些信息提取出来作为用户自己最可能喜欢的项目集。
(4)项目的排序,按照上一步提取的用户偏好项目集,根据相关规则进行排序,例如在对电影进行排序时,可以根据用户偏好电影集中各个电影的平均评分倒序排序,从而把分数高的电影都推荐出去。
2.2 基于协同过滤的推荐
协同过滤推荐算法主推荐原理主要是根据当前用户过去的行为资料或与该用户兴趣相同的历史用户行为资料来预测当前的用户可能感兴趣的东西并推荐给当前的用户。其核心的假设就是“物以类聚,人以群分”。
(1)基于用户的协同过滤
基于用户的协同过滤推荐的基本原理是,根据用户的偏好及行为习惯,发现与当前用户口味和偏好相似的“邻居”用户群。基于邻居的历史偏好信息,为当前用户进行推荐。
基于用户的协同过滤推荐算法如上图所示。A与C为相似用户,用户A对项目a、c和e感兴趣,用户C对项目a、b、c和e感兴趣,则将项目b推荐给用户A。
(2)基于物品的协同过滤
基于物品的协同过滤推荐的基本原理是,根据物品的自然分类、定义及用户对物品的偏好,发现物品和物品之间的相似度,将类似的物品推荐给用户。
基于项目的协同过滤算法如上图所示。a和c为相似项目,用户A、B、C对项目a和c感兴趣,而用户D对项目a感兴趣。则将项目c推荐给用户D。
2.3 基于模型的推荐
基于模型的推荐最常见的是基于隐语义分析的模型,它从本质上来看有一个重点是在于我们如何能够寻找到潜在的隐语义相关主题或者对内容进行了正确的分类。例如,在它的推荐活动管理软件系统中它已经完全能够基于每个用户的不同需求和使用行为自动地对每个Item主题进行自动聚类,即通过Item将Item活动划分为组成不同的活动类别和不同主题,这些划分类别的不同主题活动可以被广泛理解为构成用户作为一个系统使用者的共同兴趣。
基于图的分析模型在数据推荐较为常见。用一个不同图中的模型可以进行一个协同化的数据过滤,则将两个模型中用户之间的数据相似性分别放在一个不同图中模型里面后再对其进行相似性过滤考虑,常见的两个过滤算法主要有SimRank系列数据过滤算法和马尔科夫模型算法。
2.4 基于混合模型的推荐
导致推荐算法模型不好的主要原因,是分类和真实分类之间存在偏差。通过算法融合可以可在一定范围内防止过拟合以及降低偏差,并且缓解大量数据的稀疏化带来的影响。常见的推荐算法混合模式有:
(1)加权式:加权多种推荐方法的结果。
(2)切换式:按照一个问题的专业背景及其实际工作状态或者技术要求等等来直接决定问题是否需要进行推荐变换,进而采取不同推荐对于不同问题变换方法。
(3)混杂式:同时采用多种推荐方法给出多种推荐结果供用户参考。
(4)层叠式:将一种推荐技术的结果数据作为另一种推荐技术的初始数据的方法。
(5)特征补充:推荐技术将其有关其他功能的信息合并或直接链接到其他推荐方法。
(6)级联式:首先由第一推荐技术生成内部模型,其次将此内部模型直接用作第二推荐技术的输入。
今天学习就到这里啦,下期小编将会手把手教你们实现一个推荐算法,咱们下期再见!
-The End-
文案:朱琪
指导老师:曹菁菁 赵强伟
排版:王雪 黄雅文