产品经理要不要懂技术?要的!本系列文章将从最简单的概念开始,逐步讲解推荐系统的发展历程和最新实践。以产品经理的视角,阐述推荐系统涉及的算法,技术和架构。本章是第二章,将系统性地通过图文的方式介绍协同过滤算法。
我有个兄弟,是抖音的点赞狂魔,他的点赞次数高达6924次,而且他大多数的赞都是给那些青春靓丽的 *** 姐们,如下图。看他的抖音推荐内容,都是满目的 *** 姐唱啊跳啊不亦乐乎,他也觉得甚爽。不过,好景不长,没多久他就跟我说:“我再也不敢再点了,我老婆已经发现我给 *** 姐们点了上1000个赞,而且知道我点赞的视频,也会推荐给她”。
把好友看过的视频推荐给用户,这就是协同过滤。准确地说,叫用户协同过滤(User Collaborative Filtering)。
一、协同过滤概述(Collaborative Filtering)协同过滤(简称CF)是推荐系统最重要的思想之一。在早期,协同过滤几乎等同于推荐系统。协同过滤思想产生于1994年,被用于邮件系统上。2001年,亚马逊用协同过滤算法来推荐相似商品。
协同过滤的思想比较简单,主要有三种:
用户协同过滤(UserCF):相似的用户可能喜欢相同物品。如加了好友的两个用户,或者点击行为类似的用户被视为相似用户。如我兄弟和她的太太互加了抖音好友,他们两人各自喜欢的视频,可能会产生互相推荐。
物品协同过滤(ItemCF):相似的物品可能被同个用户喜欢。这个就是著名的世界杯期间沃尔玛尿布和啤酒的故事了。这里因为世界杯期间,奶爸要喝啤酒看球,又要带娃,啤酒和尿布同时被奶爸所需要,也就是相似商品,可以放在一起销售。
模型协同过滤:使用矩阵分解模型来学习用户和物品的协同过滤信息。一般这种协同过滤模型有:SVD,SVD++等。这种协同过滤要比前两个来得抽象些,这里先不解释,后面详述。
下面按照物品协同过滤,用户协同过滤和模型协同过滤的顺序,详细解释这几种算法。
二、物品协同过滤的计算2003年,亚马逊发表了一篇论文,阐述了他们如何用物品协同过滤算法(Item-to-Item Collaborative Filtering),搭建他们“看了又看”功能。
如下图:
这是17年前的截图,图跟纸质老照片那样变得斑驳。图中是在购物车关联页面的相关推荐。那么,这个协同过滤推荐是如何做计算出来的呢?
前面之一章说到,人工智能实践过程三个步骤:数据,学习和决策。这里也将用同样的步骤,以图书销售推荐为例,解释物品协同过滤的过程。为了简单化,假设某图书销售平台总共有6本书销售,有6个用户购买。
(1)数据
用户的评分数据,分值1-5分。每个用户对图书的评分如下图矩阵所示。
(2)学习算法
前面说到ItemCF的定义是,相似的物品可能被同个用户喜欢。反过来讲,就是被同个用户喜欢的物品是相似商品。如上图中,图书1和图书2两本书,被用户A同时喜欢,这两本书具有相似性。而图书5和图书6,没有被同个用户同时喜欢,不具有相似性。
如果用余弦相似度计算图书1和图书2的相似度,也叫做cosine距离,计算过程为:
980-353=627大约便宜630无 京沪高速铁路由北京南站至上海虹桥站,全长1318千米,设24个车站,设计的最高速度为380千米/小时。目前,京沪高速铁路。 北京到上海百动车共8趟_列车时刻...
向着光亮那方(向着光亮那方经典语录) 近期,《所见微尘,皆因有光》一书由北京联合出版公司出版。本书精心遴选了梁衡、毕淑敏、刘醒龙等14位中国当百思特网代一线作家的散文作品。这些文章立意深刻,文笔流畅...
玖月奇迹离婚...
要说此刻加盟商选择哪个项目举办加盟创业较量好,那么我们必然要来看看第一张嘴零食加盟项目,第一张嘴零食加盟品牌创立多年,品牌形象早就已经深入人心,深受宽大消费者的喜爱与追捧,选择加盟的话,长短常不错的,...
怎么找韩国黑客相关问题 黑客kingQQ相关问题 快手上电脑输入什么字母像黑客一样 自学漫画教程书推荐(漫画自学入门教程)...
近日有一些小伙伴们资询我有关Word文本文档怎样转换成创作方式呢?下边就为大伙儿产生了Word文本文档转换成创作方式流程方式,有必须的小伙伴们能够来掌握掌握哦。 近日有一些小伙伴们资询我有...