① 已知某网站用户对电影评分数据(满分5分)。应用KNN算法预测哪位用户适合给小张推荐电影
已知某网站在部队电影评分数据免费五分。
② "电影推荐指数"中的指数是怎么算出来的
是根据推荐人数来算的!
推荐的人越多指数就越高!
比如10个人推荐那么指数就涨0.1!
和淘宝上面的指数是一样的!
指数是一个统称,和股票数学中的底数都没有关系!
③ 奈飞公司的创新的大数据推荐算法
第一个Netflix大奖成功的解决了一个巨大的挑战,为提供了50个以上评级的观众准确的预测他们的口味。下一个百万大奖目标是,为那些不经常做影片评级或者根本不做评级的顾客推荐影片,要求使用一些隐藏着观众口味的地理数据和行为数据来进行预测。同样,获胜者需要公开他们的算法。如果能解决这个问题,Netflix就能够很快开始向新客户推荐影片,而不需要等待客户提供大量的评级数据后才能做出推荐。
新的比赛用数据集有1亿条数据,包括评级数据,顾客年龄,性别,居住地区邮编,和以前观看过的影片。所有的数据都是匿名的,没有办法关联到netflix的任何一个顾客。
与第一个大奖赛不同,这次比赛没有设定比赛目标。50万美金首先奖励给6个月内取得领先的团队,另外50万美金奖励给18个月后取得领先的团队。
推荐引擎是Netflix公司的一个关键服务,1千多万顾客都能在一个个性化网页上对影片做出1-5的评级。Netflix将这些评级放在一个巨大的数据集里,该数据集容量超过了30亿条。Netflix使用推荐算法和软件来标识具有相似品味的观众对影片可能做出的评级。两年来,Netflix 已经使用参赛选手的方法提高了影片推荐的效率,这已经得到了很多影片评论家和用户的好评。
Strands推荐引擎的首席科学家里克·汉加特纳博士写道:“在短期内,搜索引擎将会越来越多地加入简单的推荐技术,以处理接近的查询词(例如,“您要找的是这个,根据类似查询/其他人的搜索,你可能要寻找的是这个。”)但从长期来说,而比起搜索行业和搜索技术,推荐技术会更加地无孔不入。”
④ 阅读、电影和音乐的推荐算法,哪一个更难做
“阅读、电影和音乐的推荐算法,哪一个更难做?为什么?”关于这一问题,小编从诸多网友的回复中为你筛选了最用心、最高赞的回答!快来看看吧~
来看看网名为“幸运的ZLT0502”的网友是怎么说的:
电影---音乐----阅读!从我的经验来看,阅读是最难做到的,其次是音乐,最简单的就是电影。当然,是在有很多数据的前提下。从几个领域的特点来看:1.电影的item数量相对较少,好的电影有很长的生命周期,加上电影社区的用户行为,视频网站或预订网站,都很好获得,所以特别适合合作过滤。即使这不是一部大热门电影,你也可以根据导演、类型、明星等制作内容。这些都是结构化的信息,所以没有难度。音乐的item比电影要多一些,生命周期也非常不同,但它也可以用于基于用户行为的协同过滤。该算法如何表达和更新用户的兴趣?如何根据兴趣标签计算推荐结果?至少我没有看到特别成功的推荐阅读应用程序。算法上,都各有难度,但阅读类的,由于分类太多,在算法上自然要更加复杂。
来看看网名为“派网友”的网友是怎么说的:
个人认为无论是基于用户行为(协同过滤),还是基于内容相似度的推荐算法,难度从高到底都依次是:音乐-阅读-电影。
对于ID为“楼船吹笛雨潇潇”网友的精彩回答,大家纷纷点赞支持,他是这么说的:
我觉得是各有所难,并不能说哪个难,哪个容易。推荐的成功率:公共决策对推荐的影响:判断价值的建议:三者各有难度,但是个人在长期的习惯中可以对其中一种或者多种情景中加以选择和实践,但这也不是一蹴而就的事情,慢慢来吧。
你赞同哪位网友的观点呢?
⑤ 据说Netflix 的影片推荐算法成功率很高,怎么实现的呢
私人频道算是有算法的使用吧,其他的公共频道应该没有,都是基于兴趣图谱的,也就是最先你要选择一些你的兴趣歌手,然后由这个基础开始近似
⑥ 阅读,电影和音乐的推荐算法,哪一个更难做为什么
都不难
⑦ IMDb 给出的电影评分的计算方法是怎样的
我不知道 imdb 的算法,但需要注意的一点是: (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 只是imdb 250的算法。
⑧ 学IT的,写了一个电影推荐系统,但是为什么评分预测值大于五
全文以“预测电影评分”例子展开
r(i,j)=0则表明user_j没有对movie_i 没有评分,
推荐系统要做的就是通过预测user_j对这些movie {i|r(i,j)=0}的评分来给user_j 推荐其可能会喜欢的电影<预测评分较高的movie>
=======================================二、基于内容的推荐=======================================
对每个movie_i引入特征x(i)=(x1, x2),这种特征可能表明user对movie类型的偏好:浪漫or动作等
对于每个user引入一个参数theta,然后对评分矩阵的每列(对应一个user)做线性回归,数据是{ (x(i), y(i,j)) |r(i,j)=1,for some j all i}
像机器学习一样,x(i)添加个1变量x(i)=(1, x1, x2)
那么对于未评分的movie_t,我们可以使用线性回归训练的参数theta与对应特征x(t)做内积来得到其预测评分
对每个用户都训练一个参数theta_j,优化模型如下:
优化算法:注意正则项是不约束x(i)=(1, x1, x2)中1对应的参数theta的第一项theta0,所以k=0与k=1,2分别对待
=======================================三、协同过滤=======================================
现在换个角度:如果知道theta for all user j,如何来预测x(i) = (x1, x2) all i
仍然可以使用线性回归,为训练每个x(i),需要评分矩阵的第i行数据{ (x(i), y(i,j)) |r(i,j)=1,for some i all j}
theta_j = (0, theta1, theta2) ;theta1=5说明user_j喜欢romance类movie, theta2=5说明user_j喜欢action类movie,只能有一个等于5哦,
我觉得也可以是:theta_j = (0, 4, 1) ;喜欢romance 4 action 1.
对应的优化:
协同过滤:交替优化theta与x
=========================================四、协同过滤算法=======================================
优化:
优化:注意去掉了theta和x的添加项
=========================================五、实现细节补充=======================================
实现细节:
如果有user没有对任何电影评分或者所有评分的电影都是0分,那么所学习到的参数是零向量,
则预测都是0值,这是不合理的。通过 将评分矩阵减去其行均值再进行线性回归来“避免”这种情况
=========================================六、一点思考==========================================
协同过滤那块,同时优化theta、x,这样得到的theta、x还有特定的意义<比如:x是否还表征对影视类型的喜爱与否>没有?
回归中,在x数据上不添加1-feature是不是因为后来引入的平均值化;如果不是,那会对结果有什么影响?
用x-feature来表征一个movie,x-feature的各分量的可解释性;应该会有一部分user应为演员的缘故有一些"偏爱"。
这里,讲的"基于内容的推荐"与"协同过滤"跟以前对这两个词的认识/所指内容不同,查清楚、搞明白。
这周还会再更一篇关于此节课的算法实现,会对上述部分问题做出回答。
⑨ 如何为豆瓣设计一种公平的电影评分算法
第五名:《无间道》9.0分
《无间道》整片叙述两位身份复杂的男人之间的故事,他们分别为黑帮和警界各自派到对方阵营的卧底。两人命运是如此相似,反应、机智也势均力敌、相差不远。就在如此诡谲多变的气氛下,彼此互相拿生命去作为赌注,誓死揪出对方,不是你死,就是我亡。片中两位影帝饰演的两位主角,各自在随时需要应变的环境与紧凑的剧情下,所展现出的机智,也是并驾齐驱、不分伯仲的。
陈凯歌说他的每一部电影里都会有一个他在精神上完全认同的人,在《霸王别姬》里,这个人就是程蝶衣,他是“疯子”一样的艺术家,一旦走下舞台,走进现实的人群,注定是孤独的,但也因为如此,他的诚实和天真,甚至是嫉妒和偏执都很美,很真实。
不疯魔不成活,程蝶衣是一个戏痴,戏迷,戏疯子,因为沉溺于自己所扮演的角色,他变成了真虞姬,而他的师哥段小楼,只不过是他以为的霸王,人物的悲剧性缘起一出霸王别姬,也缘灭于一出霸王别姬,真虞姬和假霸王,早已注定是一场苍凉的结局。