① 已知某網站用戶對電影評分數據(滿分5分)。應用KNN演算法預測哪位用戶適合給小張推薦電影
已知某網站在部隊電影評分數據免費五分。
② "電影推薦指數"中的指數是怎麼算出來的
是根據推薦人數來算的!
推薦的人越多指數就越高!
比如10個人推薦那麼指數就漲0.1!
和淘寶上面的指數是一樣的!
指數是一個統稱,和股票數學中的底數都沒有關系!
③ 奈飛公司的創新的大數據推薦演算法
第一個Netflix大獎成功的解決了一個巨大的挑戰,為提供了50個以上評級的觀眾准確的預測他們的口味。下一個百萬大獎目標是,為那些不經常做影片評級或者根本不做評級的顧客推薦影片,要求使用一些隱藏著觀眾口味的地理數據和行為數據來進行預測。同樣,獲勝者需要公開他們的演算法。如果能解決這個問題,Netflix就能夠很快開始向新客戶推薦影片,而不需要等待客戶提供大量的評級數據後才能做出推薦。
新的比賽用數據集有1億條數據,包括評級數據,顧客年齡,性別,居住地區郵編,和以前觀看過的影片。所有的數據都是匿名的,沒有辦法關聯到netflix的任何一個顧客。
與第一個大獎賽不同,這次比賽沒有設定比賽目標。50萬美金首先獎勵給6個月內取得領先的團隊,另外50萬美金獎勵給18個月後取得領先的團隊。
推薦引擎是Netflix公司的一個關鍵服務,1千多萬顧客都能在一個個性化網頁上對影片做出1-5的評級。Netflix將這些評級放在一個巨大的數據集里,該數據集容量超過了30億條。Netflix使用推薦演算法和軟體來標識具有相似品味的觀眾對影片可能做出的評級。兩年來,Netflix 已經使用參賽選手的方法提高了影片推薦的效率,這已經得到了很多影片評論家和用戶的好評。
Strands推薦引擎的首席科學家裡克·漢加特納博士寫道:「在短期內,搜索引擎將會越來越多地加入簡單的推薦技術,以處理接近的查詢詞(例如,「您要找的是這個,根據類似查詢/其他人的搜索,你可能要尋找的是這個。」)但從長期來說,而比起搜索行業和搜索技術,推薦技術會更加地無孔不入。」
④ 閱讀、電影和音樂的推薦演算法,哪一個更難做
「閱讀、電影和音樂的推薦演算法,哪一個更難做?為什麼?」關於這一問題,小編從諸多網友的回復中為你篩選了最用心、最高贊的回答!快來看看吧~
來看看網名為「幸運的ZLT0502」的網友是怎麼說的:
電影---音樂----閱讀!從我的經驗來看,閱讀是最難做到的,其次是音樂,最簡單的就是電影。當然,是在有很多數據的前提下。從幾個領域的特點來看:1.電影的item數量相對較少,好的電影有很長的生命周期,加上電影社區的用戶行為,視頻網站或預訂網站,都很好獲得,所以特別適合合作過濾。即使這不是一部大熱門電影,你也可以根據導演、類型、明星等製作內容。這些都是結構化的信息,所以沒有難度。音樂的item比電影要多一些,生命周期也非常不同,但它也可以用於基於用戶行為的協同過濾。該演算法如何表達和更新用戶的興趣?如何根據興趣標簽計算推薦結果?至少我沒有看到特別成功的推薦閱讀應用程序。演算法上,都各有難度,但閱讀類的,由於分類太多,在演算法上自然要更加復雜。
來看看網名為「派網友」的網友是怎麼說的:
個人認為無論是基於用戶行為(協同過濾),還是基於內容相似度的推薦演算法,難度從高到底都依次是:音樂-閱讀-電影。
對於ID為「樓船吹笛雨瀟瀟」網友的精彩回答,大家紛紛點贊支持,他是這么說的:
我覺得是各有所難,並不能說哪個難,哪個容易。推薦的成功率:公共決策對推薦的影響:判斷價值的建議:三者各有難度,但是個人在長期的習慣中可以對其中一種或者多種情景中加以選擇和實踐,但這也不是一蹴而就的事情,慢慢來吧。
你贊同哪位網友的觀點呢?
⑤ 據說Netflix 的影片推薦演算法成功率很高,怎麼實現的呢
私人頻道算是有演算法的使用吧,其他的公共頻道應該沒有,都是基於興趣圖譜的,也就是最先你要選擇一些你的興趣歌手,然後由這個基礎開始近似
⑥ 閱讀,電影和音樂的推薦演算法,哪一個更難做為什麼
都不難
⑦ IMDb 給出的電影評分的計算方法是怎樣的
我不知道 imdb 的演算法,但需要注意的一點是: (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C 只是imdb 250的演算法。
⑧ 學IT的,寫了一個電影推薦系統,但是為什麼評分預測值大於五
全文以「預測電影評分」例子展開
r(i,j)=0則表明user_j沒有對movie_i 沒有評分,
推薦系統要做的就是通過預測user_j對這些movie {i|r(i,j)=0}的評分來給user_j 推薦其可能會喜歡的電影<預測評分較高的movie>
=======================================二、基於內容的推薦=======================================
對每個movie_i引入特徵x(i)=(x1, x2),這種特徵可能表明user對movie類型的偏好:浪漫or動作等
對於每個user引入一個參數theta,然後對評分矩陣的每列(對應一個user)做線性回歸,數據是{ (x(i), y(i,j)) |r(i,j)=1,for some j all i}
像機器學習一樣,x(i)添加個1變數x(i)=(1, x1, x2)
那麼對於未評分的movie_t,我們可以使用線性回歸訓練的參數theta與對應特徵x(t)做內積來得到其預測評分
對每個用戶都訓練一個參數theta_j,優化模型如下:
優化演算法:注意正則項是不約束x(i)=(1, x1, x2)中1對應的參數theta的第一項theta0,所以k=0與k=1,2分別對待
=======================================三、協同過濾=======================================
現在換個角度:如果知道theta for all user j,如何來預測x(i) = (x1, x2) all i
仍然可以使用線性回歸,為訓練每個x(i),需要評分矩陣的第i行數據{ (x(i), y(i,j)) |r(i,j)=1,for some i all j}
theta_j = (0, theta1, theta2) ;theta1=5說明user_j喜歡romance類movie, theta2=5說明user_j喜歡action類movie,只能有一個等於5哦,
我覺得也可以是:theta_j = (0, 4, 1) ;喜歡romance 4 action 1.
對應的優化:
協同過濾:交替優化theta與x
=========================================四、協同過濾演算法=======================================
優化:
優化:注意去掉了theta和x的添加項
=========================================五、實現細節補充=======================================
實現細節:
如果有user沒有對任何電影評分或者所有評分的電影都是0分,那麼所學習到的參數是零向量,
則預測都是0值,這是不合理的。通過 將評分矩陣減去其行均值再進行線性回歸來「避免」這種情況
=========================================六、一點思考==========================================
協同過濾那塊,同時優化theta、x,這樣得到的theta、x還有特定的意義<比如:x是否還表徵對影視類型的喜愛與否>沒有?
回歸中,在x數據上不添加1-feature是不是因為後來引入的平均值化;如果不是,那會對結果有什麼影響?
用x-feature來表徵一個movie,x-feature的各分量的可解釋性;應該會有一部分user應為演員的緣故有一些"偏愛"。
這里,講的"基於內容的推薦"與"協同過濾"跟以前對這兩個詞的認識/所指內容不同,查清楚、搞明白。
這周還會再更一篇關於此節課的演算法實現,會對上述部分問題做出回答。
⑨ 如何為豆瓣設計一種公平的電影評分演算法
第五名:《無間道》9.0分
《無間道》整片敘述兩位身份復雜的男人之間的故事,他們分別為黑幫和警界各自派到對方陣營的卧底。兩人命運是如此相似,反應、機智也勢均力敵、相差不遠。就在如此詭譎多變的氣氛下,彼此互相拿生命去作為賭注,誓死揪出對方,不是你死,就是我亡。片中兩位影帝飾演的兩位主角,各自在隨時需要應變的環境與緊湊的劇情下,所展現出的機智,也是並駕齊驅、不分伯仲的。
陳凱歌說他的每一部電影里都會有一個他在精神上完全認同的人,在《霸王別姬》里,這個人就是程蝶衣,他是「瘋子」一樣的藝術家,一旦走下舞台,走進現實的人群,註定是孤獨的,但也因為如此,他的誠實和天真,甚至是嫉妒和偏執都很美,很真實。
不瘋魔不成活,程蝶衣是一個戲痴,戲迷,戲瘋子,因為沉溺於自己所扮演的角色,他變成了真虞姬,而他的師哥段小樓,只不過是他以為的霸王,人物的悲劇性緣起一出霸王別姬,也緣滅於一出霸王別姬,真虞姬和假霸王,早已註定是一場蒼涼的結局。