協同過濾怎樣評分_協同過濾的演算法細分

① 協同過濾推薦怎麼處理原始數據集

以對原始的評分數據集進行變換,用評分值相對於平均評分值的偏差取代原始值,如...基於物品過濾的數據預處理 Amazon.com採用物品間

② Item-based協同過濾的演算法的問題高手請進，相似度的計算問題

時間過了很久了，希望你的問題得到答案了
雖然沒能幫到你，但是朋友，還是祝你好運了！

③ 學IT的，寫了一個電影推薦系統，但是為什麼評分預測值大於五

全文以「預測電影評分」例子展開

r(i,j)=0則表明user_j沒有對movie_i 沒有評分，

推薦系統要做的就是通過預測user_j對這些movie {i|r(i,j)=0}的評分來給user_j 推薦其可能會喜歡的電影<預測評分較高的movie>

=======================================二、基於內容的推薦=======================================

對每個movie_i引入特徵x(i)=(x1, x2)，這種特徵可能表明user對movie類型的偏好：浪漫or動作等

對於每個user引入一個參數theta，然後對評分矩陣的每列(對應一個user)做線性回歸，數據是{ (x(i), y(i,j)) |r(i,j)=1，for some j all i}

像機器學習一樣，x(i)添加個1變數x(i)=(1, x1, x2)

那麼對於未評分的movie_t，我們可以使用線性回歸訓練的參數theta與對應特徵x(t)做內積來得到其預測評分

對每個用戶都訓練一個參數theta_j，優化模型如下：

優化演算法：注意正則項是不約束x(i)=(1, x1, x2)中1對應的參數theta的第一項theta0，所以k=0與k=1,2分別對待

=======================================三、協同過濾=======================================

現在換個角度：如果知道theta for all user j，如何來預測x(i) = (x1, x2) all i

仍然可以使用線性回歸，為訓練每個x(i)，需要評分矩陣的第i行數據{ (x(i), y(i,j)) |r(i,j)=1，for some i all j}

theta_j = (0, theta1, theta2) ；theta1=5說明user_j喜歡romance類movie， theta2=5說明user_j喜歡action類movie，只能有一個等於5哦，

我覺得也可以是：theta_j = (0, 4, 1) ；喜歡romance 4 action 1.

對應的優化：

協同過濾：交替優化theta與x

=========================================四、協同過濾演算法=======================================

優化：

優化：注意去掉了theta和x的添加項

=========================================五、實現細節補充=======================================

實現細節：

如果有user沒有對任何電影評分或者所有評分的電影都是0分，那麼所學習到的參數是零向量，

則預測都是0值，這是不合理的。通過將評分矩陣減去其行均值再進行線性回歸來「避免」這種情況

=========================================六、一點思考==========================================

協同過濾那塊，同時優化theta、x，這樣得到的theta、x還有特定的意義<比如：x是否還表徵對影視類型的喜愛與否>沒有？

回歸中，在x數據上不添加1-feature是不是因為後來引入的平均值化；如果不是，那會對結果有什麼影響？

用x-feature來表徵一個movie，x-feature的各分量的可解釋性；應該會有一部分user應為演員的緣故有一些"偏愛"。

這里，講的"基於內容的推薦"與"協同過濾"跟以前對這兩個詞的認識/所指內容不同，查清楚、搞明白。

這周還會再更一篇關於此節課的演算法實現，會對上述部分問題做出回答。

④ 基於用戶的的協同過濾演算法怎樣算準確率

協同過濾(Collaborative Filtering)的基本概念就是把這種推薦方式變成自動化的流程

協同過濾主要是以屬性或內興趣相近的用戶經驗容與建議作為提供個性化推薦的基礎。透過協同過濾，有助於搜集具有類似偏好或屬性的用戶，並將其意見提供給同一集群中的用戶作為參考，以滿足人們通常在決策之前參考他人意見的心態。

本人認為，協同過濾技術應包括如下幾方面:(1)一種比對和搜集每個用戶興趣偏好的過程;(2)它需要許多用戶的信息去預測個人的興趣偏好;(3)通過對用戶之間興趣偏好相關程度的統計去發展建議那些有相同興趣偏好的用戶。

⑤ python有實現協同過濾的庫嗎

本文主要抄內容為基於用戶偏好的相似性進行物品推薦，使用的數據集為 GroupLens Research 採集的一組從 20 世紀 90 年代末到 21 世紀初由 MovieLens 用戶提供的電影評分數據。數據中包含了約 6000 名用戶對約 4000 部電影的 100萬條評分，五分制。數據包可以從網上下載到，裡麵包含了三個數據表——users、movies、ratings。因為本文的主題是基於用戶偏好的，所以只使用 ratings 這一個文件。另兩個文件里分別包含用戶和電影的元信息。

⑥ 個性化推薦演算法——協同過濾

有三種：協同過濾
用戶歷史行為
物品相似矩陣

⑦ 協同過濾的演算法細分

這是最早應用協同過濾系統的設計，主要是解決Xerox公司在 Alto的研究中心資訊過載的問題。這個研究中心的員工每天會收到非常多的電子郵件卻無從篩選分類，於是研究中心便發展這項實驗性的郵件系統來幫助員工解決這項問題。其運作機制大致如下：
個人決定自己的感興趣的郵件類型；個人旋即隨機發出一項資訊需求，可預測的結果是會收到非常多相關的文件；從這些文件中個人選出至少三筆資料是其認為有用、會想要看的；系統便將之記錄起來成為個人郵件系統內的過濾器，從此以後經過過濾的文件會最先送達信箱；以上是協同過濾最早的應用，接下來的里程碑為GroupLens。這個系統主要是應用在新聞的篩選上，幫助新聞的閱聽者過濾其感興趣的新聞內容，閱聽者看過內容後給一個評比的分數，系統會將分數記錄起來以備未來參考之用，假設前提是閱聽者以前感興趣的東西在未來也會有興趣閱聽，若閱聽者不願揭露自己的身分也可以匿名進行評分。和Tapestry不同之處有兩點，首先，Tapestry專指一個點（如一個網站內、一個系統內）的過濾機制；GroupLens則是跨點跨系統的新聞過濾機制。再來，Tapestry不會將同一筆資料的評比總和起來；GroupLens會將同一筆資料從不同使用者得到的評比加總。
GroupLens具有以下特點：開放性：所有的新聞閱聽者皆可使用，雖然系統委託Better Bit Bureau設計給分的系統，但若有不同的評分機制也適用於GroupLens。方便性：給分並不是一件困難的事情且溝通上非常方便，評分結果容易詮釋。規模性：有可能發展成大規模的系統，一旦發展成大規模，儲存空間與計算成本問題顯得相當棘手。隱密性：如果使用者不想讓別人知道他是誰，別人就不會知道。由此可以看出，現今網路各個推薦系統的雛形已然形成，在GroupLens之後還有性質相近的MovieLens，電影推薦系統；Ringo，音樂推薦系統；Video Recommender，影音推薦系統；以及Jster，笑話推薦系統等等。乃至於今日的YouTube、aNobii皆是相似性值得網路推薦平台，較不同的是經過時間推移，網路越來越發達，使用者越來越多，系統也發展得越來越嚴密。最著名的電子商務推薦系統應屬亞馬遜網路書店，顧客選擇一本自己感興趣的書籍，馬上會在底下看到一行「Customer Who Bought This Item Also Bought」，亞馬遜是在「對同樣一本書有興趣的讀者們興趣在某種程度上相近」的假設前提下提供這樣的推薦，此舉也成為亞馬遜網路書店為人所津津樂道的一項服務，各網路書店也跟進做這樣的推薦服務如台灣的博客來網路書店。另外一個著名的例子是Facebook的廣告，系統根據個人資料、周遭朋友感興趣的廣告等等對個人提供廣告推銷，也是一項協同過濾重要的里程碑，和前二者Tapestry、GroupLens不同的是在這里雖然商業氣息濃厚同時還是帶給使用者很大的方便。以上為三項協同過濾發展上重要的里程碑，從早期單一系統內的郵件、文件過濾，到跨系統的新聞、電影、音樂過濾，乃至於今日橫行互聯網的電子商務，雖然目的不太相同，但帶給使用者的方便是大家都不能否定的。

⑧ 推薦演算法的基於協同過濾的推薦

基於協同過濾的推薦演算法理論上可以推薦世界上的任何一種東西。圖片、音樂、樣樣可以。協同過濾演算法主要是通過對未評分項進行評分預測來實現的。不同的協同過濾之間也有很大的不同。
基於用戶的協同過濾演算法: 基於一個這樣的假設「跟你喜好相似的人喜歡的東西你也很有可能喜歡。」所以基於用戶的協同過濾主要的任務就是找出用戶的最近鄰居，從而根據最近鄰居的喜好做出未知項的評分預測。這種演算法主要分為3個步驟：
一，用戶評分。可以分為顯性評分和隱形評分兩種。顯性評分就是直接給項目評分（例如給網路里的用戶評分），隱形評分就是通過評價或是購買的行為給項目評分（例如在有啊購買了什麼東西）。
二，尋找最近鄰居。這一步就是尋找與你距離最近的用戶，測算距離一般採用以下三種演算法：1.皮爾森相關系數。2.餘弦相似性。3調整餘弦相似性。調整餘弦相似性似乎效果會好一些。
三，推薦。產生了最近鄰居集合後，就根據這個集合對未知項進行評分預測。把評分最高的N個項推薦給用戶。這種演算法存在性能上的瓶頸，當用戶數越來越多的時候，尋找最近鄰居的復雜度也會大幅度的增長。
因而這種演算法無法滿足及時推薦的要求。基於項的協同過濾解決了這個問題。基於項的協同過濾演算法根基於用戶的演算法相似，只不過第二步改為計算項之間的相似度。由於項之間的相似度比較穩定可以在線下進行，所以解決了基於用戶的協同過濾演算法存在的性能瓶頸。

⑨ 如何用R實現協同過濾的MapRece演算法

基於協同過濾的推薦演算法理論上可以推薦世界上的任何一種東西。圖片、音樂、樣樣可以。協同過濾演算法主要是通過對未評分項進行評分預測來實現的

導航:首頁 > 凈水問答 > 協同過濾怎樣評分

協同過濾怎樣評分

與協同過濾怎樣評分相關的資料