Re: [請益] Facebook 的朋友建議機制是怎麼回事?

看板ask-why (知識奧秘)作者 (人)時間16年前 (2009/09/22 01:10), 編輯推噓4(405)
留言9則, 4人參與, 最新討論串2/4 (看更多)
我簡單說一下~~如果有錯誤 煩請指正 因為我有在寫facebook app 所以對於它的好友trace方式大概有了解 你提到的三點基礎線索(同一個 network 學校 共同的朋友) 的確是facebook的優先考量 但facebook有一種特殊的演算機制 這可能要拓樸學領域的會比較了解 據說街上每隨機抽取50個人 其中至少有兩個人是同一天生日 這是建構在機率系統上的假說 同樣的 在網絡的平面概念中一樣適用 只是把一維的機率 延伸到平面而已 用通俗一點的解釋如下:(假設你是A) 第0層 A | 第1層 B---C---D---E BCDE是在"基礎線索"上與你有關的好友 於是BCDE出現在好友的建議名單中 這時候你會加入他們的機率幾乎是99% 於是進入第二層 第0層 A | 第1層 B---C---D---E | | | | 第2層 F-G H-I J-K L-M FGHIJKLM是在拓墣觀念上與你有關聯的好友 這時你可能只加入G.J或M 加入機率可能可能只有37.5% 此時演算法會去檢討0-1與1-2的路徑 然後重新調整方向 提升你的加入機率 (為方便說明 舉極端的例子) 簡單來說 在第2層中FGHIJKLM GJM是你的高中同學的同學 FHIKL是你的高中同學的家人 演算法發現你加入GJM的機率為100% 而FHIKL為0% 因此"同學的同學"這項關聯就會成為未來第3層建議名單的原則 而"同學的家人"這項關聯就會被捨棄 理想上 之後你的建議名單都是"同學的同學的同學...無限延伸" 而你的加入率也會接近100% 第0層 A | 第1層 B---C---D---E | | | | 第2層 F-G H-I J-K L-M | | | 第3層 N O P ....... 以上~你會發現 facebook給你建議的名單好像神一樣!! 準到一整個不行 看到這別先END 如果只有這樣 facebook也沒比無名高明多少 facebook的野心還不只這樣 就如同有案例發現 有的人之間的關聯完全消失在網路上 facebook一樣神的出來 有時候讓表特版的鄉民也自嘆弗如 這就要牽扯到平面機率(或網狀機率) 以及部分的心理學 FB演算法由兩部分組成 一部分是先前提到的"基礎線索" 另一部分是針對前一部分的盲點所設計的"機率線索" 一開始我們有提到"每隨機50人中至少有兩人生日相同" 我們先假設50人的生日完全不同 機率P=(365/365)*(364/365)*(363/365)......*(316/365) =0.0296 也就是說 假設"生日"是人與人之間的"關聯條件" 那麼我隨便找50人 這50人完全沒關聯的機率小於3% 因此facebook只要隨便把沒關係的50人的湊一推 會有97%的機率其中"至少"有兩人看對眼爆出愛的火花 有這樣的基礎 就可以產生很多玩法 例如以"學校"作為人與人之間的關聯條件 假設全台灣一共有160所大學 (基數) 那麼50人(庫數)無關聯的機率P=(160/160)*(159/160).....*(111/160) =0.000185 天哪 0.0185耶~ 隨便都中 同學會到處開!! 人與人之間認識的可能性 當然不只是表面上的關聯表徵 可能是機率表徵 (你無法預測機天可能會在路上遇到誰 然後和誰成為朋友) 使用機率表徵的計算原則相同 公式化後如下: 關聯A 基數=a 庫數=a' 關聯A完全沒命中機率P(a)=a!/{[a^(a')]*[(a-a')!]} 把所有關聯集合起來 P=P(a)*P(b)...... P會趨近於零 假設FB很衰小 取樣這50個人在任何關係上通通不認識沒關聯 "機率趨近於零"!!!!!!!!!!!!!!!!! (尤其是考慮越多關聯) 因此 咱們的facebook又再度神奇的從陌生人猜出你可能認識誰!! 這樣還不夠嚴謹 facebook還有一招 根據社會網絡心理學 認識的人其中必定有某種層度的關聯 可能是興趣.居住地.語言.喜愛的食物.善長的技能等等... 如果今天有兩個認識的人之間完全查不到任何表面關聯 那麼那麼它一定落入"完全沒關聯區" 恩...什麼跟什麼 一定有人會聽不懂 那用下圖來說明好了 (下面的數線代表與你有相關的線索數目) 高度相關 輕度相關 完全無相關 <------------------------------------------> 你認識的人 你不認識的人 你可能認識的人 如果畫成座標圖如下: 你 |* 可 |* 能 | * 認 | * A B 識 | * 的 | * * 人 | * * 數 | * * |_______*******________ 與你相關的線索數目 一般A的狀況很能理解 與你共通線索特徵越多的人 你越可能認識他 但是大家往往忽略B的區段 這有點像"反常態曲線" 有部分你認識的人會落在幾乎與你沒相關的區域 雖然曲率沒有A的高 但很明顯的可以看出 所謂的半生不熟的關係 卻是人們最不可能認識的陌生人 所以 facebook只要把與你"最不相關"與"最相關"的人丟到你的建議名單 你就會有一長串 看似神奇的建議名單嚕!! 當然心理學上來說 facebook給你50人 你有49人不認識 但有1人你認識 你的注意會在那一人上 並且直呼好神奇 而"猜錯的49人"會被你忽略或是遺忘!! 說了這麼多 麼複雜的演算在程式撰寫上來說卻不是很難 配合資料庫與資料定義演算 就可以在很短的時間算出建議名單了 facebook應該不會無聊到去偷窺大家的信箱啦 雖然技術上是辦的到 但完全沒C/P值!? 除非是你主動匯入名單~ 以上 因為我不太會畫BBS圖 若難以理解敬請見諒!!^^ ※ 引述《Equalmusic (Cosmajoonitist)》之銘言: : 我知道他會建議 : 1. 同一個 network 的人 : 2. 同一所學校的人 : 3. 如果你們有共同朋友 : 但是有的時候他會出現我認識的人, 但是我跟她在 facebook 上根本沒有共同朋友的情況 : 不是同一個 netowrk, 也沒有去過同一所學校 : (另外就即使是同一個 network 或是去過同一個學校, network 那麼大, 學校那麼大 : 他卻知道要建議誰, 這也還蠻神奇的...) : 我想過一個狀況就是這個人先在 Facebook 上搜尋我, 查看我的資料 : 但後來我稍微 google 了一下發現了這個討論串 : http://www.topix.com/forum/com/facebook/TIM2PL2T0O5BQJO1C : 裡面有人舉了一個例子排除了這個可能性 : 1. 他們八年沒聯絡, 所以這個人主動查詢他的可能性不高 : 2. 就算他真的搜尋他的資料, 他的名字是菜市場名, FB 上有千百個跟他同名的 : 3. 如果他用的是他的 email, 他的 email 早就換了 : 我沒有看完整個討論串, 一來實在文章太多, 二來文章的相似性太高 : 特別很多人提出提出 FB 會 tap into 你的 email contact list, yahoo 或 MSN 帳號 : 我覺得是 nonsense : 雖然我對網路安全不是特別了解, 不過 FB 只是一堆 web applets : 不可能跑到我的電腦裡來碰我的資料(如果是這樣那瀏覽器的安全性也太低了吧) : 另外有些人也不在我的 AIM, GTalk 或是 MSN 裡面 : 但是 FB 還是很盡職的把他們都找出來了 ~_~ : 想請教一下有沒有板友對 Facebook 這種查找機制有研究的 : 好想知道阿! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 60.248.76.222

09/22 01:19, , 1F
為什麼玩全無相關那邊反而認識人數可能會上升?
09/22 01:19, 1F

09/22 01:19, , 2F
可以加以說明阿 不太懂為什麼那樣反而可能會認識?
09/22 01:19, 2F

09/22 01:20, , 3F
09/22 01:20, 3F

09/22 01:35, , 4F
可能你走在路上突然結識一位陌生人,之後關係很好,但是好友圈
09/22 01:35, 4F

09/22 01:35, , 5F
完全不同。
09/22 01:35, 5F

09/22 01:54, , 6F
如果這篇當廣告是很好,不然的話,說好就好,說歹就歹囉~
09/22 01:54, 6F

09/22 01:55, , 7F
任50人生日不重覆機率小於3%,也就是有關聯是 97%,很驚人
09/22 01:55, 7F

09/22 01:56, , 8F
但如果要說歹的話..大多和我無關,也許是某兩個陌生人有關
09/22 01:56, 8F

09/22 21:20, , 9F
推解析 真棒
09/22 21:20, 9F
文章代碼(AID): #1AjxDokc (ask-why)
文章代碼(AID): #1AjxDokc (ask-why)