數字文件有泄露個人隱私的風險——劍橋大學
近日,發布在期刊《美國國家科學院院刊》上的一篇新研究報告指出,現在Facebook用戶默認可以通過在Facebook上的喜好信息公開地分析出他們種族、年齡、IQ、性別、性格、物質條件和政治觀點等信息,并且分析結果驚人的準確。
在報告中,研究者將Facebook喜歡比作數字文件的“一般性分級”——就像網絡搜索關鍵詞和瀏覽歷史一樣——并指出這一技術能夠提取出任何一個會定期上網的用戶的關鍵信息。
劍橋心理測驗學中心的研究者在與英國微軟劍橋研究院的合作中分析了58000以上美國Facebook用戶通過“我的特性”應用自愿提交的資料組,資料組中包括他們的喜好、人口結構檔案和心理測試結果。
用戶們自主選擇提供自己的信息,這些信息將作為分析的基礎被記錄下來。Facebook喜好會和個人檔案中的信息和心理測試的結果合起來分析。
專家們建立了可以單獨憑借Facebook喜歡來預測個人信息的計算模型。這些模型的計算結果正確推斷出了88%受訪用戶的性別,而從用戶中區分美國黑人和美國白人的準確率高達95%,同時85%的用戶被準確的推斷出了是民主黨還是共和黨。82%的受訪用戶也被正確的區別出了是穆斯林還是基督教徒。受訪用戶的婚姻狀況和藥物濫用的推測也達到了65%-73%準確性。
但是也只有部分用戶明確地選擇出它們的“喜歡”。比如說,只有大概5%的同性戀用戶勾選了像是同性婚姻之類的明確表示其性向的“喜歡”。準確的預測依賴于對大量像是音樂和電視劇之類雖然沒那么有用卻很流行的喜歡的“推斷”,通過它們可以得出比較準確的個人信息。
研究者表示,哪怕是那些看起來不公的個人信息,比如說用戶的父母是否在他們21歲之前離婚之類的細節,推斷也能夠有60%的準確率——這足夠吸引廣告商了。
但是,研究者們在強調這些預測模型有潛力促進個性化市場的發展并進而提高線上服務質量的同時,也指出了這些模型存在侵犯用戶個人隱私的風險。他們提出,很多線上用戶會覺得這種程度的數字信息揭露已經超過可以接受的范疇了——要知道,公司、政府甚至是個人都可以用這些預測軟件來準確的從他們的Facebook喜歡和一些其他的數據的蛛絲馬跡來準確的推測他們的私密信息。
研究者們也測試了包括智力、情緒穩定性、開放性和外向型等方面在內的個人特質。雖然這些潛在的特質是很難測量的,測試結果的準確度卻十分驚人。
關于開放性特質的研究——區分不喜歡變化的人和熱衷變化的人的范圍——證實了對于Facebook的喜歡的觀察結果幾乎和個人的實際個人特質測試結果一樣準確的事實。
有些喜歡和一些個人特質有很強但是看起來八竿子達不到一塊兒的聯系,比如炸薯圈和高智商的聯系,或說那只蜘蛛比你還害怕(?)和不抽煙的人聯系。
總的來說,研究者們認為由Facebook喜歡分析出來的千變萬化的個人特質是足以做出準確的個人性格的評估的,而且這種評估模式放之四海皆準。
他們同時認為,這項研究可能喻示著心理測量學的一場革命——這種測量可以脫離昂貴的測量中心和調查表的使用,并能達到前所未有的覆蓋范圍。
“我們堅信,這項基于Facebook喜歡的研究結果,對廣范圍的在線行為都是有益的。”心理中心運營總監Michal Kosinski表示。他和他的劍橋同事David Stillwill和來自微軟研究中心的Thore Graepel發起了這項研究。
“通過這種有高度準確性的第二推斷,所有形式的數碼文件都可以得出類似的預測,而這可能推測出用戶不愿意公開的敏感信息。人們留下的數碼信息實在是太繁雜了,很難去一一控制這個推測的程度。”
“我是所有新出現的科技產品的狂熱愛好者,包括Facebok。我非常喜歡自動的書籍推薦和Facebook自動篩選我可能感興趣的話題的功能。”Kosinski說道,“然而,我同樣可以想象一樣的數據和技術會被用來推測我的政治立場和性取向,以及其對我的自由甚至生命可能造成的威脅。”
“光是這種泄露信息的事發生的可能性就足以打消人們使用數碼技術的念頭了,甚至可能降低個人和群體之間的信任感——這顯然阻礙了科技和經濟的進步。必須提供給用戶們自主控制他們的信息透明度的方法。”
微軟研究中心的Thore Graepel表示他希望這項研究將會有益于正在進行的關于用戶個人隱私的討論:“消費者們期望他們使用的產品和服務能夠保證他們的個人隱私,這并不過分,而這項研究可以提醒用戶們要注意他們在網上所公開的信息,充分控制個人隱私并且永不與不熟悉的人分享信息。”
劍橋大學的David Stillwell補充道:“我自從2005年起就開始使用Facebook了,并且我會繼續使用的。但是也許我會在使用Facebook提供的個人隱私設置時更小心一點了。”