成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

大數據的分析結果一定對么?

云計算
美國哈佛大學教授、定量社會科學研究所主任——Gary King就曾因數據分析時斷章取義,得出了錯誤的結果。他發起了一個大數據分析項目,即通過檢測Twitter和其他社交媒體帖子中的“工作”、“失業”和“分類”等關鍵詞,來預測美國的失業率。

大數據不一定等同于好數據,而且越來越多的專家也堅信這一點,大數據并不會自動產生好的分析結果。如果數據不完整、斷章取義或者被破壞,可能會導致企業產生錯誤的決策,從而削弱企業的競爭力或影響用戶個人日常生活。

美國哈佛大學教授、定量社會科學研究所主任——Gary King就曾因數據分析時斷章取義,得出了錯誤的結果。他發起了一個大數據分析項目,即通過檢測Twitter和其他社交媒體帖子中的“工作”、“失業”和“分類”等關鍵詞,來預測美國的失業率。

通過使用情感分析的技術,該組織收集了包含這些關鍵字的tweet和其他社交媒體帖子,來查看這些帖子的增加或減少是否與每月失業率存在相關性。

在監測這些內容時,研究人員發現包含其中一個關鍵字(“工作”)的帖子數量急劇增加,但隨后,他們發現這與失業率毫無關系,因為他們忽略了喬布斯(喬布斯的名字Jobs也有“工作”的意思)去世的消息。我們應從這個例子中吸取教訓,不要完全依靠“神奇”的大數據來指導決策。

King表示,“jobs”的雙重含義只是諸多類似事件之一,在這一領域工作的人都遇到過類似的經歷。他說:“這些關鍵字列表在短期內可能可行,但從長遠來看,往往會帶來災難性的失敗。你可以通過添加額外的關鍵字來解決問題,但這需要大量的人力參與。”

你可以輸入關鍵些到Bing Social頁面,便會看到一些相關或者無關的東西。如果你不更改查詢,隨著時間的推移,你會發現含有這些關鍵詞的話題正以某種方式逐漸偏離主題,有時候偏離比較小,有時候卻很大。”

但King表示,總體而言,很多大數據分析都產生了有用的內容。Vantiv公司***安全官兼高級副總裁Kim Jones表示,這不是一個新問題,但如果人們認為大量數據能夠奇跡般地產生良好的分析結果,這個問題可能會變嚴重。他指出:“Jobs的例子是一個經典的案例,數據本身并不等同于智慧。”

King認為內容是關鍵。他是大數據分析公司Crimson Hexagon***科學家兼聯合創始人,用該公司市場營銷執行副總裁Wayne St. Amand的話來說,該公司旨在為在線對話提供“內容、意義和結構”。

然而,越來越多沒有內容的數據在推動決策過程。華爾街日報2月份曾報道,醫療保險公司使用大數據來為其用戶創建個人資料文件。該公司追蹤的信息之一是購買加大號衣服的歷史記錄,這可能會導致將轉診轉為減肥的計劃。

沒有人會覺得鼓勵人們更健康地生活是錯誤的事情,但是這方面涉及的隱私問題卻令人不安。這個人購買加大號衣服可能是送給另一位家庭成員。而且這種隱私問題可能帶來更嚴重的影響。《彭博商業周刊》在2008年曾報道過有人因購買處方藥的歷史記錄,而被保險公司拒絕為其上醫療保險,而這個人買藥的歷史記錄暴露這個人有輕微的心理健康問題。

Adam Frank在博客中指出,在某些情況下,銀行會因為用戶在社交網站LinkedIn或者Facebook上的聯系人的情況而拒絕用戶的貸款。如果你的朋友賴賬,你的信譽可能也會受到他們的信譽的影響。ACLU高級政策分析師Jay Stanley指出,“信用卡公司有時會因為其他消費者的信貸歷史記錄而降低消費者的限額。”

Kim Jones表示,從相關性得出結論,而不進行進一步分析,這給他本人也帶來過麻煩。“在80年代后期和90年代初期,有數據顯示,駕駛入門級豪華車,且年齡在20和27歲之間的西班牙裔和黑人男性最有可能是毒販。而我正好符合這個標準,我是非裔美國人,年齡也在這個范圍內,當時我開的正式這樣的車,但我并不是毒販。”

他表示,“我們不能只是依靠數據分析,那樣可能會導致一些壞的結果。如果你忽略人類的分析因素,那么你的錯誤率將會非常高。”

簡言之,大數據是一個工具,但不應該被視為解決方案。“它可以幫助你縮小范圍,從數百萬可能縮小到150左右,”Jones表示,“但是我們不能讓計算機做一切判斷,因為這最終可能會給你帶來麻煩。”

責任編輯:王程程 來源: ZDNetserver頻道
相關推薦

2015-03-30 10:48:17

大數據大數據處理Hadoop

2019-12-11 14:32:49

分布式大數據系統

2017-01-19 17:57:47

大數據

2013-03-18 09:16:04

IDC大數據網絡技術

2021-10-23 06:44:02

性能分析Profiler復雜度分析

2020-08-18 11:21:28

數據挖掘機器學習算法

2021-02-02 11:13:41

BigDecimal支付電商

2015-08-21 09:18:17

大數據技術解決問題

2016-11-16 14:55:09

大數據數據分析

2020-08-30 14:31:40

Python編程語言開發

2021-02-26 09:04:22

數組ArrayListHashMap

2023-10-27 08:46:30

逃逸微博線程

2015-06-17 11:18:01

WiFi

2018-01-18 22:09:06

數據分析數據處理企業

2014-08-08 09:41:15

大數據

2022-12-08 10:15:38

大數據醫療保健

2016-03-04 10:51:51

數據可視化數據抓取

2021-06-15 23:04:17

Localhost域名網絡

2020-05-15 09:49:16

大數據分析供應鏈大數據

2021-03-29 22:58:34

大數據Java編程語言
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品国产乱码久久久久久中文 | 日韩精品视频在线 | 91资源在线 | 久久一级 | 亚洲日产精品 | 欧美日韩在线视频一区 | 99爱在线 | 免费精品一区 | 国产中文区二幕区2012 | 精品视频一区二区三区在线观看 | 欧美亚洲激情 | 99久久婷婷国产综合精品电影 | 免费一区二区三区 | 不卡一区 | 天天插天天射天天干 | 精品国产一区二区三区在线观看 | 精品久久久久久久久久久久 | 国产乱码精品1区2区3区 | 久久亚洲一区二区 | 在线三级网址 | 亚洲美女天堂网 | 日韩精品四区 | 国产亚洲欧美在线 | 操人网| 亚洲精品日韩综合观看成人91 | 精品日韩一区二区 | 国产精品视频网 | av在线播放免费 | 91成人影院| 日本免费黄色一级片 | 欧美一区二区三区在线播放 | 亚洲欧美日韩一区二区 | 一区二区在线观看av | 99久久精品免费看国产高清 | 成人av一区 | 91av视频在线播放 | 精品国产一区二区久久 | 欧美精品一区二区三区在线播放 | 国产99久久精品一区二区永久免费 | 久久精品久久久 | 久久99国产精一区二区三区 |