成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數據分析入門必知:機器學習最通俗的解釋?

大數據 數據分析
有人經常會把數據分析與機器學習給搞混掉,機器學習這個主題已經很普遍了,每個人都在談論它,但很少有人能夠透徹地了解它,今天老李給大家分享一下機器學習的概念。

 有人經常會把數據分析與機器學習給搞混掉,機器學習這個主題已經很普遍了,每個人都在談論它,但很少有人能夠透徹地了解它,今天老李給大家分享一下機器學習的概念。

數據分析和機器學習

如果你認為大數據僅僅是關于SQL語句查詢和海量的數據的話,那么別人也會理解你的,但是大數據真正的目的是通過對數據的推斷,從數據中獲取價值、從數據中發現有用的東西。例如,“如果我降低5%的價格,我將增加10%的銷售量。”

數據分析是最重要的技術,包括如下方面:

  • 描述性分析:確定所發生的事情。這通常涉及到描述發生了什么現象的報告。例如,用這個月的銷售額與去年同期進行比較的結果。
  • 特征性分析:解釋現象發生的原因,這通常涉及使用帶有OLAP技術的控制臺用以分析和研究數據,根據數據挖掘技術來找到數據之間的相關性。
  • 預測性分析:評估可能發生的事情的概率。這可能是預測性分析被用來根據你的工作性質、個人興趣愛好,認為你是一個潛在的讀者,以便能夠鏈接到其他的人。

機器學習適合于預測性分析。

一個例子說明什么是機器學習

機器學習是指利用計算機模擬或實現人類的學習行為。那機器是怎么學習的呢?我們就舉個相親的例子?,F有一妙齡女郎相親,候選人有青年 A、B、C 和 D,四個青年的屬性分別為:

  • A:『高,帥,富』
  • B:『高,帥,窮』
  • C:『高,丑,富』
  • D:『矮,丑,富』

經過一番篩選,女子將 [A C D] 分為適合婚戀組,將 [B] 劃分為不適合婚戀組。上述就是人類的學習過程。

由于相親對象實在過多,妙齡女郎相不過來了,于是她找來機器幫忙。首先,她要培訓下機器,告訴機器如下信息:

  • A:屬性『高,帥,富』— 標簽 『適合婚戀組』
  • B:屬性『高,帥,窮』— 標簽 『不適合婚戀組』
  • C:屬性『高,丑,富』— 標簽 『適合婚戀組』
  • D:屬性『矮,丑,富』— 標簽 『適合婚戀組』

機器一番學習,建立起了「屬性」和「標簽」的對應關系,這就是機器學習建模過程?,F在有青年 E、F、G …… 的屬性值,妙齡少女把這堆屬性值告訴機器,機器返回哪些是可以繼續發展的對象,哪些是淘汰的對象。

這就是 有監督機器學習 ,即告訴機器訓練數據的「屬性」和「標簽」,機器利用某種算法建立「屬性」和「標簽」的關系,利用該關系,就可以根據新數據的「屬性」得到新數據的「標簽」,如下圖。

機器學習如何工作?

垃圾郵件過濾是一個很好的例子,它利用機器學習技術來學習如何從數百萬封郵件中識別垃圾郵件,其中就用到了統計學技術。

例如,如果每100個電子郵件中的85個,其中包括“便宜”和“偉哥”這兩個詞的郵件被認為是垃圾郵件,我們可以說有85%的概率,確定它是垃圾郵件。并通過其它幾個指標(例如,從來沒給你發送過郵件的人)結合起來,利用數十億個電子郵件進行算法測試,隨著訓練次數不斷增加來提升準確率。

事實上,谷歌表示它現在已經可以攔截99.99%左右的垃圾郵件。

機器學習的算法有哪些

我制作了一份機器學習算法選擇速查表:

這張速查表能幫你從眾多機器學習算法中,針對你自己的具體問題和情況,選出最合適的算法。下面就介紹如何使用這份速查表。

因為是面向初學者,所以在談到算法時,會盡量做一些最簡單的假設。下文談及的算法也都是眾多數據科學家、機器學習專家和開發者們推薦的結果。

怎樣使用速查表

按照“如果(路徑標簽)就用(算法)”的邏輯,查看速查表上的路徑和算法標簽。例如:

  • 如果你想降維,就用主成分分析。
  • 如果你需要迅速得到數值預測,就用決策樹和邏輯回歸。
  • 如果你需要層次結果,就用層次聚類。

有時我們可能需要不止一個算法,有時可能這些算法沒有一個是最合適的。我和許多數據科學家聊過,他們認為這種情況下,最保險的做法就是把所有算法都嘗試一遍,找到最合適的那個。

責任編輯:梁菲 來源: 數據分析不是個事兒
相關推薦

2021-06-09 11:06:00

數據分析Excel

2024-01-09 13:58:22

PandasPython數據分析

2019-11-06 10:56:59

Python數據分析TGI

2013-01-09 09:57:34

大數據分析大數據Actuate

2018-03-28 14:33:33

數據分析師工具Spark

2023-11-15 18:03:11

Python數據分析基本工具

2022-08-26 14:46:31

機器學習算法線性回歸

2018-05-04 08:20:39

機器學習深度學習人工智能

2021-01-20 15:43:01

機器學習深度學習科學

2021-04-18 22:06:29

機器學習算法數據

2017-04-18 09:46:31

機器學習工程師算法

2018-04-25 09:00:00

2013-04-08 10:44:54

企業IT大數據分析Hadoop

2014-06-19 13:29:29

機器學習大數據

2010-10-18 11:35:53

職場

2019-08-02 15:42:09

機器學習開源工具

2019-07-22 05:12:28

機器學習深度學習人工智能

2016-11-28 14:53:08

數據分析IBM大數據

2016-11-03 15:08:29

諸葛io數據分析

2023-06-26 00:19:13

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产精品永久免费视频 | 成人一级毛片 | 免费午夜电影 | 中国一级毛片免费 | 毛片在线免费 | 亚洲黄色片免费观看 | 日韩一区二区在线看 | 黄色一级视频 | 国产高清一区二区三区 | 综合色播 | 国产在线中文字幕 | 亚洲精品一 | 亚洲性网| 天天干天天干 | 中文字幕精品视频 | 美女福利视频网站 | 精品国产一区二区在线 | 欧美一级免费观看 | 国产成人综合在线 | 欧美精品乱码99久久影院 | 国产欧美一区二区三区另类精品 | 国产综合视频 | 久久综合久久综合久久综合 | 午夜影院在线观看视频 | 国产精品一区二区无线 | 欧美mv日韩mv国产网站91进入 | 成人在线不卡 | 久草色视频 | 欧美在线不卡 | 国产一级淫片a直接免费看 免费a网站 | 成人黄视频在线观看 | 91精品在线播放 | 日韩在线免费视频 | 精品国产一区二区国模嫣然 | 青青草一区二区三区 | 国产在线观看一区二区 | 久久国产福利 | 亚洲天堂精品久久 | 妖精视频一区二区三区 | 国产精品综合网 | 草久久久 |