成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為什么說數據是人工智能的基礎

人工智能 機器學習
大多數數據都沒有標注是非結構化數據,而人工智能訓練需要的是計算機可以讀懂的結構化數據。帶標簽的數據,意味著標注或注釋目標模型的數據,以便可以進行訓練、預測。

  什么是數據標注?

大多數數據都沒有標注是非結構化數據,而人工智能訓練需要的是計算機可以讀懂的結構化數據。帶標簽的數據,意味著標注或注釋目標模型的數據,以便可以進行訓練、預測。通常,數據標注包括數據標注、注釋、審核、分類、轉錄和處理。標注的數據是為了突出顯示某些特征,并根據這些特征對其進行分類,通過模型分析其模式以預測新的目標。

數據在人工智能項目中占用多少時間?

訓練機器學習和深度學習模型,需要豐富的數據,以便將其用于部署,訓練和調整模型。訓練機器學習和深度學習模型需要大量經過仔細標注的數據。標注原始數據并準備將其應用于機器學習模型和其他AI工作流,被稱為數據標注。根據相關統計,數據整理在AI項目中消耗了80%以上的時間。通常在一個人工智能項目中,數據的需求也分3次左右,第一次是在項目開始的驗證階段,需求數量量比較小,需要確定可行性及規則;第二次是項目正式啟動,需要大量的數據對模型進行訓練;第三次是在訓練并驗證完成后,對一些不滿意的地方進行訓練集的補充,以達到預期的目標。下圖是在人工智能機器學習項目中各個任務的時間占比。

 

為什么說數據是人工智能的基礎

 

數據標注在人工智能中的成本占比多少?

與數據相關的機器學習成本主要表現在數據集方面,包括數據集的采集、清洗、數據的標注等。Dimensional Research 代表 Alegion 所做的一項最新研究表明,所有組織中的 96%都遇到了與訓練數據質量和數量相關的問題。同一項研究表明,大多數項目需要超過 100,000 個數據樣本才能表現良好。

 

為什么說數據是人工智能的基礎

 

Dimensional Research 研究的圖表說明了公司在數據方面面臨的最常見的一些問題。

如果還沒有數據,可以假設能夠在大約一個小時內收集 5–10 個樣本并對它們進行標注。利用 亞馬遜的 Mechanical Turk 之類的服務來驗證整個項目過程,生成 100,000 個合格樣本數據集的話,花費大約為 70,000 美元。

如果已經收集了大量數據,則可以使用專業的數據標注服務公司來對其進行標注。在這種情況下,獲得 100,000 個帶有標簽的數據樣本,則可能需要花費 8,000 到 80,000 美元的費用,具體的需要取決于標注的復雜程度。

此外,檢查和校正數據樣本與生成和標注數據樣本一樣耗時。Dimensional Research 研究報告中提到,66%的公司在其數據集中遇到偏差和錯誤問題。有些公司選擇采用完整的內部方法(自己做所有標注),也有一些公司會選擇外包和內部混合使用。第二種常見的情況是將大部分工作外包,然后由公司個別人員負責驗證和清理。外包 10 萬個數據樣本的初始成本可能會增加大約 2500 至 5,000 美元。

除了數據成本外,還有算法人工成本、算力設備成本、項目落地成本。除去附加項成本和一系列功耗所帶來的成本,機器學習項目可能會使公司花費 51,750 美元至 136,750 美元(不包括難以確定的其他成本)。價格差異主要是由數據的決定的。這是一個非常樂觀的估計。如果企業位于美國,并且使用的是優質的數據(自由職業者不會這樣做),則與人才相關的費用將激增,使人工智能機器學習項目的費用超過 108,500 美元。

這樣高昂的價格使想要解決新問題或讓其流程自動化。決策的個人、小型團隊和初創企業無法使承擔。

數據處理中最難的是什么?

最艱難的步驟是第一步:獲取數據。沒有數據,幾乎不可能在研究階段驗證機器學習解決方案,從而導致項目進度幾乎無法進行。

隨著工業、醫療、安防、教育、金融等領域意識到未來人工智能對于行業改變的重要性,都紛紛入局開發自己的人工智能應用,但是隨著這些領域越來越重視數據保密性及數據的安全性,這些因素都可能會導致人工智能研究的私有化。人工智能逐漸趨于私有化確是事實,在這個大環境之下,數據標注服務、訓練模型平臺、算力設備等都已經研究出各自的私有化部署的解決方案。

 

 

責任編輯:華軒 來源: 今日頭條
相關推薦

2022-07-12 11:17:54

人工智能首席信息官

2017-12-07 10:46:04

人工智能自然語言處理

2020-11-03 10:45:53

人工智能AIAI偏差

2020-12-18 13:22:33

人工智能算法

2017-12-13 12:44:07

人工智能技術AI

2023-05-05 14:02:59

人工智能聊天機器人

2023-08-01 14:59:35

人工智能合成數據

2015-12-09 14:32:51

人工智能

2022-08-18 11:07:17

網絡人工智能AI

2024-02-05 11:09:57

2023-12-18 18:56:28

超級人工智能人工智能

2018-07-03 11:26:31

人工智能工業革命科技

2020-06-28 14:32:11

數據標注人工智能AI

2022-06-14 10:33:08

物聯網智能家居人工智能

2018-05-18 15:25:32

人工智能Python語言

2022-07-22 11:02:46

人工智能AI網絡安全

2022-07-26 11:27:40

人工智能AIOps

2021-06-21 14:38:19

物聯網人工智能

2017-03-27 12:30:54

人工智能

2024-02-26 11:31:33

人工智能數據中心
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 九九精品在线 | 成人欧美一区二区三区在线观看 | 国产精品久久久久久久久久免费看 | h在线免费观看 | 中文字幕人成乱码在线观看 | 日韩电影免费在线观看中文字幕 | 91综合在线视频 | 国产在视频一区二区三区吞精 | 成年人免费看的视频 | 91精品久久久 | 凹凸日日摸日日碰夜夜 | 亚洲一区精品在线 | 成人av观看 | 成人一区二区三区在线观看 | 激情五月综合 | 在线欧美一区二区 | 日韩一区二区三区在线 | 久久精品中文字幕 | 国产我和子的乱视频网站 | 国产高清在线 | 国产一级片在线播放 | 自拍视频精品 | 国产精品久久久久久久久久久免费看 | 国产乱码精品一区二区三区五月婷 | 久久婷婷av | 久久影音先锋 | 国产原创视频 | 中文字幕 国产精品 | 亚洲国产区 | 日本精品视频 | 亚洲成人自拍 | 国产精品一区二区三区久久 | 日韩和的一区二区 | 欧美精品一区久久 | 国产免费一区二区 | 精品在线观看一区二区 | 免费国产视频 | 一区二区免费看 | 国产精品久久久久久久久久免费看 | 国产在线精品一区二区 | 亚洲精品成人av久久 |