成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

數(shù)據(jù)來源仍然是人工智能主要瓶頸

人工智能
數(shù)據(jù)是人工智能的命脈。沒有它,你無法構(gòu)建任何與人工智能相關(guān)的東西。

?根據(jù)Appen本周發(fā)布的《人工智能和機(jī)器學(xué)習(xí)狀況》報告,各機(jī)構(gòu)仍在努力獲取良好、干凈的數(shù)據(jù),以維持其人工智能和機(jī)器學(xué)習(xí)計(jì)劃。

根據(jù)Appen對504名商業(yè)領(lǐng)袖和技術(shù)專家的調(diào)查,在人工智能的四個階段中,數(shù)據(jù)來源;數(shù)據(jù)準(zhǔn)備;模型訓(xùn)練和部署;人工主導(dǎo)的模型評估階段——數(shù)據(jù)來源消耗的資源最多、時間最長、最具挑戰(zhàn)性。

根據(jù)Appen的調(diào)查,數(shù)據(jù)來源平均消耗企業(yè)組織34%的人工智能預(yù)算,數(shù)據(jù)準(zhǔn)備、模型測試和部署各占24%,模型評估占15%。該調(diào)查由哈里斯調(diào)查(Harris Poll)進(jìn)行,受訪者包括來自美國、英國、愛爾蘭和德國的IT決策者、商業(yè)領(lǐng)袖和經(jīng)理以及技術(shù)從業(yè)者。

就時間而言,數(shù)據(jù)來源大約消耗26%的時間,數(shù)據(jù)準(zhǔn)備的時間為24%,模型測試、部署和模型評估的時間各為23%。最后,42%的技術(shù)人員認(rèn)為數(shù)據(jù)來源是AI生命周期中最具挑戰(zhàn)性的階段,其他階段情況分別為:模型評估(41%)、模型測試和部署(38%)和數(shù)據(jù)準(zhǔn)備(34%)。

盡管面臨挑戰(zhàn),但各企業(yè)組織都在努力使其發(fā)揮作用。據(jù)Appen稱,五分之四(81%)的受訪者表示,他們有足夠的數(shù)據(jù)支持他們的人工智能計(jì)劃。成功的關(guān)鍵可能在于:絕大多數(shù)(88%)的公司通過使用外部AI訓(xùn)練數(shù)據(jù)提供商(如Appen)來擴(kuò)充數(shù)據(jù)。

然而,數(shù)據(jù)的準(zhǔn)確性還有待商榷。Appen發(fā)現(xiàn),只有20%的受訪者報告數(shù)據(jù)準(zhǔn)確率超過80%。只有6%(大約每20個人中有一個)說他們的數(shù)據(jù)準(zhǔn)確性達(dá)到90%或更高。

考慮到這一點(diǎn),根據(jù)Appen的調(diào)查,近一半(46%)的受訪者認(rèn)為數(shù)據(jù)的準(zhǔn)確性很重要。只有2%的人認(rèn)為數(shù)據(jù)準(zhǔn)確性不是很大的需求,而51%的人認(rèn)為這是至關(guān)重要的需求。

Appen的首席技術(shù)官Wilson Pang對數(shù)據(jù)質(zhì)量的重要性有著不同的看法,他的客戶中有48%認(rèn)為數(shù)據(jù)質(zhì)量不重要。

報告中說:“數(shù)據(jù)的準(zhǔn)確性對人工智能和ML模型的成功至關(guān)重要,因?yàn)橘|(zhì)量豐富的數(shù)據(jù)會產(chǎn)生更好的模型輸出和一致的處理和決策。”“為了獲得好的結(jié)果,數(shù)據(jù)集必須準(zhǔn)確、全面和可擴(kuò)展。”

深度學(xué)習(xí)和以數(shù)據(jù)為中心的人工智能的興起,已經(jīng)將人工智能成功的動力從良好的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)建模轉(zhuǎn)移到良好的數(shù)據(jù)收集、管理和標(biāo)簽。在當(dāng)今的遷移學(xué)習(xí)技術(shù)中,這一點(diǎn)尤其明顯。人工智能的實(shí)踐者會放棄一個大型的預(yù)先訓(xùn)練的語言或計(jì)算機(jī)視覺模型,用他們自己的數(shù)據(jù)對其中的一小部分進(jìn)行再訓(xùn)練。

更好的數(shù)據(jù)還可以幫助防止不必要的偏見滲透到人工智能模型中,防止人工智能可能導(dǎo)致的壞結(jié)果。對于大型語言模型來說,這一點(diǎn)尤其明顯。

報告中說:“隨著在多語言網(wǎng)絡(luò)抓取數(shù)據(jù)上訓(xùn)練的大型語言模型(LLM)的興起,企業(yè)正面臨另一個挑戰(zhàn)。由于訓(xùn)練語料庫中充斥著有毒的語言,以及種族、性別和宗教偏見,這些模型通常會表現(xiàn)出不受歡迎的行為。”

網(wǎng)絡(luò)數(shù)據(jù)的偏見引發(fā)了棘手的問題,雖然有一些變通辦法(改變訓(xùn)練方案,過濾訓(xùn)練數(shù)據(jù)和模型輸出,并從人類反饋和測試中學(xué)習(xí)),但需要進(jìn)行更多的研究,以創(chuàng)建一個“以人為中心的LLM”基準(zhǔn)和模型評估方法的良好標(biāo)準(zhǔn)。

Appen表示,數(shù)據(jù)管理仍然是人工智能面臨的最大障礙。調(diào)查發(fā)現(xiàn),在人工智能循環(huán)中,41%的人認(rèn)為數(shù)據(jù)管理是最大的瓶頸。排在第四位的是缺乏數(shù)據(jù),30%的受訪者認(rèn)為這是人工智能成功的最大障礙。

但也有一些好消息:企業(yè)用于管理和準(zhǔn)備數(shù)據(jù)的時間正在下降。Appen說,今年的比例剛剛超過47%,而去年報告中的比例為53%。

“由于大多數(shù)受訪者使用外部數(shù)據(jù)提供商,可以推斷,通過外包數(shù)據(jù)來源和準(zhǔn)備,數(shù)據(jù)科學(xué)家正在節(jié)省適當(dāng)管理、清潔和標(biāo)簽他們的數(shù)據(jù)所需的時間。”數(shù)據(jù)標(biāo)簽公司說。

然而,根據(jù)數(shù)據(jù)中相對較高的錯誤率判斷,也許組織不應(yīng)該縮減其數(shù)據(jù)來源和準(zhǔn)備過程(無論是內(nèi)部的還是外部的)。當(dāng)涉及到建立和維護(hù)AI流程時,有很多相互競爭的需求——雇傭合格的數(shù)據(jù)專業(yè)人員的需求是Appen確定的另一個首要需求。但是,在數(shù)據(jù)管理取得重大進(jìn)展之前,組織應(yīng)該繼續(xù)向他們的團(tuán)隊(duì)施加壓力,繼續(xù)推動數(shù)據(jù)質(zhì)量的重要性。

調(diào)查還發(fā)現(xiàn),93%的組織強(qiáng)烈或在一定程度上同意AI倫理應(yīng)該是AI項(xiàng)目的“基礎(chǔ)”。Appen首席執(zhí)行官M(fèi)ark Brayan表示,這是一個良好的開端,但還有很多工作要做。Brayan在一份新聞稿中說:“問題是,許多人正面臨著試圖用糟糕的數(shù)據(jù)集構(gòu)建偉大的人工智能的挑戰(zhàn),這為實(shí)現(xiàn)他們的目標(biāo)制造了巨大的障礙。”

根據(jù)Appen的報告,企業(yè)內(nèi)部自定義收集的數(shù)據(jù)仍然是用于人工智能的主要數(shù)據(jù)集,占數(shù)據(jù)的38%至42%。合成數(shù)據(jù)表現(xiàn)出驚人的強(qiáng)勁,占組織數(shù)據(jù)的24%至38%,而預(yù)標(biāo)記數(shù)據(jù)(通常來自數(shù)據(jù)服務(wù)提供商)占數(shù)據(jù)的23%至31%。

特別是,合成數(shù)據(jù)有可能減少敏感AI項(xiàng)目中的偏差發(fā)生率,Appen 97%的調(diào)查參與者表示,他們在“開發(fā)包容性訓(xùn)練數(shù)據(jù)集”中使用了合成數(shù)據(jù)。

報告中其他有趣地發(fā)現(xiàn)包括:

  • 77%的組織每月或每季度對他們的模型進(jìn)行再訓(xùn)練;(Ai時代前沿解讀:人工智能不是一勞永逸的,根據(jù)應(yīng)用需求不斷提升,需要不斷更新。)
  • 55%的美國企業(yè)聲稱自己領(lǐng)先于競爭對手,而在歐洲這一比例為44%;(Ai時代前沿解讀:歐洲人略微比美國人低調(diào)一些。)
  • 42%的組織報告稱人工智能“廣泛”推出,而在《2021年人工智能狀態(tài)報告》中,這一比例為51%;(Ai時代前沿解讀:人工智能應(yīng)用越來越廣泛了。)
  • 7%的機(jī)構(gòu)報告稱人工智能預(yù)算超過500萬美元,而去年這一比例為9%。(Ai時代前沿解讀:一方面可能由于人工智能逐漸成熟降低了成本,也說明人工智能不再是一個“奢侈品”,正逐漸成為企業(yè)的“必備品”。)


責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2022-08-19 15:17:44

人工智能大數(shù)據(jù)

2022-07-12 14:28:05

網(wǎng)絡(luò)安全數(shù)據(jù)安全網(wǎng)絡(luò)情報

2019-08-05 10:19:56

云計(jì)算云安全公共云

2022-03-02 14:15:25

物聯(lián)網(wǎng)醫(yī)療安全

2023-12-05 14:46:58

人工智能

2020-12-18 13:22:33

人工智能算法

2012-11-30 10:18:02

2020-08-31 15:15:20

人工智能算法AI

2013-09-10 09:24:06

2022-01-06 22:29:35

人工智能機(jī)器人自動化

2022-07-08 17:08:55

人工智能外賣深度學(xué)習(xí)

2021-12-08 14:49:01

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2022-07-26 11:27:40

人工智能AIOps

2023-05-05 14:02:59

人工智能聊天機(jī)器人

2018-08-03 09:32:06

Linux 系統(tǒng) Windows

2017-10-22 21:04:44

HPC英特爾

2021-07-17 22:49:52

人工智能科學(xué)技術(shù)

2021-11-05 09:56:36

人工智能AI指數(shù)

2022-08-18 11:07:17

網(wǎng)絡(luò)人工智能AI

2024-02-05 11:09:57

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产精品久久久久久一区二区三区 | 精品在线一区二区 | 日韩av最新网址 | 日本成人在线观看网站 | 在线欧美小视频 | 天天操网| 精品一区二区三区在线观看国产 | 欧美一区二区三区视频 | 久久久亚洲 | 一区二区三区亚洲 | 国产精品久久久久久久久久尿 | 久久精品一区二区 | 国产精品成人国产乱 | 欧美一区二区三区在线观看视频 | 亚洲国产黄色av | av一级在线观看 | 久久亚洲美女 | 91久久国产综合久久91精品网站 | 天天久久 | 国产精品99久久免费观看 | 午夜av电影 | 午夜性视频 | 涩涩操 | 在线一区视频 | 国产精品久久久久久久久久免费看 | 在线一区视频 | av天空| 亚洲欧美在线观看 | 欧美久久久久久 | 亚洲91 | 91精品国产一区二区三区 | 日韩视频在线免费观看 | 成人在线小视频 | 美女黄网站 | 国产在视频一区二区三区吞精 | 夜夜草 | 亚洲欧美中文字幕在线观看 | 亚洲精品一级 | a级免费黄色片 | 中文区中文字幕免费看 | 亚洲在线 |