成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

淺析半監督學習及其應用場景

人工智能
如何有效利用當前有標記樣本的數據成為關鍵,而半監督學習則是應對有標簽的樣本數量遠小于無標簽樣本的情況。

Labs 導讀

隨著互聯網的發展,企業可以獲得越來越多的數據,這些數據可以用于幫助企業更好的了解用戶,即客戶畫像,也可以用來改善用戶的體驗。但這些數據中可能存在大量沒有標記的數據。如果所有數據均采用人工標記的方式則存在兩方面的缺點,一是花費的時間成本較高,人工標記效率低,數據量越大需要雇傭的人越多,時間也會越長,成本越高,二是隨著用戶規模的增大,人工標記的速度很難趕上數據的增長。

Part 01、  什么是半監督學習  

半監督學習是指使用既有有標簽的數據又有無標簽的數據訓練模型。半監督學習通常會基于有標簽的數據構建屬性空間,再從無標簽的數據中提取有效信息填充(或重構)屬性空間。因此,通常半監督學習的初始訓練集會劃分為有標簽的數據集D1和無標簽數據集D2,然后通過預處理、特征提取等基本步驟后訓練半監督學習模型,然后將訓練好的模型用于生產環境,為用戶提供服務。

圖1 半監督學習訓練過程

Part 02、半監督學習的假設 

為了實現標簽數據有效補充有標簽數據中的“有用”信息,對數據分部等方面做出一些假設。半監督學習的基礎假設是p(x)中包含p(y|x)的信息,即無標簽的數據應該包含對于標簽預測有用的且與有標簽的數據不相同的或者很難從有標簽的數據中提取出來的信息。此外,還存在一些服務于算法的假設。例如,相似性假設(平滑假設)是指在數據樣本構建的屬性空間中,相近或相似的樣本具有相同的標簽;低密度分離假設是指在數據樣本少的地方存在一個決策邊界能區分不同標簽的數據。

以上假設主要目的是為了表明有標簽的數據與無標簽的數據來源于相同的數據分布。

Part 03、  半監督學習算法分類 

半監督學習算法眾多,可大致分為直推式學習(transductive learning) 歸納式學習(Inductive model),二者區別在于用于模型評估的測試數據集的選擇。直推式的半監督學習是指需要預測標簽的數據集就是用于訓練的無標簽數據集,學習的目的是為了進一步提高預測結果的準確性。歸納式學習則是為完全未知的數據集預測標簽。

圖2 半監督學習算法分類

此外,常見的半監督學習算法的步驟為:第一步會在有標簽的數據上訓練模型,然后用這個模型給無標簽的數據打上偽標簽,然后將偽標簽和有標簽的數據組合成新的訓練集,在這個訓練集上訓練一個新的模型,最后用這個模型給預測數據集打上標簽。

Part 04、  總結 

半監督學習的最大的問題是在很多情況下,模型的性能依賴于有標簽的數據集,并且對于有標簽數據集的質量要求較高,甚至半監督學習模型預測準確度與基于有標簽數據集的有監督模型的結果相差不大,反而半監督模型為了有效提取無標簽數據中的有效信息,會消耗更多的資源。因此,半監督學習的發展方向是提高算法的魯棒性以及數據提取的有效性。

目前半監督學習領域中比較熱門的是PU-Learning(positive-unlabeled learning),這類算法的主要應用場景是只有正和無標簽數據的數據集。其優點是在一些場景下,我們容易獲得比較可靠的正標簽數據集,并且數據量相對較大。例如,垃圾郵件檢測中很容易獲得正常郵件。

責任編輯:龐桂玉 來源: 移動Labs
相關推薦

2022-05-17 16:38:40

數據訓練

2017-06-12 14:04:45

深度學習人工智能

2024-08-16 08:15:02

2023-11-23 15:54:01

人工智能監督學習無監督學習

2021-06-04 15:45:43

XR虛擬現實虛擬經濟

2020-04-28 17:26:04

監督學習無監督學習機器學習

2023-02-01 13:29:46

機器學習

2020-08-16 11:34:43

人工智能機器學習技術

2020-08-14 11:00:44

機器學習人工智能機器人

2015-10-12 10:37:42

學習算法檢測

2019-10-14 10:40:03

機器學習人工智能非監督學習

2022-06-27 14:53:18

監督學習機器學習人工智能

2022-05-13 16:33:42

元宇宙應用場景技術

2011-05-17 15:24:18

Shibboleth認證

2011-05-19 10:53:17

SQL Azure

2017-11-24 10:43:43

Madlib機器學習

2022-07-17 15:46:24

機器學習無監督學習算法

2022-02-15 09:04:44

機器學習人工智能監督學習

2022-06-14 07:07:57

網絡威脅無監督數據泄露

2023-12-01 16:27:05

機器學習無監督學習
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品伊人久久 | 极品在线| 欧美日韩国产欧美 | 亚洲一区二区三区在线视频 | 天堂久久天堂综合色 | 超碰成人在线观看 | 国产欧美视频一区二区 | 欧美一级欧美三级在线观看 | 亚洲综合婷婷 | 一道本不卡 | 精品一区二区电影 | 午夜小视频在线播放 | 蜜桃视频一区二区三区 | 网站黄色在线 | 金莲网 | 能看的av网站 | 日本精品视频在线 | 高清久久久 | 久久精品免费观看 | 国产精品成人品 | 日韩精品亚洲专区在线观看 | 免费午夜视频在线观看 | 亚洲精品免费看 | 一区二区三区在线免费观看 | 中文字幕国产一区 | 我要看免费一级毛片 | 最新日韩精品 | 男女视频在线免费观看 | 精品一区电影 | 罗宾被扒开腿做同人网站 | 欧美二区在线 | 天堂av中文在线 | 亚洲国产精品美女 | 亚洲欧美精品在线 | 日韩电影中文字幕 | 亚洲激情在线 | 九九综合| 久久久久久久国产精品 | 亚洲欧洲视频 | 国产视频在线一区二区 | 国产成人福利在线观看 |