準(zhǔn)備 YOLO 訓(xùn)練數(shù)據(jù):數(shù)據(jù)標(biāo)注技術(shù)和優(yōu)秀實(shí)踐
如果你已經(jīng)對(duì)YOLO目標(biāo)檢測(cè)算法有了基本的了解,并且可能迫不及待地想在你的項(xiàng)目中嘗試它。成功的關(guān)鍵是一個(gè)定制的訓(xùn)練數(shù)據(jù)集。
量身定制的數(shù)據(jù)集對(duì)于開發(fā)高精度、高效的YOLO模型至關(guān)重要,這些模型滿足你的特定用例需求。通過標(biāo)注你自己的數(shù)據(jù),你確保模型學(xué)習(xí)識(shí)別與你領(lǐng)域相關(guān)的對(duì)象,無論是在道路上檢測(cè)車輛、識(shí)別傳送帶上的產(chǎn)品,還是在建筑工地上發(fā)現(xiàn)安全隱患。
在這篇文章中,我們將指導(dǎo)你如何準(zhǔn)備用于訓(xùn)練YOLO模型的標(biāo)注數(shù)據(jù),從在圖像中標(biāo)記對(duì)象到組織你的數(shù)據(jù)集。
YOLO 訓(xùn)練的數(shù)據(jù)準(zhǔn)備
記住,一個(gè)準(zhǔn)備充分的標(biāo)注數(shù)據(jù)集不僅提高了模型的性能,還減少了訓(xùn)練所需的時(shí)間和資源。數(shù)據(jù)準(zhǔn)備過程可以分為四個(gè)步驟:
- 數(shù)據(jù)收集:收集一個(gè)大型、多樣化的圖像數(shù)據(jù)集,代表你希望模型檢測(cè)的所有類別。你可以使用像COCO和Pascal VOC這樣的公共數(shù)據(jù)集,或者收集你自己的定制數(shù)據(jù)。
- 數(shù)據(jù)標(biāo)注:每張圖像都需要YOLO格式的標(biāo)注,包括每個(gè)對(duì)象的類別和位置(通常是邊界框)。標(biāo)注的準(zhǔn)確性直接影響模型性能。
- 標(biāo)注格式轉(zhuǎn)換:YOLO需要特定格式的標(biāo)注。每張圖像都有一個(gè).txt文件,列出所有對(duì)象及其類別和邊界框信息。邊界框的格式如下:
<object-class> <x_center> <y_center> <width> <height>
坐標(biāo)是相對(duì)于圖像尺寸歸一化的。<object-class> 是類別索引。
- 數(shù)據(jù)集分割:將數(shù)據(jù)集分割為訓(xùn)練集、驗(yàn)證集和測(cè)試集。這對(duì)于避免過擬合并評(píng)估模型性能至關(guān)重要。典型的分割比例是70%訓(xùn)練,15%驗(yàn)證,15%測(cè)試。
YOLO 的數(shù)據(jù)標(biāo)注
現(xiàn)在,讓我們逐步了解數(shù)據(jù)標(biāo)注過程,為YOLO訓(xùn)練準(zhǔn)備數(shù)據(jù)集。首先,選擇一個(gè)標(biāo)注工具。開源和基于云的工具都可以工作,但在線版本對(duì)于團(tuán)隊(duì)來說往往更高效。我們將以BasicAI Cloud為例,這是目標(biāo)檢測(cè)研究的流行選擇。無需安裝;只需在https://app.basic.ai. 注冊(cè)一個(gè)免費(fèi)賬戶即可。
我們已經(jīng)收集了一個(gè)用于海龜檢測(cè)的數(shù)據(jù)集。沒有標(biāo)注,模型無法學(xué)習(xí),所以讓我們開始標(biāo)注。
上傳數(shù)據(jù)
在BasicAI Cloud UI上,轉(zhuǎn)到“Datasets”,點(diǎn)擊“+Create”,選擇“Image”類型,命名你的數(shù)據(jù)集,然后點(diǎn)擊“Create”。
在預(yù)覽界面中,點(diǎn)擊藍(lán)色“+Upload”按鈕。你可以通過本地文件、URL或云存儲(chǔ)上傳。這里,我們從本地地址上傳。
創(chuàng)建本體
讓我們創(chuàng)建一個(gè)“Turtle”本體類別。轉(zhuǎn)到“Ontology”標(biāo)簽頁,點(diǎn)擊“+Create”。選擇邊界框類型,命名它,并設(shè)置框顏色。
標(biāo)注數(shù)據(jù)
回到“Data”標(biāo)簽頁,選擇所有數(shù)據(jù),然后點(diǎn)擊“Annotate”。
標(biāo)注工具在左側(cè),類別在右側(cè)。
選擇“Bounding Box Tool”(快捷鍵‘1’)。光標(biāo)變成十字準(zhǔn)線。
提示:預(yù)先選擇類別,以便自動(dòng)將其分配給新框。非常適合多目標(biāo)檢測(cè)。
點(diǎn)擊對(duì)象的一個(gè)角,然后點(diǎn)擊對(duì)角,創(chuàng)建一個(gè)框。使用箭頭工具調(diào)整邊緣。詳情可以參考:
https://video.wixstatic.com/video/4b3c31_95a85dde75de4bbf83e616098f9b73b1/720p/mp4/file.mp4
提示:在“Display setting”中啟用“Measure Line”以獲得輔助線。
使用這種方法在所有圖像中標(biāo)注對(duì)象。完成后點(diǎn)擊“Save”并退出。
“Preview Annotateions”顯示結(jié)果。
導(dǎo)出數(shù)據(jù)點(diǎn)擊“Export”以創(chuàng)建導(dǎo)出任務(wù)。
在“Annotation Format”下,選擇YOLO的TXT格式。點(diǎn)擊“Create”。
準(zhǔn)備好后下載結(jié)果。
每個(gè)文件都包含訓(xùn)練所需的信息。在這里,系統(tǒng)自動(dòng)將“0”分配給單個(gè)標(biāo)簽。
項(xiàng)目結(jié)構(gòu)像YOLO v7一樣組織項(xiàng)目,因?yàn)槠浣Y(jié)構(gòu)與v9非常相似。
為什么選擇BasicAI Cloud進(jìn)行YOLO數(shù)據(jù)標(biāo)注?
BasicAI Cloud是一個(gè)全面的智能數(shù)據(jù)標(biāo)注解決方案,它與你的YOLO工作流程無縫集成,使標(biāo)注過程高效且協(xié)作。
- 全面功能:BasicAI Cloud支持所有數(shù)據(jù)類型,包括圖像、視頻、激光雷達(dá)融合、音頻和文本。模型輔助工具支持自動(dòng)預(yù)標(biāo)注(實(shí)例標(biāo)注、語義分割、語音識(shí)別)和交互式標(biāo)注。
- 為團(tuán)隊(duì)協(xié)作而建:可擴(kuò)展的項(xiàng)目管理,將外部團(tuán)隊(duì)和模型集成到自定義工作流程中。快速批量分配標(biāo)注任務(wù)。自定義實(shí)時(shí)QA快速捕捉質(zhì)量問題。提供了詳細(xì)的績(jī)效報(bào)告。
- 數(shù)據(jù)集管理:上傳預(yù)標(biāo)注數(shù)據(jù)進(jìn)行微調(diào)。視頻幀提取和連續(xù)幀分割/合并。云存儲(chǔ)集成。
- 成本:免費(fèi)賬戶幾乎具有全部功能——5個(gè)座位,200GB存儲(chǔ),10,000個(gè)免費(fèi)自動(dòng)標(biāo)簽。
它們非常適合小型研究團(tuán)隊(duì),并且對(duì)于大型團(tuán)隊(duì)來說價(jià)格具有競(jìng)爭(zhēng)力。提供企業(yè)級(jí)本地部署。通過利用BasicAI Cloud滿足你的YOLO數(shù)據(jù)標(biāo)注需求,你可以簡(jiǎn)化準(zhǔn)備高質(zhì)量標(biāo)注數(shù)據(jù)的過程,與你的團(tuán)隊(duì)有效協(xié)作,并輕松管理你的數(shù)據(jù)集。這個(gè)強(qiáng)大的平臺(tái)使你能夠?qū)W⒂陂_發(fā)準(zhǔn)確高效的YOLO目標(biāo)檢測(cè)模型,同時(shí)最小化花在數(shù)據(jù)標(biāo)注上的時(shí)間和精力。