機器學習和計算機視覺的20大圖像數據集
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
計算機視覺使得計算機能夠理解圖像和視頻的內容,其目標是能夠如同人體視覺系統一樣,自動完成任務。計算機視覺任務包括圖像采集、處理和分析。圖像數據以不同的形式呈現,如視頻序列、多機位成像,或是來自醫學掃描儀的多維數據。本文就將介紹一些適用于機器學習訓練的數據集。
(1) Labelme:由麻省理工學院計算機科學和人工智能實驗室(CSAIL)共同創建的大型數據集,包含187240張圖像、62197張帶注釋的圖像和658992個帶標簽的對象。
(2) ImageNet:新算法的實際圖像數據集,根據WordNet層次結構進行組織,層次結構中的每個節點都由成百上千的圖像描述。
(3) LSUN:場景理解,附帶許多輔助任務(房間布局估計、顯著性預測等)。
(4) MS COCO:COCO是一個大規模的對象檢測、分割和說明的數據集,包含200000張以上帶標簽的圖像??捎糜趯ο蠓指睢⑸舷挛闹械淖R別等等。
(5) 哥倫比亞大學圖像庫:COIL100數據集包含100個不同的對象,以360°全角度成像。
(6) Visual Genome:是一個數據集兼知識庫,旨在將結構化圖像概念與語言聯系起來。該數據集是包含108077張圖像說明的詳細視覺知識庫。
(7) Lego Bricks:包含大約12700張16種不同樂高積木的圖片,按文件夾分類,用Blender進行計算機渲染。
(8) 谷歌開放圖像:在知識共享(Creative Commons)的支持下,900萬張圖像的URL“已經用跨越6000多個類別的標簽進行了注釋”。

(9) Youtube-8M:由數百萬個YouTube視頻ID組成的大規模標簽數據集,包含超過3800個視覺實體的注釋。
(10) Labelled Faces in the Wild:包含13000張帶標簽的人臉圖像,旨在開發人臉識別相關應用。
(11) 斯坦福犬類數據集:包含20580張圖像和120個犬類品種,每個類別大概150張圖像。
(12) Places:以場景為主的數據庫,包含205個場景類別和250萬個帶有類別標簽的圖像。
(13) CelebFaces:擁有超過200000張名人圖像的人臉數據集,每張都有40個屬性注釋。

(14) Flowers:在英國常見的花卉圖像數據集,由102個不同類別組成。每個花卉類別由40到258張不同姿態和光線變化的圖像組成。
(15) Plant Image Analysis:跨越100多萬張植物圖像的數據集的集合。可以從11種植物中選擇。
(16) Home Objects:包含家庭中隨機對象的數據集,主要來自廚房、浴室和客廳,分為訓練數據集和測試數據集。
(17) CIFAR-10:由60000張32×32彩色圖像組成的大型圖像數據集,分為10類。數據集分為五個訓練批次和一個測試批次,每個批次包含10000張圖像。
(18) CompCars:包含163款汽車品牌,共有1716種車型,每種車型都標有五個屬性,包括最大速度、排量、車門數量、座椅數量和汽車類型。
(19) 室內場景識別數據集:這是一個非常獨特的數據集。因為大多數場景識別模型在室外發揮更好,所以該數據集很有用。包含67個室內類別,共15620張圖片。
(20) VisualQA:VQA數據集包含265,016張圖像的開放性問題。這些問題需要對視覺和語言的理解。對于每張圖像,至少有3個問題,每個問題至少有10個答案。