成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

BBAug: 一個用于PyTorch的物體檢測包圍框數據增強包

人工智能 深度學習
在這篇論文中,作者確定了一組增強稱為策略,它對目標檢測問題表現良好。該策略通過增強搜索獲得,提高了通用模型的性能。

 

像許多神經網絡模型一樣,目標檢測模型在訓練大量數據時效果最好。通常情況下,可用的數據有限,世界各地的許多研究人員正在研究增強策略,以增加可用的數據量。谷歌的大腦團隊進行了一項這樣的研究,并發表在了一篇論文中,名為Learning Data Augmentation Strategies for Object Detection。在這篇論文中,作者確定了一組增強稱為策略,它對目標檢測問題表現良好。該策略通過增強搜索獲得,提高了通用模型的性能。

作者將增強策略定義為一組子策略。在模型進行訓練時,隨機選擇其中一個子策略用于增強圖像。在每個子策略中都有要依次應用于圖像的增強。每個轉換也有兩個超參數:概率和幅度。概率表示該增強將被應用的可能性,而幅度表示該增強的程度。下面的代碼顯示了本文中使用的策略: 

  1. policy = [        
  2.   [('TranslateX_BBox', 0.6, 4), ('Equalize', 0.8, 10)],    
  3.   [('TranslateY_Only_BBoxes', 0.2, 2), ('Cutout', 0.8, 8)],    
  4.   [('Sharpness', 0.0, 8), ('ShearX_BBox', 0.4, 0)],       
  5.   [('ShearY_BBox', 1.0, 2), ('TranslateY_Only_BBoxes', 0.6, 6)],  
  6.   [('Rotate_BBox', 0.6, 10), ('Color', 1.0, 6)], 

在這個策略中有5個子策略,如果我們取第一個子策略,它就包含了TranslateX_BBox和Equalize增強。TranslateX_BBox操作在x軸上轉換圖像的幅度為4。在本例中,大小并不直接轉換為像素,而是根據大小縮放為像素值。該增強的概率也為0.6,這意味著如果該增強被選中,則應用該增強的概率為60%。隨著每個增強都有一個相關的概率,引入了一個隨機的概念,給訓練增加了一定程度的隨機性。總的來說,Brain Team已經提出了4個策略: v0, v1, v2和v3。本文中顯示了v0策略,其他三個策略包含更多的子策略,這些子策略具有幾種不同的轉換。總的來說,增加分為三類,作者定義為:

顏色操作: 扭曲顏色通道,不影響邊界框的位置。

幾何操作:幾何扭曲圖像,這相應地改變了邊界框的位置和大小。

包圍框操作:只會扭曲包圍框中包含的像素內容。

BBAug

那么BBAug)在這方面有什么貢獻呢?BBAug是一個python包,它實現了谷歌Brain Team的所有策略。這個包是一個包裝器,可以更容易地使用這些策略。實際的擴展是由優秀的imgaug包完成的。

上面顯示的策略應用于一個示例圖像,如下所示。每一行是一個不同的子策略,每一列是該子策略的不同運行。

正如你所看到的,在子策略的運行之間有一定程度的變化,因此給訓練增加了一定程度的隨機性。這只是BBAug實施的4個策略之一。要查看所有4個策略的完整可視化,請查看包的GitHub頁面:https://github.com/harpalsahota/bbaug。該包還提供了一些有用的功能,比如定制策略的可能性,以及位于圖像外部的邊界框,如果它們部分位于圖像外部,則會被自動刪除或剪切。例如,在下面的圖像中,應用了平移增強,將邊界框部分推到圖像外部。你可以看到新的邊界框已經縮小以適應這一點。

也可以創建只影響邊界框區域的增強。在下圖中,solarisaugmentation只應用于邊界框區域:

用隨機策略增加單個圖像有多容易?就像這樣簡單: 

  1. from bbaug import policies  
  2. # select policy v0 set  
  3. aug_policy = policies.policies_v0()   
  4. # instantiate the policy container with the selected policy set  
  5. policy_container = policies.PolicyContainer(aug_policy)  
  6. # select a random policy from the policy set  
  7. random_policy = policy_container.select_random_policy()    
  8. # Apply the augmentation. Returns the augmented image and bounding boxes.  
  9. # Image is a numpy array of the image  
  10. # Bounding boxes is a list of list of bounding boxes in pixels (int).  
  11. # e.g. [[x_min, y_min, x_man, y_max], [x_min, y_min, x_man, y_max]]  
  12. # Labels are the class labels for the bounding boxes as an iterable of ints e.g. [1,0]  
  13. img_aug, bbs_aug = policy_container.apply_augmentation(random_policy, image, bounding_boxes, labels)  
  14. # image_aug: numpy array of the augmented image  
  15. # bbs_aug: numpy array of augmneted bounding boxes in format: [[label, x_min, y_min, x_man, y_max],...] 

總結

該包實現了谷歌Brain Team推導出的增強策略。目前,已經實現了所有4個策略,該包還附帶了notebooks,以幫助用戶將這些策略集成到他們的PyTorch訓練pipeline中。 

 

責任編輯:龐桂玉 來源: 深度學習這件小事
相關推薦

2024-02-16 08:00:00

機器學習ML-data預訓練模型

2025-01-13 10:00:00

2024-08-27 10:20:00

2023-10-07 11:36:15

2024-06-24 05:00:00

YOLO模型人工智能

2025-03-13 11:11:04

2022-02-14 11:37:59

自動駕駛算法技術

2024-01-04 08:00:00

人工智能深度學習

2024-10-05 13:00:00

模型優化訓練

2023-12-31 16:35:31

Pytorch函數深度學習

2024-05-28 10:08:52

2021-03-26 15:55:17

Python 開發編程語言

2022-05-07 13:52:22

Feign 增強包K8s

2025-02-06 11:00:00

機器人感知機器人深度學習

2025-01-06 12:20:00

YOLO物體識別開發

2017-03-01 19:48:02

Node瀏覽器JavaScript

2012-07-18 11:31:02

ibmdw

2023-10-11 10:22:55

數據集計算機

2020-06-04 12:55:44

PyTorch分類器神經網絡

2009-08-19 15:01:24

百度框計算
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 四虎影院在线观看免费视频 | 免费一区二区三区 | 久久综合一区 | 日本在线看 | 欧美成人一区二区三区片免费 | 亚洲欧洲在线观看视频 | 国产精品一区二区在线免费观看 | 国产成人精品一区二区三区在线 | 久久精品久久久 | 亚欧精品一区 | 成人一区在线观看 | 国产精品日产欧美久久久久 | 精品人伦一区二区三区蜜桃网站 | 夜夜爽99久久国产综合精品女不卡 | 精品国产乱码久久久久久蜜臀 | 日韩国产在线 | 99久久精品视频免费 | 国产熟熟 | 成人在线小视频 | 国产高清久久久 | 国产视频久久久 | 99久久精品国产一区二区三区 | 国产亚洲精品精品国产亚洲综合 | 精品欧美一区二区三区久久久小说 | 麻豆国产精品777777在线 | 成人在线观 | 一级毛片视频在线 | 国产精品视频网 | www.国产.com| 欧美一级久久久猛烈a大片 日韩av免费在线观看 | 国产网站在线播放 | 丁香五月网久久综合 | 国产欧美精品区一区二区三区 | 天天综合久久网 | 国产一二三区在线 | 91私密视频 | www.亚洲精品| 国产成人精品一区二三区在线观看 | 一区二区三区不卡视频 | 在线午夜 | 久久久片 |