成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

視覺AI能力大一統!自動化圖像檢測分割,還能可控文生圖,華人團隊出品

人工智能 新聞
這是一個零樣本檢測模型,能夠生成帶有文字描述的物體box和標簽。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

現在AI圈確實到了拼手速的時候啊。

這不,Meta的SAM剛剛推出幾天,就有國內程序猿來了波buff疊加,把目標檢測、分割、生成幾大視覺AI功能all in one!

比如基于Stable Diffusion和SAM,就能讓照片中的椅子無縫換成沙發:

圖片

換裝、換發色也是so easy:

圖片

項目一經發布就讓不少人驚呼:手速也太快了吧!

圖片

還有人表示:我和新垣結衣的新結婚照有了。

圖片

如上就是Gounded-SAM帶來的效果,項目在GitHub上已攬星1.8k。

簡單來說,這就是一個zero-shot視覺應用,只需要輸入圖片,就能自動化檢測和分割圖像。

該研究來自IDEA研究院(粵港澳大灣區數字經濟研究院),創始人兼理事長為沈向洋。

無需額外訓練

Grounded SAM主要由Grounding DINO和SAM兩個模型組成。

其中SAM(Segment Anything)是4天前Meta剛剛推出的零樣本分割模型。

它可以為圖像/視頻中的任何物體生成mask,包括訓練過程中沒出現過的物體和圖像。

通過讓SAM對于任何提示都返回有效的mask, 能夠讓模型在即使提示是模糊的或者指向多個對象的情況下,輸出也應該是所有可能中一個合理的mask。這一任務用于預訓練模型并通過提示解決一般的下游分割任務。

模型框架主要由一個圖像編碼器、一個提示編碼器和一個快速mask解碼器組成。在計算圖像嵌入后,SAM能夠在50毫秒內根據web中的任何提示生成一個分割。

圖片

Grounding DINO是該研究團隊已有的成果。

這是一個零樣本檢測模型,能夠生成帶有文字描述的物體box和標簽。

圖片

二者結合后,可以通過文本描述找到圖片中的任意物體,然后通過SAM強大的分割能力,細粒度地分割出mask.

圖片

在這些能力之上,他們還疊加了Stable Diffusion的能力,也就是開頭所展示的可控圖像生成。

值得一提的是,Stable Diffusion此前也能夠實現類似功能。只要涂抹掉想替換的圖像元素,再輸入文本提示就可以。

這一回,Grounded SAM能夠省去手動選區這個步驟,直接通過文本描述來控制。

另外結合BLIP(Bootstrapping Language-Image Pre-training),生成圖片標題、提取標簽,再生成物體box和mask。

目前,還有更多有趣的功能正在開發中。

比如人物方面的一些拓展:更換衣服、發色、膚色等。

圖片


圖片

具體食用方法也已在GitHub上給出。項目需要Python 3.8以上版本,pytorch 1.7以上版本,torchvision 0.8以上版本,并要安裝相關依賴項。具體內容可看GitHub項目頁。

該研究團隊來自IDEA研究院(粵港澳大灣區數字經濟研究院)。

公開消息顯示,該研究院是一所面向人工智能、數字經濟產業及前沿科技的國際化創新型研究機構,前微軟亞研院首席科學家、前微軟全球智行副總裁沈向洋博士擔任創始人及理事長。

One More Thing

對于Grounded SAM的未來工作,團隊有幾點展望:

  • 自動生成圖像構成新數據集
  • 具有分割預訓練的強大基礎模型
  • 和(Chat-)GPT合作
  • 構成一個自動生成圖像標簽、box和mask的pipeline,并能生成新的圖像。

值得一提的是,該項目的團隊成員中,有不少都是知乎AI領域活躍的答主,這次也在知乎上自答了關于Grounded SAM的內容,感興趣的童鞋可以去留言請教~

圖片

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-06-09 09:50:00

VeactReact

2017-12-15 17:14:10

云端

2023-03-13 13:40:20

機器學習AI

2023-05-10 14:58:06

開源模型

2015-07-30 12:27:30

重郵華為

2020-12-13 13:40:22

健康碼移動應用

2015-05-06 13:52:52

微軟外媒

2024-01-24 09:24:19

自動駕駛算法

2024-08-26 07:40:00

AI訓練

2025-03-13 10:18:42

2014-07-29 13:25:43

WWDC 2014 S

2023-09-14 09:44:29

2024-04-23 13:38:00

AI數據

2012-02-28 09:54:01

Windows 8微軟賬戶

2025-04-16 02:55:00

2022-11-29 15:15:47

AI模型

2023-09-19 09:22:54

數據訓練

2025-02-03 12:16:01

視頻生成AI

2023-07-17 08:03:03

Shell腳本SQL

2024-06-24 13:35:58

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文字幕1区2区3区 日韩在线视频免费观看 | 天天躁日日躁狠狠很躁 | 亚洲欧美bt | 国产精品久久精品 | 久久亚洲国产 | 久久亚洲欧美日韩精品专区 | 欧美日韩不卡合集视频 | 久热久热| 国产免费观看久久黄av片涩av | 国产一二三区电影 | 日韩在线看片 | 亚洲第一视频 | 天天夜夜操 | 日韩一级免费观看 | 国产高清精品一区二区三区 | 欧美成人一区二区三区 | 色婷婷综合久久久中字幕精品久久 | 日本在线播放一区二区 | 呦呦在线视频 | 亚洲视频在线看 | 国产91精品久久久久久久网曝门 | 欧美日韩一 | 国产乱码精品一区二区三区中文 | 欧洲视频一区二区 | 国产一区二区三区在线免费观看 | 午夜在线视频 | 国产精品久久久久久久久动漫 | 亚洲三区在线播放 | 国产精品久久久久影院色老大 | 欧美日韩在线一区 | 亚洲欧美日韩电影 | 精品av | 在线观看国产 | 久久久久久成人网 | 91免费入口 | a在线观看| 一级中国毛片 | 黄色免费观看网站 | 精品一区二区三区中文字幕 | 精品av久久久久电影 | 激情国产在线 |