成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<option id="qcwyy"></option>

<acronym id="qcwyy"></acronym>

<dl id="qcwyy"><del id="qcwyy"></del></dl>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集

輕薄滴假象

發(fā)布于 2024-4-22 09:45

瀏覽

0收藏

隨著人工智能的發(fā)展，語(yǔ)言模型和生成模型獲得了大量的成功并且在設(shè)計(jì)模型的過(guò)程中，模型的參數(shù)量也越來(lái)越大。對(duì)于細(xì)粒度理解任務(wù)，模型參數(shù)量也同樣在增加。然而目前現(xiàn)有的數(shù)據(jù)集存在規(guī)模和精度的矛盾，例如 SA-1B 數(shù)據(jù)集中 99.1% 的 mask 都是機(jī)器生成的，但沒(méi)有賦予語(yǔ)義的標(biāo)簽，而其他一些公開(kāi)數(shù)據(jù)集也同樣存在精度問(wèn)題并且這些數(shù)據(jù)集的規(guī)模一般都比較小。

近期，字節(jié)跳動(dòng)提出了新一代細(xì)粒度理解的數(shù)據(jù)集，針對(duì)當(dāng)代深度學(xué)習(xí)模型的設(shè)計(jì)需求，給總量為 383K 的圖片進(jìn)行了全景分割的人工標(biāo)注，最后達(dá)到了 5.18M 張 mask，是至今最大規(guī)模的帶人工標(biāo)簽的全景分割理解數(shù)據(jù)集，命名為 COCONut。該成果已入選 CVPR2024。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

論文鏈接：https://arxiv.org/abs/2404.08639
代碼和數(shù)據(jù)集鏈接: https://xdeng7.github.io/coconut.github.io/ ?

視頻展示了 COCONut 的單張圖片的 mask 密度以及語(yǔ)義類別的統(tǒng)計(jì)，可以看出，數(shù)據(jù)集的語(yǔ)義豐富以及 mask 分割粒度精細(xì)。該數(shù)據(jù)集還支持多種理解任務(wù)，例如全景分割，實(shí)例分割，語(yǔ)義分割，目標(biāo)檢測(cè)，語(yǔ)義控制生成和開(kāi)放詞匯分割，在多項(xiàng)任務(wù)上，僅通過(guò)替換數(shù)據(jù)集就達(dá)到了明顯的性能提升。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

標(biāo)注方法

通常只采用人工標(biāo)注是非常昂貴的，這也是目前現(xiàn)存的大多數(shù)公開(kāi)數(shù)據(jù)集規(guī)模上不去的一個(gè)重要原因。還有一些數(shù)據(jù)集直接使用模型生成的標(biāo)簽，但往往這種生成的標(biāo)簽對(duì)模型的訓(xùn)練不會(huì)有太大的提高，本文也驗(yàn)證了這一點(diǎn)。所以本文提出了一種新穎的標(biāo)注方式，結(jié)合人工的半自動(dòng)標(biāo)簽生成。既能保證數(shù)據(jù)標(biāo)注的精度又能實(shí)現(xiàn)人工勞動(dòng)力的節(jié)省成本，同時(shí)還能加速標(biāo)注過(guò)程。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

標(biāo)注精度對(duì)比

研究者把 COCONut 和 COCO 在同一張圖上的標(biāo)注進(jìn)行對(duì)比。從下圖的對(duì)比可以看到本文提出的標(biāo)注方法達(dá)到了和純?nèi)斯び?Photoshop 標(biāo)注幾乎一致的精度，但是在標(biāo)注速度上提高了 10 倍以上。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

COCONut 數(shù)據(jù)集詳情

和已有的 COCO 數(shù)據(jù)集相比，數(shù)據(jù)集各個(gè)類別的分布比較相近，但是在每張圖的 mask 總量上是超過(guò) COCO 數(shù)據(jù)集的，尤其是有大量單張圖片有超過(guò) 100 張 mask 的情況，由此說(shuō)明了 COCONut 的標(biāo)注更為精細(xì)，粒度分割更密集。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

實(shí)驗(yàn)驗(yàn)證

除了提出一個(gè)更好的訓(xùn)練集，研究者還發(fā)現(xiàn)現(xiàn)有的驗(yàn)證集不能很好的體現(xiàn)模型性能的提升，因此本文還提出了一個(gè)更加富有挑戰(zhàn)性的、可以反映模型的提升的測(cè)試集，命名為 COCONut-val. 從下表可以看到，僅替換數(shù)據(jù)集，更高精度的訓(xùn)練集可以帶來(lái)模型很大的提升，例如在全景分割上達(dá)到超過(guò) 4 個(gè)點(diǎn)的 PQ。然而當(dāng)訓(xùn)練集的規(guī)模增加了之后，可以發(fā)現(xiàn)，用現(xiàn)有的測(cè)試集做測(cè)試并不能反映出模型的提升，而 COCONut-val 則能反映出模型在增加了訓(xùn)練集數(shù)據(jù)量之后仍然有明顯的提升。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

下圖為驗(yàn)證集語(yǔ)義類別和 mask 密度的對(duì)比，可以看出新提出的驗(yàn)證集更具有挑戰(zhàn)性，更能反映模型的提升。

字節(jié)提出新一代數(shù)據(jù)集COCONut，比COCO粒度分割更密集-AI.x社區(qū)

了解更多實(shí)驗(yàn)結(jié)果可參考原論文，團(tuán)隊(duì)后續(xù)將在 GitHub 主頁(yè)提供數(shù)據(jù)集和相應(yīng)的模型公開(kāi)下載。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)

智能創(chuàng)作團(tuán)隊(duì)是字節(jié)跳動(dòng) AI & 多媒體技術(shù)團(tuán)隊(duì)，覆蓋了計(jì)算機(jī)視覺(jué)、音視頻編輯、特效處理等技術(shù)領(lǐng)域，借助公司豐富的業(yè)務(wù)場(chǎng)景、基礎(chǔ)設(shè)施資源和技術(shù)協(xié)作氛圍，實(shí)現(xiàn)了前沿算法 - 工程系統(tǒng) - 產(chǎn)品全鏈路的閉環(huán)，旨在以多種形式為公司內(nèi)部各業(yè)務(wù)提供業(yè)界前沿的內(nèi)容理解、內(nèi)容創(chuàng)作、互動(dòng)體驗(yàn)與消費(fèi)的能力和行業(yè)解決方案。

目前，智能創(chuàng)作團(tuán)隊(duì)已通過(guò)字節(jié)跳動(dòng)旗下的云服務(wù)平臺(tái)火山引擎向企業(yè)開(kāi)放技術(shù)能力和服務(wù)。更多大模型算法相關(guān)崗位開(kāi)放中。

本文轉(zhuǎn)自機(jī)器之心，作者：機(jī)器之心

原文鏈接:??https://mp.weixin.qq.com/s/_yqdnpKl03EYMgdKKwoABg??

標(biāo)簽

數(shù)據(jù)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

極長(zhǎng)序列、極快速度：面向新一代高效大語(yǔ)言模型的LASP序列并行

輕薄滴假象 ? 2742瀏覽 ? 0回復(fù)
新一代智能助手GPT-4o與Project Astra孰弱孰強(qiáng)，OpenAI與谷歌拉開(kāi)競(jìng)賽帷幕

xuxiangda ? 5110瀏覽 ? 0回復(fù)
這家世界模型公司發(fā)布中國(guó)版Sora級(jí)視頻生成大模型，走向世界模型打造新一代數(shù)據(jù)引擎

輕薄滴假象 ? 3351瀏覽 ? 0回復(fù)
YOLOv9：深度解析新一代實(shí)時(shí)目標(biāo)檢測(cè)王者

sword_hero ? 6419瀏覽 ? 0回復(fù)
微軟重磅開(kāi)源 GraphRAG：新一代 RAG 技術(shù)來(lái)了！

玄姐聊AGI ? 6260瀏覽 ? 0回復(fù)
新一代的交互形式LUI（language user interface）到來(lái)，微軟為它架了一座橋

Syrupup ? 3554瀏覽 ? 0回復(fù)
視頻生成控制提升幾十倍，新一代輕量級(jí)ControlNeXt火了，賈佳亞團(tuán)隊(duì)正挑戰(zhàn)Scaling Law

輕薄滴假象 ? 2576瀏覽 ? 0回復(fù)
下一代RAG：MemoRAG

PaperAgent ? 3174瀏覽 ? 0回復(fù)
探索阿里通義千問(wèn) Qwen2.5：新一代開(kāi)源大模型的卓越力量

穿越時(shí)空111 ? 5545瀏覽 ? 0回復(fù)
Zyphra發(fā)布Zamba2-7B：新一代高性能小型語(yǔ)言模型

Halo咯咯 ? 2746瀏覽 ? 0回復(fù)
Text2SQL 新一代解決方案Tool-SQL，基于LLM和Agent智能體實(shí)現(xiàn)，效果提升顯著

AI博物院 ? 6090瀏覽 ? 0回復(fù)
LLM合集：微軟開(kāi)源新一代視頻token化方法VidTok，打造高性能視頻Token化解決方案

AIPaperDaily ? 2542瀏覽 ? 0回復(fù)
為什么多模態(tài)AI是下一個(gè)風(fēng)口？深度解讀新一代LLM

芝士AI吃魚(yú) ? 5108瀏覽 ? 0回復(fù)
直擊痛點(diǎn)，新一代身份保持視頻生成解決方案！阿里等提出FantasyID:多視角與3D融合！

angel ? 2057瀏覽 ? 0回復(fù)
別搞 GraphRAG 了，擁抱新一代 RAG 范式 DeepSearcher

玄姐聊AGI ? 2965瀏覽 ? 0回復(fù)
新一代視頻修復(fù)技術(shù)FloED性能超越所有擴(kuò)散模型! | 港科大&達(dá)摩院

angel ? 1524瀏覽 ? 0回復(fù)
別搞 GraphRAG 了，擁抱新一代 RAG 范式 DeepSearcher

玄姐聊AGI ? 1946瀏覽 ? 0回復(fù)
一文了解LangGraph是什么？——構(gòu)建智能體的新一代框架

AI小新 ? 2621瀏覽 ? 0回復(fù)
Mem0：新一代 AI 智能體的 MCP 持久化記憶架構(gòu)體系

玄姐聊AGI ? 1321瀏覽 ? 0回復(fù)

輕薄滴假象

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

DeepSeek一口氣開(kāi)源3個(gè)項(xiàng)目，還有梁文鋒親自參與，昨晚API大降價(jià) 2025-02-27 12:40:06發(fā)布
全球首個(gè)AI CUDA工程師來(lái)了！將PyTorch原生實(shí)現(xiàn)提速10-100倍 2025-02-21 13:20:31發(fā)布

熱門(mén)推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒(méi)問(wèn)題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

AI Agents開(kāi)源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇：大模型一定就比小模型好？谷歌的這項(xiàng)研究說(shuō)不一定

下一篇：跳舞時(shí)飛揚(yáng)的裙擺，AI也能高度還原了，南洋理工提出動(dòng)態(tài)人體渲染新范式

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：超碰97人人人人人蜜桃 | 久久久久国产 | 武道仙尊动漫在线观看 | 国产免费视频 | 精品久久1 | 久久久www成人免费精品 | 久久伊人一区二区 | 亚洲欧美日韩国产综合 | 久久久美女 | www精品 | 久久岛国 | 亚洲一二三区精品 | 51ⅴ精品国产91久久久久久 | 日韩福利 | 日本精品一区二区 | 日本a在线 | 免费一级欧美在线观看视频 | 黄色大片免费网站 | 狠狠的干狠狠的操 | 亚洲一区二区免费看 | 日本一本在线 | 一a级片 | 国产精品特级毛片一区二区三区 | 国产99精品 | 亚洲国产aⅴ成人精品无吗综合国产在线 | 久久成人免费视频 | 亚洲日本欧美中文幕 | 国产精品久久久久久婷婷天堂 | 欧美精品综合在线 | 有码在线 | 精品视频99| 国产欧美日韩在线一区 | 在线成人 | 免费一级黄色电影 | 91在线精品一区二区 | 精品久久久久久 | 一区二区三区四区av | 国产在线精品一区二区 | 97操操 | 99精品国产一区二区三区 | 国产区在线观看 |

^{<dl id="s2y2s"></dl>}