圖像編輯革命!FLUX.1 Kontext [dev]震撼開源:挑戰(zhàn)GPT-4o的圖像編輯 原創(chuàng)
剛剛,AI圖像編輯領(lǐng)域迎來里程碑時刻:黑森林實驗室(Black Forest Labs)正式開源其旗艦?zāi)P虵LUX.1 Kontext [dev] ,以120億參數(shù)和角色一致性碾壓GPT-4o,宣告圖像生成工具的新的變革。
?
?
最難得的是,因其開源的性質(zhì),F(xiàn)LUX.1 Kontext [dev] 采用非商業(yè)許可(FLUX.1 Non-Commercial License),免費開放權(quán)重與代碼,讓普通開發(fā)者僅憑消費級顯卡即可部署體驗,徹底打破了閉源巨頭壟斷的高墻。
?
在權(quán)威測試平臺KontextBench的評估中,它在全局/局部編輯、文字植入、風格遷移等任務(wù)上,全面超越字節(jié)Bagel、HiDream-E1等競品,甚至擊敗Google Gemini-Flash等閉源模型。
?
?
在圖像編輯核心功能創(chuàng)新上,模型支持迭代編輯,擅長在各種場景和環(huán)境集中保留角色,并實現(xiàn)局部和全局精確編輯。
?
【Kontext Dev Edit 示例】
?
技術(shù)細節(jié)方面,該模型通過“生成流匹配架構(gòu)”實現(xiàn)多模態(tài)融合,將文本指令與參考圖像編碼為統(tǒng)一語義流。
?
簡單來說,用戶上傳一張照片并輸入“給她戴上墨鏡”“背景換成雪山”,模型不僅能精準修改目標區(qū)域,還能在十次、二十次連續(xù)編輯中始終保持人物五官、服裝紋理、光影角度毫厘不差,這徹底根治了傳統(tǒng)AI修圖時迭代就崩的痛點!
?
項目團隊獨創(chuàng)了3D旋轉(zhuǎn)位置編碼技術(shù),可以讓模型像人類設(shè)計師一樣理解圖像中的空間結(jié)構(gòu)與語義關(guān)聯(lián)。
?
目前,模型支持ComfyUI、Diffusers、TensorRT等主流框架,用戶可以通過簡單的提示詞實現(xiàn)復雜的圖像編輯任務(wù),無需繁瑣的配置或額外的訓練流程。同時,團隊還通過與NVIDIA深度合作,為Blackwell架構(gòu)優(yōu)化FP4 TensorRT版本 ,使推理速度較常規(guī)方案大幅提升。
?
?
開發(fā)者若想快速體驗,可在Hugging Face下載權(quán)重,或通過Replicate平臺API一鍵調(diào)用。
?
高度的兼容性和易用性,使其成為開發(fā)者、AIGC創(chuàng)作者以及AI愛好者的最優(yōu)選。在實際應(yīng)用中,這樣的AI技術(shù)創(chuàng)新具有巨大價值,這意味著設(shè)計師用不僅能用一句提示詞替換Logo文字,還能保持字體陰影分毫不移。
?
作為Black Forest Labs的又一力作,F(xiàn)LUX.1Kontext [dev]的發(fā)布標志著AI圖像編輯技術(shù)邁向了一個新高度。
?
這場開源風暴,遠不止于技術(shù)競速。FLUX.1 Kontext [dev] 的開源,撕開了一條新路:它重新定義了AI修圖并讓AI真正成為可靠的生產(chǎn)力工具。
?
