OpenAI增強(qiáng)ChatGPT“繪畫”能力
OpenAI宣布在ChatGPT中引入一項(xiàng)新功能,可以根據(jù)用戶對話創(chuàng)建獨(dú)特的圖像。該功能可供ChatGPT的Plus和Enterprise用戶使用,便于基于用戶描述進(jìn)行視覺渲染,并支持直接在聊天中進(jìn)行迭代細(xì)化。底層技術(shù)由OpenAI的高級圖像模型DALL·E 3驅(qū)動。
DALL·E 3是OpenAI內(nèi)外多項(xiàng)研究進(jìn)展的結(jié)晶。值得注意的是,它的視覺效果不僅更吸引人,而且更清晰,優(yōu)于前代。它在渲染文本、手和面部特征等復(fù)雜組件方面表現(xiàn)出嫻熟的技巧。增強(qiáng)了對詳細(xì)提示做出反應(yīng)和支持各種縱橫比的能力,這源于先進(jìn)的訓(xùn)練方案。
通過使用尖端的圖像字幕,可以為訓(xùn)練圖像生成更好的文本描述。DALL·E 3通過在這些增強(qiáng)型字幕上的持續(xù)訓(xùn)練產(chǎn)生了一個與用戶提供的描述更加一致的模型。OpenAI的一篇研究論文對這一過程進(jìn)行了全面的探索。
ChatGPT現(xiàn)在可以通過簡單的對話創(chuàng)建獨(dú)特的圖像
安全措施
在部署DALL·E 3時,OpenAI建立了一個強(qiáng)大的安全機(jī)制,以減少有害圖像的產(chǎn)生,其中包括暴力、露骨或宣揚(yáng)仇恨的內(nèi)容。對用戶輸入及其相應(yīng)輸出會先進(jìn)行安全評估。另外初始用戶的反饋和專家評估為改進(jìn)提供了依據(jù),特別是在識別和解決安全檢查中的盲點(diǎn)方面。
該模型以在世藝術(shù)家風(fēng)格或公眾人物去生成圖像的傾向已經(jīng)減少,圖像中的人口代表性也得到了增強(qiáng)。
用戶協(xié)作
OpenAI強(qiáng)調(diào)用戶反饋在完善其產(chǎn)品方面的價值。ChatGPT用戶可以直接與研究團(tuán)隊溝通,報告輸出中的問題或差異。這種反饋回路由廣泛的用戶社區(qū)補(bǔ)充,有助于確保人工智能系統(tǒng)的負(fù)責(zé)任進(jìn)化,與OpenAI的使命保持一致。
來源分類器
OpenAI還在試驗(yàn)一種來源分類器,該分類器旨在確定圖像是否由DALL·E 3生成。在早期的內(nèi)部評估中,當(dāng)圖像未被修改時,它在識別圖像是否由DALL·E生成方面的準(zhǔn)確率超過99%。當(dāng)圖像經(jīng)過常見的修改類型時,如裁剪、調(diào)整大小、JPEG壓縮,或者當(dāng)真實(shí)圖像的文本或剪切被疊加到生成圖像的小部分上時,它的準(zhǔn)確率保持在95%以上。
雖然分類器表明了DALL·E3參與的可能性,但它并沒有提供確鑿的證據(jù)。作為識別人工智能生成內(nèi)容的更廣泛努力的一部分,該工具與其他策略一起,可能在未來發(fā)揮關(guān)鍵作用。
藝術(shù)完整性
最后,DALL·E 3原則上會拒絕模仿在世藝術(shù)家風(fēng)格的圖像生成請求。但藝術(shù)家也可以選擇將他們的創(chuàng)作用于OpenAI訓(xùn)練后續(xù)圖像生成模型。