很突然!騰訊版DeepSeek可以生圖了,路徑可行!實測翻車,搞不清清朝服飾風格,文字和人物理解尚有不足
原創五一過后,元寶來了一波新動作,元寶版本的DeepSeek可以生圖了!當然混元肯定也可以。不論選哪個模型,只需要一句話,元寶都能直接生成圖片。
據官方介紹,這項功能,結合了騰訊混元最新文生圖模型,已在元寶全端上線。
大家都知道,目前DeepSeek雖然具備圖像理解能力,但并不能直接生成圖片,這次騰訊又搶先為DS彌補了這個缺憾。
不過小編發現,目前元寶版DS的作畫功能,只能是“文生圖”,而不能“圖生圖”。
原理上其實就是讓元寶版DeepSeek理解提示詞,然后調用元寶的生圖工具來生成圖片。
當你給出一句話指令,元寶會發散、“擴寫”成更完整、清晰的提示詞,再生成高質量、復雜、有想象力的圖像。
雖然不能圖生圖,但模型會給你生成一段理解你需求的提示詞,輔助生成。
小編第時間嘗鮮了下,先是驚艷,然后則是有點翻車的吐槽感。比如讓他生成一張梵高的星空,肯定沒的說,很有梵高的抽象感。再比如讓她根據我一張五一時節拍下的鮮花美景變成日系動漫風格,也生成了一張唯美的圖片。
但緊接著,翻車圖片接連來了:最近張杰演唱會很多,我發了一張張杰的簽名墻上拍照,讓元寶版DS生成一張清廷版本的。
元寶版DS倒是能理解我的訴求,并生成了一段完美的提示詞:
「清朝宮廷風格,一群年輕人身著錦緞長袍與馬蹄袖褂子,在藍色簽名墻前互動。中央人物穿白色刺繡龍紋長袍張開雙臂,其他人手持折扇或團扇,背景保留“下一個永遠”標語但改為毛筆書法字體,畫面融合現代活動活力感與清代服飾細節,柔光濾鏡,4:3比例」
結果可好,生成的圖片既不是清廷風格,帽子高得像一個當差的衙役,而且漢字識別的也不是很好。
另一個翻車點,也是在人物的發飾和人物年齡上,比如戴著虎帽的小孩,他會將所有女生的發飾上都生成一個虎帽。看得小編哭笑不得。只能說,現在的元寶版生圖功能任重道遠。期待后續的迭代!