成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

編程表現比肩ChatGPT,這個新模型能力很強大

發布于 2024-9-6 14:38
瀏覽
0收藏

智譜8月底在國際數據挖掘與知識發現大會(KDD)上發布了新一代自主研發的新旗艦模型(GLM-4-Plus、GLM-4V-Plus、CogView-3-Plus),此次更新覆蓋了語言理解、圖像生成、視頻理解等多個方面,并達到了國際第一梯隊的水平。

本次發布較之前有以下更新:

  • GLM-4-Plus(大語言模型):語言理解和長文本處理能力全面提升,支持128K上下文和多路Function Call。
  • GLM-4V-Plus(圖像和視頻理解模型):具備卓越的圖像和視頻理解能力,支持8K上下文和多圖輸入,擁有時間感知能力。
  • CogView-3-Plus:圖像生成效果接近MJ-V6及FLUX等模型,支持精細化圖像編輯。

作為智譜最新一代基座大模型GLM-4-Plus,通過多種方式構造出了海量高質量數據,并利用 PPO等多項技術,有效提升了模型推理、指令遵循等方面的表現,并能夠更好地反映人類偏好。從benchmark上看,與 GPT-4o 等第一梯隊模型差距很小。 

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區圖片

既然,官方說的這么好,那咱們就一定要去嘗嘗鮮,這些模型在智譜的開放平臺( bigmodel.cn )就能體驗。

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

咱也不讓它寫文章,做數學題了,這些網上很多文章都有介紹,咱們就讓它做一次程序員,試試它的編程能力,順便體驗一下sdk的易用性。

我給它出了一道很常見的面試算法題“字符串全排列”,它很干脆的給出了結果,經過筆者驗證,回答正確,看起來這些曾被大家“wow”的能力,在當下已經成為了基本功。這里有一個小細節,筆者在提示詞里增加了不用解釋這樣的描述,GLM-4-Plus沒有啰嗦解釋,這說明指令遵從能力還可以,這一點對于LLM應用開發很重要。

from zhipuai import ZhipuAI

client = ZhipuAI(api_key="...") 

def ai_programmer(task):
    prompt = f"作為一個經驗豐富的程序員,請幫我完成以下任務:{task},僅返回代碼,不用解釋"
    response = client.chat.completions.create(
    model="glm-4-plus",  
    messages=[
        {
            "role": "user",
            "content": prompt
        }
        ],
    )   
    return response.choices[0].message
  

task = "寫一個Python函數,實現字符串abc的全排列"
result = ai_programmer(task)

print(result.content)


# ```python
# def permute_abc(s):
#     if len(s) == 1:
#         return [s]
#     permutations = []
#     for i, char in enumerate(s):
#         remaining = s[:i] + s[i+1:]
#         for p in permute_abc(remaining):
#             permutations.append(char + p)
#     return permutations

# def all_permutations_abc():
#     return permute_abc('abc')
# ```

當然,這個難度不大,很多模型都能做到,那我們調高難度,我拿了前兩天ChatGPT及Cursor逆向工程壓縮特效js的代碼測試了GLM-4-Plus(延伸閱讀:用ChatGPT逆向工程壓縮后的Js代碼,表現驚艷)。

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

glm-4-plus理解了代碼,并給出了詳細的解釋。

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

接著,我讓它對原代碼進行了重構,使其變得更易讀。

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

就從代碼風格,變量、方法命名看,glm-4-plus表現的比chatGPT還要好,能夠準確的起名和注釋。但最后評價好不好,還得實測,筆者照例把它放到了v0chat上,按照同樣的方式,讓它調用glm-4-plus生成的組件,看看能不能還原預期的效果。

編程表現比肩ChatGPT,這個新模型能力很強大-AI.x社區

令人欣喜的是,超乎我的預期的是它一次性的就運行了起來,筆者同時還測試了一些國產模型,他們很遺憾并沒能運行起來,也就無法對比實現的效果。看過之前文章的讀者應該能發現,從實現的還原度來看,glm-4-plus與gpt-4o模型和claude-3.5-sonanet性能還有一些差距。這也反映當下一個事實,國內大模型這一年進步明顯,但尚存差距,我們還得繼續追趕。

總結

AI的世界每天都在變化,而智譜BigModel的發布,無疑是給了我們中國開發者一個大大的驚喜。無論是想做聊天機器人、圖像處理還是視頻分析,只要有創意,都可以嘗試使用它們實現想法,而不用遺憾用不上領先模型的遺憾,這也能進一步激發LLM應用生態的繁榮。

本文轉載自 ??AI工程化??,作者: ully

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 一级日韩| 日韩理论电影在线观看 | 国产h视频| 成人av鲁丝片一区二区小说 | 日韩高清在线观看 | 国产在线对白 | 日韩av免费在线电影 | 国产美女久久久 | 91视频官网 | 欧美13videosex性极品 | 中文字幕成人网 | 性色综合 | 一区二区三区精品视频 | www.日韩系列| 中文字幕精品一区久久久久 | 一区二区三区不卡视频 | 亚洲国产精品久久久久秋霞不卡 | 午夜男人免费视频 | 男女久久久 | 一区二区日本 | av一级一片 | 久久久国 | 欧美精品一区二区三区蜜桃视频 | 日韩免费网站 | 欧美成人专区 | 久久综合九色综合欧美狠狠 | 偷拍自拍在线观看 | 久久久久国产精品午夜一区 | 久久精品女人天堂av | 国产超碰人人爽人人做人人爱 | 精品亚洲一区二区三区四区五区 | 国产精品久久久久久久久图文区 | 中文字幕日韩欧美一区二区三区 | 日韩一区二区在线视频 | 免费观看一级特黄欧美大片 | 999免费网站 | 国产成人精品一区二区三 | 日韩中文字幕在线视频 | 国产这里只有精品 | 一级黄色毛片免费 | 日韩高清一区 |