實測騰訊開源的Hunyuan-Large大模型,感覺......
今天突然發現騰訊開源混元大模型,十分震驚,騰訊也來擠開源賽道了,只能說大模型開源越來越繁華了。
這次開源的主要是MoE模型,有Base模型和Instruct模型,總參數量389B,激活參數52B,支持最大上下文256K。
Github: https://github.com/Tencent/Tencent-Hunyuan-Large
Paper: https://arxiv.org/pdf/2411.02265
HF: https://huggingface.co/tencent/Tencent-Hunyuan-Large
由于時間關系,還沒仔細的閱讀paper,掃了一眼指標,不知道為啥沒跟Qwen2.5-72B比較,但是我單獨看了幾個榜單,是要好一些的。
Base模型
Instruct模型
由于本人沒有16張H800,但又像測試一下騰訊新開源的Hunyuan-Large,因此在官方提供huggingface spaces上進行的測試。
https://huggingface.co/spaces/tencent/Hunyuan-Large
- 將“I love Hunyuan-Large”的所有字母反過來寫
說明:理解了意圖,但是輸出結果不正確,沒有將所有字母反過來。
- 9.9和9.11誰大
說明:結果正確。
- strawberry有幾個r
說明:結果錯誤,感覺還是tokenizer的問題,但很奇怪為啥沒單獨優化一下。
- 監獄里的都是犯人,為什么警察不去監獄里抓壞人
說明:結果正確
- 生蠔煮熟了叫什么?
說明:熟蠔。。。。。。。
- 用水來兌水,得到的是濃水還是稀水
說明:稀水。。。。。。。。
- 小紅有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹
說明:沒理解,小紅是女生,字母說呢,合理也不合理,反正我覺得小紅是女生。
- 小紅(女)有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹
說明:結果正確
- 未來的某天,李同學在實驗室制作超導磁懸浮材料時,意外發現實驗室的老鼠在空中飛,分析發現,是因為老鼠不小心吃了磁懸浮材料。第二天,李同學又發現實驗室的蛇也在空中飛,分析發現,是因為蛇吃了老鼠。第三天,李同學又發現實驗室的老鷹也在空中飛,你認為其原因是
說明:按照我的推理是對的,但是不應該按照事實知識回答嘛。
就是測試了一下,感覺沒有其他人說的那么強。不過也是現在開源最大的MoE模型了吧。
本文轉載自 ??NLP工作站??,作者: 劉聰NLP
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦