成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本

發(fā)布于 2024-11-27 15:42
瀏覽
0收藏

晚上發(fā)現(xiàn)kimi也更新了,之前網(wǎng)上流傳的kimi在數(shù)學(xué)上對標(biāo)o1的模型,可以測試了。

感覺有點迫于deepseek的壓力了,本來應(yīng)該是國內(nèi)第一個的,長推理、類o1的模型,現(xiàn)在變成了第二個。

模型版本叫k0-math,在數(shù)學(xué)上的效果也是對標(biāo)openai-o1,官方也僅僅表示說在數(shù)學(xué)能力上較強。

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

來自官方帖子https://mp.weixin.qq.com/s/g4DltigncX-4sfaQ6Qn1zA

但我非要測試看看在文本推理上的效果如何。

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測試界面是側(cè)邊欄的小眼鏡圖標(biāo),進(jìn)來直接就可以測試,相較于deepseek-r1模型,k0-math沒有次數(shù)限制,隨便玩。

但不同之處在于,推理過程和結(jié)果就是在一起,

下面主要進(jìn)行一些測試,都是在之前??測試deepseek-r1的題目??:

還是先測測數(shù)據(jù)能力

  • 2024年年高考全國甲卷數(shù)學(xué)(文)試題

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

結(jié)果正確,

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

  • 2024年高考全國甲卷數(shù)學(xué)(理)試題

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

結(jié)果正確,C方程為

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

;

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

數(shù)學(xué)測試了比較多,基本上都是正確的,并且推理過程也很完整,有自我糾錯的過程。

這類模型最有意思的地方在于推理過程,看著模型不斷推理、不斷自證、推翻、再自證的過程,真的很有意思,可以看到未來大模型的希望。

下面就是我要測試的一些文本問題了,依舊老幾樣:

  • 小紅有2個兄弟,3個姐妹,那么小紅的兄弟有幾個姐妹

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

回答正確,一開始得出結(jié)論是3,但是又仔細(xì)分析了一下,自我糾正過來,推理過程我很滿意,看過我之前評測的懂得都懂。

  • 用水來兌水,得到的是濃水還是稀水

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

結(jié)果正確,依然是相同濃度的水,其實前面也說了,沒有濃度的概念。

  • 未來的某天,李同學(xué)在實驗室制作超導(dǎo)磁懸浮材料時,意外發(fā)現(xiàn)實驗室的老鼠在空中飛,分析發(fā)現(xiàn),是因為老鼠不小心吃了磁懸浮材料。第二天,李同學(xué)又發(fā)現(xiàn)實驗室的蛇也在空中飛,分析發(fā)現(xiàn),是因為蛇吃了老鼠。第三天,李同學(xué)又發(fā)現(xiàn)實驗室的老鷹也在空中飛,你認(rèn)為其原因是

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

老鷹飛飛,這道題本身就有一點爭議,反正deepseek也是類似的答案,但我依然覺得沒有答到我的“心趴”上。

  • 將“I love Kimi-Chat”的所有字母反過來寫

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

我覺得不對,我不能理解為啥要把 “I love”給翻譯一下,測了好幾次,換了問法也類似,就是“我愛”。

不知道反轉(zhuǎn)問題為啥這么難,之前的deepseek也沒對,k0-math也沒對。

  • strawberry有幾個r

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

測測Kimi新開的k0-math,你是數(shù)學(xué)模型,但我就測文本-AI.x社區(qū)

答案正確,數(shù)的沒錯,完美。

寫在最后

整體效果還是不錯的,數(shù)學(xué)測了一些,還蠻強的,文本推理還有點改進(jìn),但是人家畢竟也是k0-math模型,都強調(diào)數(shù)學(xué)了,我狂測文本也是有點不講道理啦。

本文轉(zhuǎn)載自 ??NLP工作站??,作者: 劉聰NLP

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 成人网av| av福利网 | 久久久久9999亚洲精品 | 久久一起草 | 日本不卡一区二区三区 | 日韩一区二区三区精品 | 国产大毛片 | 亚洲国产成人精品女人久久久 | 亚洲精品久久久久久久久久久 | 亚洲综合二区 | 精品在线一区二区三区 | 九九热国产视频 | 理论片免费在线观看 | 精品久久久久久 | 视频一区在线播放 | 91黄在线观看 | 超碰电影| 中文字幕第十页 | 日韩欧美国产精品一区 | 国产成在线观看免费视频 | jlzzjlzz国产精品久久 | 国产高清在线精品一区二区三区 | 四虎影音| 免费能直接在线观看黄的视频 | 欧美日本韩国一区二区三区 | 亚洲精品一区在线 | 超碰高清 | 国产美女精品视频 | 高清成人免费视频 | 成人亚洲视频 | 国产精品日韩一区二区 | 男女爱爱福利视频 | 亚洲精品视频免费观看 | 国产精品福利久久久 | 午夜小视频免费观看 | 伊人二区 | 欧美精品一区在线发布 | 99视频在线免费观看 | 日韩久久久久久久久久久 | 一区二区三区欧美在线 | 日韩精品视频在线 |