成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Kimi版o1實裝上線,這里是我們的一手測試

人工智能 新聞
就在數學模型k0-math剛發布后沒幾天,視覺思考模型k1就來了,多項思考推理測試超越Open AI o1。

Kimi新模型來襲,且發布即上線可用!

就在數學模型k0-math剛發布后沒幾天,視覺思考模型k1就來了,多項思考推理測試超越Open AI o1。

圖片

官方表示,基于強化學習,k1原生支持端到端圖像理解和思維鏈技術。

換句話說,k1能夠深入圖片信息抽絲剝繭,層層推理,由此解鎖了包括幾何圖形題在內更加全面的數學能力。

圖片

模型思索答案的全過程,belike:

圖片

并且k1的思考能力不僅僅局限于數學領域,正所謂“學好數理化,走遍天下都不怕”。

在官方曬出的數理化基準測試中,Kimi k1-preview表現全面超越OpenAI o1、GPT-4o、Claude 3.5 Sonnect。

圖片

這次Kimi新模型的發布還是直接上線可玩的那種,APP或是網頁版找到“Kimi視覺思考版”即可上傳圖片點擊使用。

圖片

話不多說,這就趕緊來實測一波~

數理化第一波實測

先來一道考研數學真題小試牛刀,這道題目涉及的知識點包括曲面積分、高斯定理等:

圖片

之前在量子位的實測中,這道題難住了GPT-4o。

而Kimi視覺思考版經過一步步詳細推理,第一次就給出了正確答案。

圖片

它自己也表示進行了檢查沒有錯誤,“對這個答案非常有信心”。

圖片

再來一道曾經測試過o1的數學概論題。

一個外星人來到地球后,第1天有相等的可能選擇以下四件事中的一件完成:

自我毀滅;分裂成兩個外星人;分裂成三個外星人;什么都不做。

此后每天,每個外星人均會做1次選擇,且彼此之間相互獨立,求地球上最終沒有外星人的概率。

Kimi視覺思考版也一次就做對了:

圖片

數學能力看完后,再來小試一下物理題。

下面這道題是大學物理中的光學題:

在雙縫干涉實驗中,波長λ=550nm的單色平行光垂直入射到縫間距a=2×10??m的雙縫上,屏到雙縫的距離D=2m。求中央明紋兩側的兩條第10級明紋中心的間距。

Kimi視覺思考版成功回答對。

而且其實它早早就給出了正確答案,但還是嚴謹地用不同的方法反復驗證確認后給出答案。

圖片

最后再來一道“化學題”(doge)

Candy, Happy, Bacon, Scary, Brain, House

Which is the odd one?

Hint: Chemistry

Kimi視覺思考版在推理過程中幾經曲折,但最后答案還是正確的(happy)。

圖片

除了發布新模型,k1背后的的技術大方向也被月之暗面公開了。

基于強化學習的新一代推理模型

據介紹,k1是他們基于強化學習技術的新一代模型,稱為思考模型,真正意義上實現了端到端的圖像理解和思考能力。

從模型訓練上來看,分為兩個階段:先通過預訓練得到基礎模型,再在基礎模型上進行強化學習后訓練。

最為關鍵的是,k1遵循強化學習Scaling Law,在強化學習后訓練在數據質量和學習效率方面做了進一步優化。

傳統基于文本的推理模型,或者不支持圖像信息輸入,或者需要借助外部OCR/視覺模型進行轉換,效果有明顯損失。

而Kimi視覺思考版由于是原生的端到端視覺推理模型,視覺+推理,可直接理解圖片信息并進行深度推理。

“噪聲”場景,即拍攝圖片模糊、手寫字跡潦草等情況下,性能損失幅度也較小。

圖片
圖片

既然如此,把思路打開,除了讓它做數理化推理題,或許還可以拿一堆圖讓它幫忙推理出任何我想知道的內容。

比如把朋友的“歌單”截圖發給它,讓它給我分析一下這位朋友的MBTI。

你還別說,k1的推理有理有據,先理解MBTI是什么,然后像偵探似的仔細分析圖片中的曲目并進行分類,接著尋找這些歌手、風格之間的相似之處。

它甚至還會“平衡矛盾特征”,即使給出了猜測還會多加一步“驗證”。

圖片
圖片

最終才會給出一個比較合理的猜測。

圖片

再比如,或者還可以拿出這么一份字跡潦草模糊的手寫稿,讓它幫我推理出這是誰寫的、筆記內容在講什么。

圖片

思路再次被打開。

圖片圖片

最后不得不說的是,最近這幾天國內外大模型新進展真不少,前有谷歌,現在還有Kimi,OpenAI“圣誕節直播12天”可謂是被一而再再而三的“狙擊”了。

你覺得Kimi新模型的表現如何?感興趣的童鞋不妨親自上手考考它~

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-11-04 09:00:00

2024-12-16 16:05:34

2025-01-21 09:00:00

2014-02-17 10:05:34

Log項目

2015-04-02 15:28:38

小米接線板

2024-12-06 08:36:31

2024-10-05 12:00:00

2024-12-06 11:44:48

Pro模式AI人工智能

2023-07-16 22:57:38

代碼場景業務

2023-08-24 21:49:54

人工智能高端算法工程師

2025-01-21 13:15:15

2024-10-05 00:00:00

2024-11-07 15:40:00

2024-12-06 08:23:40

2025-04-08 09:15:00

AI論文實測

2025-01-26 08:40:00

AI模型預測

2024-11-25 08:30:00

2024-09-24 11:01:03

2013-04-17 10:30:07

GlassGoogle
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: www.99热.com| 2018天天干天天操 | 超碰97人人人人人蜜桃 | 亚洲一区二区三区在线视频 | 国产日韩欧美综合 | 一区二区三区免费 | 精品一区二区三区四区五区 | 亚洲福利av | 天天色天天射天天干 | 婷婷去俺也去 | 免费看黄视频网站 | 少妇特黄a一区二区三区88av | 中文字幕一区二区三区精彩视频 | 国产免费a| 久草网址| 精品视频国产 | 国产精品69av | 国产精品久久久久久久久久久免费看 | 国产精品久久久久久久久免费软件 | 亚欧洲精品在线视频免费观看 | 日韩国产专区 | 爱高潮www亚洲精品 中文字幕免费视频 | www.成人免费视频 | 中文字幕免费视频 | 四虎伊人 | 国产精品一区二区视频 | 中文字幕av中文字幕 | 国内精品视频在线 | 九九热在线视频观看这里只有精品 | 999久久久久久久 | 在线看片国产 | 欧美福利视频一区 | 国产成人精品免费 | 国产精品毛片一区二区在线看 | 91毛片在线看 | 久久精品国产免费一区二区三区 | 国产真实精品久久二三区 | 亚洲国产激情 | 精品国产一区二区在线 | 久久久久久久久中文字幕 | 黄a在线观看 |