成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

4B Qwen3逆襲671B DeepSeek!字節(jié)DAPO微調(diào)方法這么猛的嗎

人工智能 新聞
最新模型Jan-nano引起熱議,它在智能體任務(wù)上超過671B的最新版DeepSeek-V3 0528,在SimpleQA基準(zhǔn)上獲得80.7分。

4B小模型極限在哪里?

最新模型Jan-nano引起熱議,它在智能體任務(wù)上超過671B的最新版DeepSeek-V3 0528,在SimpleQA基準(zhǔn)上獲得80.7分。

圖片

先來看一下它的實(shí)際表現(xiàn),包括兩個(gè)任務(wù):

  • 對(duì)研究某公司目前的擴(kuò)張情況,該公司的擴(kuò)張正威脅著另一家公司的市場(chǎng)份額,并撰寫一份可能影響金融公司盡職調(diào)查流程的MBA水平報(bào)告。
  • 匯總今日財(cái)經(jīng)突發(fā)新聞,聚焦令人震驚的消息。

總結(jié)一下,Jan-nano的能力包括:

  • 在正確的提示詞下,可以進(jìn)行深度研究
  • 從搜索結(jié)果中有效地獲取相關(guān)信息
  • 針對(duì)MCP協(xié)議優(yōu)化,可無縫集成各種MCP服務(wù)器調(diào)用工具

再來看一下官方評(píng)估結(jié)果,與它同臺(tái)競(jìng)技的不是閉源方案就是DeepSeek-v3這樣的671B大型MoE模型。

圖片

目前Jan-nano取得最高分80.7%,并且作者透露下一個(gè)版本的目標(biāo)是85%。

圖片

不過研究團(tuán)隊(duì)Menlo Research特別提醒大家,Jan-Nano只是在這一個(gè)指標(biāo)上優(yōu)于Deepseek-671B,并且在測(cè)試中使用了基于MCP的方法。

我們完全理解4B模型有其局限性,但看看它能走到多遠(yuǎn)總是很有趣的。

具體來說,Jano在Qwen3-4B上使用字節(jié)&清華開源的DAPO強(qiáng)化學(xué)習(xí)微調(diào)方法。

圖片

團(tuán)隊(duì)稱將很快發(fā)布詳細(xì)的技術(shù)報(bào)告,敬請(qǐng)期待。

誰是Menlo Research?

Menlo Research是一個(gè)專注于AI和機(jī)器人技術(shù)的開放研發(fā)實(shí)驗(yàn)室,其主要目標(biāo)為構(gòu)建機(jī)器人的”大腦”。

創(chuàng)始人為一對(duì)夫妻D(zhuǎn)aniel Ong與Nicole Zhu,Nicole Zhu在斯坦福讀人機(jī)交互碩士期間休學(xué)創(chuàng)業(yè),此前在谷歌做過高級(jí)工程師。

圖片

Menlo Research堅(jiān)持用戶擁有原則,產(chǎn)品都是開源的,設(shè)計(jì)為離線運(yùn)行或自托管。

圖片

此前Menlo Research的核心產(chǎn)品是Jan,一個(gè)可以100%離線運(yùn)行的開源AI助手應(yīng)用。

Jan被定位為ChatGPT的替代品,曾在推出數(shù)月后,在沒有風(fēng)險(xiǎn)投資支持的情況下超過百萬次下載,

圖片

Jan的長(zhǎng)遠(yuǎn)愿景是成為“自驅(qū)動(dòng)計(jì)算機(jī)”,實(shí)現(xiàn)從用戶操作計(jì)算機(jī)到計(jì)算機(jī)自主操作的轉(zhuǎn)變,具體來說,規(guī)劃中的能力包括。

  • 將用戶指令轉(zhuǎn)化為直接行動(dòng)
  • 跨應(yīng)用程序工作,無需手動(dòng)切換
  • 學(xué)習(xí)用戶的特定工作模式
  • 自主完成重復(fù)性任務(wù)

此外,Menlo Research還在新加坡Echelon展會(huì)上展出了一款人形機(jī)器人。

圖片

Jan-nano模型下載:
https://huggingface.co/Menlo/Jan-nano

Menlo Research:https://menlo.ai

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-04-11 12:10:33

2025-05-01 10:33:59

2025-04-03 06:30:00

2025-03-10 07:00:00

阿里開源QwQ-32B

2025-04-07 08:50:00

模型AI數(shù)據(jù)

2025-05-14 01:00:00

2025-04-03 15:57:48

2025-05-06 00:35:33

2025-03-13 09:12:35

2024-12-27 11:13:16

2025-03-07 08:30:00

2025-02-10 13:35:00

2025-02-03 13:55:20

2022-06-21 11:02:27

系統(tǒng)移植鴻蒙

2022-01-04 15:35:51

鴻蒙HarmonyOS應(yīng)用

2025-03-06 08:11:25

2025-05-14 13:22:08

Qwen3訓(xùn)練小模型

2025-02-17 03:00:00

LLMsMoELLM

2025-03-27 10:28:32

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 亚洲一区二区三区四区五区午夜 | 福利社午夜影院 | 国产成人亚洲精品 | www操操| 亚洲精品久久久 | 特级做a爱片免费69 精品国产鲁一鲁一区二区张丽 | 久久久久九九九九 | 激情91 | 成人在线一区二区 | 在线观看成人免费视频 | 99精品国产一区二区三区 | 久久综合九色综合欧美狠狠 | 国产精品久久久久久久久久三级 | 97久久精品 | 国产成人一区在线 | 亚洲高清一区二区三区 | 在线观看中文字幕 | 午夜爱爱毛片xxxx视频免费看 | 极品一区| 在线免费国产视频 | 亚洲高清在线 | 五月综合激情网 | 在线观看亚洲专区 | 欧美成人一区二区三区 | 色婷婷综合久久久中字幕精品久久 | 欧美一级二级视频 | 亚洲综合色丁香婷婷六月图片 | a级毛片国产| 精产国产伦理一二三区 | 九九精品在线 | 欧美亚洲日本 | 国产在线一区二区三区 | 国产精品成人一区二区三区 | 欧美亚洲另类丝袜综合网动图 | 成人在线小视频 | 欧美日韩在线免费 | 国产一区二区中文字幕 | 国产精品综合视频 | 色眯眯视频在线观看 | 日韩成人免费视频 | 国色天香综合网 |