成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

DeepSeek-R1-0528 更新官方詳解:思考更深、推理更強,整體表現接近 o3

人工智能
DeepSeek R1 模型宣布完成小版本升級,當前版本為 DeepSeek-R1-0528。用戶通過官方網站、App 或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API 也已同步更新,調用方式不變。

5 月 29 日消息,DeepSeek R1 模型昨日宣布完成小版本升級,當前版本為 DeepSeek-R1-0528。用戶通過官方網站、App 或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API 也已同步更新,調用方式不變。

今日晚間,深度求索官方公布了 DeepSeek-R1-0528 更新的詳細升級內容,IT之家附具體介紹如下:

深度思考能力強化

DeepSeek-R1-0528 仍然使用 2024 年 12 月所發(fā)布的 DeepSeek V3 Base 模型作為基座,但在后訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。更新后的 R1 模型在數學、編程與通用邏輯等多個基準測評中取得了當前國內所有模型中首屈一指的優(yōu)異成績,并且在整體表現上已接近其他國際頂尖模型,如 o3 與 Gemini-2.5-Pro。

DeepSeek-R1-0528 在各項評測集上均取得了優(yōu)異表現(基準測試使用 64K 輸出長度;在 Humanity's Last Exam 中,只使用其中的文本題目進行測試)

相較于舊版 R1,新版模型在復雜推理任務中的表現有了顯著提升。例如在 AIME 2025 測試中,新版模型準確率由舊版的 70% 提升至 87.5%。

這一進步得益于模型在推理過程中的思維深度增強:在 AIME 2025 測試集上,舊版模型平均每題使用 12K tokens,而新版模型平均每題使用 23K tokens,表明其在解題過程中進行了更為詳盡和深入的思考。

同時,官方蒸餾 DeepSeek-R1-0528 的思維鏈后訓練 Qwen3-8B Base,得到了 DeepSeek-R1-0528-Qwen3-8B。該 8B 模型在數學測試 AIME 2024 中僅次于 DeepSeek-R1-0528,超越 Qwen3-8B (+10.0%),與 Qwen3-235B 相當。深度求索官方認為,DeepSeek-R1-0528 的思維鏈對于學術界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義。

DeepSeek-R1-0528-Qwen3-8B 等開源模型的 AIME 2024 對比結果

其他能力更新

  • 幻覺改善:新版 DeepSeek R1 針對“幻覺”問題進行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了 45~50% 左右,能夠有效地提供更為準確、可靠的結果。
  • 創(chuàng)意寫作:在舊版 R1 的基礎上,更新后的 R1 模型針對議論文、小說、散文等文體進行了進一步優(yōu)化,能夠輸出篇幅更長、結構內容更完整的長篇作品,同時呈現出更加貼近人類偏好的寫作風格。

  • 工具調用:DeepSeek-R1-0528 支持工具調用(不支持在 thinking 中進行工具調用)。當前模型 Tau-Bench 測評成績?yōu)?airline 53.5% / retail 63.9%,與 OpenAI o1-high 相當,但與 o3-High 以及 Claude 4 Sonnet 仍有差距。

示例為通過 LobeChat 使用 DeepSeek-R1-0528 的工具調用能力得到的網頁文章總結

示例為通過 LobeChat 使用 DeepSeek-R1-0528 的工具調用能力得到的網頁文章總結

此外,DeepSeek-R1-0528 在前端代碼生成、角色扮演等領域的能力均有更新和提升

示例為在網頁端調用 DeepSeek-R1-0528 使用 HTML / CSS / JavaScript 開發(fā)的一個現代簡約風格的單詞卡片應用

示例為在網頁端調用 DeepSeek-R1-0528 使用 HTML / CSS / JavaScript 開發(fā)的一個現代簡約風格的單詞卡片應用

API 更新

API 已同步更新,接口與調用方式保持不變。新版 R1 API 仍支持查看模型思考過程,同時還增加了 Function Calling 和 JsonOutput 的支持

官方對新版 R1 API 中 max_tokens 參數的含義做了調整:現在 max_tokens 用于限制模型單次輸出的總長度(包括思考過程),默認為 32K,最大為 64K。請 API 用戶及時調整 max_tokens 參數以防輸出被提前截斷。

R1 模型的使用方法詳見 API 指南:

https://api-docs.deepseek.com/zh-cn/guides/reasoning_model

本次 R1 更新后,官方網站、小程序、App 端和 API 中的模型上下文長度仍為 64K。如果用戶對更長的上下文長度有需求,可以通過其他第三方平臺調用上下文長度為 128K 的開源版本 R1-0528 模型。

模型開源

DeepSeek-R1-0528 與之前的 DeepSeek-R1 使用同樣的 base 模型,僅改進了后訓練方法。私有化部署時只需要更新 checkpoint 和 tokenizer_config.json(tool calls 相關變動)。模型參數為 685B(其中 14B 為 MTP 層),開源版本上下文長度為 128K(網頁端、App 和 API 提供 64K 上下文)。

DeepSeek-R1-0528 模型權重下載參考:

Model Scope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528

Huggingface:

https://huggingface.co/deepseek-ai/DeepSeek-R1-0528

與舊版本的 DeepSeek-R1 保持一致,此次開源倉庫(包括模型權重)仍然統(tǒng)一采用 MIT License,并允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

責任編輯:龐桂玉 來源: IT之家
相關推薦

2025-06-16 08:11:47

2025-04-22 09:12:00

AI模型數據

2025-02-18 08:15:03

2025-03-10 08:10:00

AI研究安全

2025-03-03 09:00:00

DeepSeekAI人工智能

2025-06-08 14:15:42

2025-04-17 07:23:10

2025-05-29 09:07:37

2024-12-24 16:15:04

2025-05-30 01:00:00

2025-02-03 14:06:32

2025-05-13 08:24:14

2025-04-23 08:30:05

2025-02-07 09:05:36

2025-02-08 11:44:03

2025-04-17 06:10:57

2025-04-07 05:00:00

2025-06-03 08:26:00

2025-06-03 17:38:24

模型AIDeepSeek

2025-02-17 08:37:00

模型DeepSeekAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 婷婷免费在线 | 国产成人精品一区二区 | 色欧美综合 | 精品国产精品 | 国产精品一区二区免费 | 亚洲福利一区二区 | 精品一区电影 | 日日夜夜av| 四虎在线视频 | 亚洲男人天堂网 | 欧美一级免费 | 亚洲 日本 欧美 中文幕 | 久久99精品久久久久婷婷 | 国产精品99999 | 国产精品日日摸夜夜添夜夜av | 国产精产国品一二三产区视频 | 97精品视频在线观看 | 免费一级欧美在线观看视频 | 一区二区三区日韩精品 | 久久久久国产精品一区二区 | 亚洲欧洲激情 | 中文字幕日韩在线观看 | 中文字幕第一页在线 | 狠狠操网站 | 欧美成年人视频在线观看 | 久久av一区二区三区 | 天堂网中文 | 国产精品女人久久久 | 高清18麻豆 | 1000部精品久久久久久久久 | 99re超碰| 在线欧美日韩 | 国产一区二区三区视频 | 中文字幕日韩欧美一区二区三区 | av一级久久 | 国产精品一区一区三区 | 天天射中文 | 亚洲福利视频网 | 日韩欧美在线不卡 | 有码在线| www久久久 |