千億級、數學專用，MathGPT大模型開始公測了

作者：機器之心 2023-08-24 14:27:00

今年 5 月，好未來曾公布正在進行自研數學大模型的研發，命名為 MathGPT。MathGPT 是面向全球數學愛好者和科研機構，以解題和講題算法為核心的數學垂直領域的大模型，也是國內首個專為數學打造的大模型。

國內大模型市場又迎來了一個新的「選手」，這次是數學專用大模型。

8 月 24 日，機器之心獲悉，在好未來 20 周年直播活動中，CTO 田密宣布好未來自研的數學領域千億級大模型 MathGPT 正式上線并開啟公測。即日起，用戶可通過官網申請注冊賬號免費試用體驗。

使用方式也很簡單。用戶使用 MathGPT 時，用文字或圖片方式上傳數學題，即可得到對話式的解答反饋，也可以通過 “隨機來一題” 的按鈕，隨機生成數學題目并由系統給出解答。

目前，MathGPT 支持中文、英文版本的 PC 端和移動端體驗。

領先的數學解題能力

MathGPT 匯集了好未來多年教育教研數據積累，專注于數學領域。千億級大模型的訓練、推理、部署框架，為模型賦予了強大能力。通過優質教育數據，實現題目計算、講解、問答等多任務持續訓練和有監督微調，呈現出卓越表現。此外，借助人類反饋對齊，還將進一步提升模型綜合素養。MathGPT 在解題準確率、穩定性及用戶體驗方面均有明顯的優勢。

據了解，MathGPT 的數學計算能力已覆蓋小學、初中、高中的數學題，題目類型涵蓋計算題、應用題、代數題等多個類型，還可以針對題目進行追問。不過暫未開放數學之外的問答互動。

MathGPT 技術報告

具體效果如何呢？在 CEval-Math、AGIEval-Math、APE5K、CMMLU-Math、高考數學和 Math401 等 6 個公開數學評測集合的測試結果中，MathGPT 取得了多項測試的最高分數。同時，MathGPT 在 C-Eval 的初高中的全科測試集合上也均有不錯的表現。

MathGPT 在 C-Eval 榜單初高中各科成績

此外，在解題穩定性、講解友好度方面，MathGPT 基于海量名師解題過程的數據進行模型訓練，模型的解題步驟專業清晰。

我們以一道數列題為例，MathGPT 給出的答案包含 “分析”、“詳解”、“點睛” 三個部分，比通用大模型的粗略講解方式更為細致。其中“分析” 提供了題目的解題思路、思考方式，幫助用戶更好地理解題目；“詳解” 則給出具體的計算方式和答案；最后 “點睛” 的環節對題目的考點、難點、關鍵點進行提示，幫助用戶回顧反思出題意圖、舉一反三。

對于使用者而言，研究數學問題不僅在于得到答案本身，更在于答案背后的解題原理、思路邏輯。與其他通用大模型相比，MathGPT 能實現更高準確度的解題，也能把答案解析得更清楚、講解得更明白，更好地滿足用戶使用 AI 產品解答數學問題的核心需求。

在 MathGPT 發布同時，好未來也更新了一個具有代表性和挑戰性的數學任務評測集，供全球人工智能專家、數學愛好者體驗和測評。好未來希望讓 MathGPT 在數學教育領域發揮更大作用，并愿意把基于大規模、高質量的內容的千億級大模型研發經驗方法和業內分享，和行業共同進步。

好未來 AI 的厚積薄發

在 AI 浪潮的推動下，今年以來多家科技公司宣布推出通用大語言模型產品，而好未來選擇了另一個方向，不基于將現有大語言模型做微調和接口調用、不做通用大語言模型，而是深入數學的垂直領域研發大模型，致力于打造自主、穩定、可持續、高質量的數學解決方案。

通用大模型 “重文輕理”，在數學問題的解決、講解、問答和推薦方面則存在明顯的短板。而在另一個層面，在通往通用人工智能的路上，數學推理能力很重要，全球有很多大型公司在做這方面的研究。

“好未來在數學的數據和業務上有 20 年的積累，有大量的教育數據的積累和持續生產教育數據的能力，所以選擇做這個難而正確的事情。” 田密稱，好未來希望用自己在數學和 AI 上的多年積累，做好 AI 大模型時代的數學基礎工作。

其實早在 2017 年，好未來便成立了 AI lab 人工智能實驗室。基于智慧教育人工智能開放創新平臺助力，好未來 AI lab 獲得各類頂級學術會議比賽冠軍 16 項，亞軍 6 項，發表國際期刊和會議高水平學術論文近百篇。

2019 年，科技部宣布依托好未來建設智慧教育國家新一代人工智能開放創新平臺，好未來成為教育行業首批唯一一家人工智能 “國家隊” 成員，在人工智能領域有多年深入研究。多年來，好未來以教育行業重大需求為牽引，構建了面向教育的人工智能算法能力、應用解決方案、基礎軟硬件體系和開源開放服務的國家教育科技創新平臺。

好未來也在積極參與推動大模型標準體系建設，先后作為核心單位參與了由國家人工智能標準化總體組組織的大模型系列國家標準、中國信通院牽頭編制的 “大模型預訓練模型技術和應用評估方法” 系列團體標準，以及教育部教育信息化技術標準委員會暨全國信息技術標準化技術委員會主導的 “教育通用大模型” 系列標準編制工作。

近期，好未來正作為牽頭單位與中國信通院、復旦大學、科大訊飛、百度等行業領先科研機構、高校、企業一同編制教育大模型團體標準，從覆蓋場景、應用成效、服務可靠等維度全面評估教育大模型能力，為教育大模型應用落地提供參考與指導。

用 AI 實現大規模因材施教

隨著大語言模型的興起，如何用 AI 技術服務各行各業是社會關注的焦點。教育行業是最早開始布局 AI 領域的行業之一，AI 能為教育生態帶來何種變化一直備受關注。

“AI 帶來了重新定義教育行業的機會，大模型技術使得大規模的因材施教真正有了實現的可能。” 田密介紹，20 年來，好未來一直在探索個性化學習，從線下小班到線上大班，再到 AI 課，形式不斷進化，但教的內容始終是固定的、學生和老師互動較少、顆粒度只能到題目級別。

田密認為，大模型的本質，是一種更高效的、從數據中學習知識并加以應用的方式。在 AI 能力的加持下，“學生自學 + AI 答疑” 的新型學習方式成為廣泛的可能。學習者獲得優質教學內容的門檻、成本降低，獲得的教學內容個性化、精細化程度持續升高，可以實現千人千面的 AI 教學和答疑輔導，每個學生都能得到最適合自己的學習內容。

以 MathGPT 為基礎，好未來將不斷探索 AI 環境下的學習方式，更好地服務于全球的學習者、數學愛好者，并將經驗及時與行業分享，通過 AI 技術助力教育科技的積極改變。

隨著公測的順利進行，MathGPT 的解題能力將得到持續提升，基于 MathGPT 的產品級應用也正在加速研發中，將于近期發布。

責任編輯：張燕妮來源：機器之心

AI 模型

成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

千億級、數學專用，MathGPT大模型開始公測了

領先的數學解題能力

好未來 AI 的厚積薄發

用 AI 實現大規模因材施教