成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

卷瘋了!開源社區(qū)離Openai o1越來越近~

發(fā)布于 2024-10-9 13:05
瀏覽
0收藏

小長假結(jié)束了~  本來打算梳理一下假期的信息的,但是內(nèi)容有點多,放棄了~

今天這個標題對應(yīng)假期的2個新聞。

  • 思科的大佬,假期發(fā)了一篇medium博客,使用2個復(fù)雜數(shù)據(jù)集,進行了一系列模型的基準測試。

    卷瘋了!開源社區(qū)離Openai o1越來越近~-AI.x社區(qū)

  • Blog: https://medium.com/@harishhacker3010/can-we-make-any-smaller-opensource-ai-models-smarter-than-human-1ea507e644a0
  • Prompt: https://gist.github.com/philschmid/34747bf5bc8280f3a5f10f5fd8d1cd4b
  • Github: https://github.com/harishsg993010/LLM-Research-Scripts

簡單總結(jié)

  • ?? 結(jié)合動態(tài)思維鏈+反思+語言強化promp,以嚴格的學(xué)術(shù)測試為基準(JEE Advanced、UPSC、IMO、Putnam)
  • ?? Claude 3.5 Sonnet 的性能優(yōu)于 GPT-4 和匹配的 O1 型號
  • ?? LLMs可以創(chuàng)建內(nèi)部模擬并對復(fù)雜問題采取 50 多達推理步驟
  • ?? 適用于較小的開源模型,如 Llama 3.1 8B +10%(Llama 3.1 8B 33/48 與 GPT-4o 36/48)
  • ? 由于計算和預(yù)算限制,沒有像 MMLU、MMLU pro 或 GPQA 那樣進行基準測試
  • ?? 高token使用量 - Claude Sonnet 3.5 僅 7 個問題就使用了大約 100 萬個令牌
  1. open o1 項目
  • github: https://github.com/OpenSource-O1/Open-O1
  • space: https://huggingface.co/spaces/happzy2633/open-o1
  • hf: https://huggingface.co/O1-OPEN

Open-O1 項目,主要是期望對齊閉源 OpenAI O1 模型的強大功能,為社區(qū)提供先進的開源替代方案。通過精心篩選一組 O1 風(fēng)格的思考數(shù)據(jù)來開發(fā)訓(xùn)練,這些數(shù)據(jù)用于訓(xùn)練 LLaMA 和 Qwen 模型。這種訓(xùn)練方法賦予了較小的模型長期推理和解決問題的能力。

有一些初步的微調(diào)成果,但是看起來不太顯著,readme上有挺多不錯的輸出樣例。開源模型:https://huggingface.co/happzy2633/qwen2.5-7b-ins-v3/tree/main

卷瘋了!開源社區(qū)離Openai o1越來越近~-AI.x社區(qū)

本文轉(zhuǎn)載自 ??NLP前沿??,作者: 熱愛AI的

收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 91传媒在线观看 | 狠狠干网站 | 亚洲韩国精品 | 国产成人精品免费视频大全最热 | 久久久久无码国产精品一区 | 中文字幕在线一区 | 亚洲精品一区二区三区在线 | 国产日韩欧美在线播放 | 欧美久久久久久久 | 久久久久久久久久久久久久久久久久久久 | 国产日韩欧美一区二区 | 亚洲精品国产一区 | 亚洲美女视频 | 日韩成人在线网址 | 欧美日韩在线视频一区二区 | 久色网 | 99热热精品 | 日韩精品一区二区三区中文在线 | 在线小视频 | 精品国产一级 | 久久91视频| 成人福利电影 | 国产一级网站 | 日韩在线不卡 | 成人黄在线观看 | 91视频18| 一区二区三区四区在线 | 99精品在线免费观看 | 午夜精品一区二区三区在线观看 | 亚洲三级av | 国产精品久久片 | 国产精品久久亚洲 | 久久久久久久一区 | 中文字幕视频在线观看 | а_天堂中文最新版地址 | 国产精品成人av | 欧美一区二区在线 | 精品国产91亚洲一区二区三区www | 亚洲xxxxx| 亚洲第一福利视频 | 91国内精品久久 |