OpenAI公開(kāi)了大模型o3-mini的推理思維鏈
2月8日消息,據(jù)外媒報(bào)道,OpenAI更新了o3-mini?AI模型的“思維鏈”功能,讓用戶(hù)可以看到模型的思考過(guò)程。這是在DeepSeek-R1發(fā)布之后發(fā)生的,DeepSeek-R1是一個(gè)競(jìng)爭(zhēng)對(duì)手的推理模型,也顯示了其反應(yīng)背后的思維過(guò)程。
推理模型旨在逐步分解其決策過(guò)程,因此需要更長(zhǎng)的時(shí)間來(lái)生成響應(yīng)。這樣的解釋可以更容易地理解為什么給出了特定的響應(yīng),允許用戶(hù)看到為什么他們的提示可能會(huì)或可能不會(huì)產(chǎn)生期望的答案。它們還允許人工智能研究人員識(shí)別潛在的偏見(jiàn)或錯(cuò)誤,并提高其推理能力。
OpenAI在一篇文章中表示,該公司已經(jīng)為免費(fèi)和付費(fèi)用戶(hù)發(fā)布了“更新的OpenAI?o3-mini思維鏈”,并為付費(fèi)用戶(hù)發(fā)布了o3-mini-high思維鏈。“o3-mini-high是o3-mini的付費(fèi)版本,具有更深入的推理能力和更詳細(xì)的思維過(guò)程,但代價(jià)是反應(yīng)時(shí)間較慢。
在此更新之前,OpenAI模型o3-mini、o1和o1-mini只能讓用戶(hù)訪(fǎng)問(wèn)思想鏈摘要,而不是完整的推理;該公司表示,這是為了“在速度和準(zhǔn)確性之間提供一個(gè)平衡的權(quán)衡”,盡管它過(guò)去也提到“競(jìng)爭(zhēng)優(yōu)勢(shì)”是決定的一個(gè)因素。
然而,由于DeepSeek的開(kāi)源R1展示了其反應(yīng)背后的整個(gè)過(guò)程,OpenAI決定將該過(guò)程公布。在更新中,“模型的原始(思維鏈)仍然隱藏,因?yàn)樗茈y理解”,但以一種“易于閱讀”的方式呈現(xiàn)。
新的、更深入的推理總結(jié)將經(jīng)過(guò)后處理步驟,簡(jiǎn)化任何過(guò)于復(fù)雜的解釋?zhuān)瑒h除任何“不安全”的推理解釋?zhuān)⑵浞g成用戶(hù)的母語(yǔ)。
OpenAI的首席產(chǎn)品官Kevin?Weil表示:“展示所有的思維鏈會(huì)帶來(lái)競(jìng)爭(zhēng)的升華,但我們也知道人們需要它,所以我們會(huì)找到平衡它的正確方法?!边@就是這種平衡的結(jié)果。