成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

成本兩元開發游戲,最快3分鐘完成!全程都是AI智能體“打工”,大模型加持的那種

人工智能 新聞
其實早在兩個月前,“ChatDev智能體協作開發框架”就已經在GitHub上開源,并多次霸榜Trending排行,目前已經攬獲近17000顆star。

家人們,OpenAI前腳剛發布自定義GPT,讓人人都能搞開發;后腳國內一家大模型初創公司也搞了個產品,堪稱重新定義開發——讓AI智能體們協作起來!

只需一句話,最快3分鐘不到,成本也只要2元多,“啪~”,一個軟件就開發完了。

例如開發一個紅包雨的小軟件,現在只需要說一句就好了:

“紅包雨”是一個點擊小游戲,紅包的外觀是紅色高瘦的圓角矩形,紅包緩慢地從上方掉落,每個紅包間距相等 ,沒有重疊,鼠標點擊任意一個紅包,紅包便隨著互動點擊而消失,同時顯示一個吉利的數字,表示搶到這個紅包得到了多少錢。

圖片

更重要的一點是,在開發的整個流程中,從產品經理到程序員,再到設計和測試等等,統統都是AI智能體!

沒錯,全程你只需要提需求,剩下的智能體們會自己討論、交流,甚至還伴隨著battle,最終確定方案并執行。

圖片

要知道,常規軟件的開發周期是在2-3周,且成本在10000-50000美元之間(包括人力);如此對比起來,可真的是大寫的“降本增效”!

這款神器便是ChatDev,是由面壁智能最新推出的SaaS級智能軟件開發平臺。

其實早在兩個月前,“ChatDev智能體協作開發框架”就已經在GitHub上開源,并多次霸榜Trending排行,目前已經攬獲近17000顆star

圖片

而此次面壁智能之所以推出產品版,就是為了把這種“一句話搞開發”的門檻再次“打下去”。

現在有了它,搞開發可以說拼得不再是技術了,拼得更多的反倒成了創意。

宛如身邊有一只哆啦A夢,只要你敢想,它就敢給你“造”出來。

那么產品版ChatDev正在帶來什么樣的改變?又是如何做到的?

產品開發變了:可以把更多創意塞進去

在產品版ChatDev加持之下,開發的迭代,也變成了有想法就行的事。

例如你想把“紅包”替換成你想要的元素,同樣也是只需要一句話的那種。

然后AI智能體們就又開始了新一輪工作流程,這次,我們來具體看看它們之間到底是怎么展開工作的。

我們還是先以剛才紅包雨的demo為例。

首先,就像剛才提到的,我們需要做的就只有填寫好“項目名稱”和“Prompt”。

而且即便Prompt寫得不好,在ChatDev旁邊也有一個“一鍵潤色”的功能,自動幫你把需求補充完整。

圖片

然后我們就能看到AI智能體們就開始“搓搓小手”準備干活兒了。

CTO先發話,大概意思就是:

來活兒嘍!客戶要搞個“紅包雨”~

緊接著

CTO詳細地拆解了這個需求,把項目要做的每一步都羅列了出來:

圖片

任務下達之后,就輪到圖片程序員發力了。

只見他不費吹灰之力,立即給出了一段Python代碼:

圖片

代碼完成之后,還有會有一位圖片AI Counselor,會對整個項目做個總結,并將邏輯、結果等等一并奉上:

圖片

整個對話過程可謂是非常絲滑,我們就像一位尊貴的客戶,靜靜地看著這些“AI員工”有條不紊地推進著項目。

不得不感慨,現在搞開發,真的成了有想法就行的事兒了。

例如網絡爬蟲、數據庫讀寫、文件批處理、網頁設計這樣的編程助手;像五子棋、貪吃蛇這樣的休閑小游戲;再如數字時鐘、計算器、繪畫板、圖片編輯器這樣的效率管理和創作輔助工具。

統統都能hold得住~

圖片

怎么做到的?

從早期披露的消息和論文中可以看到,最初的ChatDev,是團隊設計了一套由群體智能串聯起的ChatChain(交流鏈)。

可視為由原子任務組成的“軟件生產線”,通過專業角色的智能體進行對話式信息交互和決策,驅動其進行自動化全流程軟件工程。

圖片

然而,應用的創新離不開基礎模型能力的提升,隨著面壁智能推出SaaS版ChatDev,我們發現其自研的基座模型也有了新的版本——

面壁智能自研的新一代千億參數大模型——CPM-Cricket(CPM全稱為Chinese Pretrained Model) 

據了解,CPM-Cricket是面壁智能的第三代模型,前兩代分別為CPM-Ant、CPM-Bee。

(有意思的一點是,每一代模型的名字是按照英文字母的順序為首字母,并取一個昆蟲的英文單詞來命名。)

至于CPM-Cricket的能力幾何,一言蔽之,是在邏輯、代碼、知識、指令理解等方面有了大幅提升,且全面超越Llama 2的那種。

在經典的LLM評測集(HumanEval、C-Eval、MMLU、MBPP、CMMLU、BBH等)中,CPM-Cricket表現如下:

圖片

或許這樣的一組數據并沒法帶來非常直觀的感受。

那么同樣是基于CPM-Cricket的類ChatGPT產品——Luca 3.0,把它“丟”進公考場景之后的表現,便可以讓CPM-Cricket的能力變得更一目了然了。

題目是這樣的:

選取2022-2023年的公考試題,包括常識判斷、數量關系、資料分析、判斷推理、語言理解與表達等多種題型的425道試題。

例如面對下面這道單選題,Luca 3.0不僅可以秒速作答,還能將每一步的解題步驟詳盡地列出來:

圖片

即使是面對話術彎彎繞繞、真人看了都需要反應一會兒的邏輯題目,Luca 3.0的回答也是游刃有余:

圖片

可以說,Luca 3.0在這套題上的表現是做到了“快”和“準”。

而與之同臺競技的選手,面壁智能所選取的也是業界相對標桿的大模型,GPT-4。

圖片

不難看出,在重要的常識判斷和判斷推理兩項能力中,Luca 3.0相比GPT-4已經能夠保持相對的優勢了。

不僅如此,在英文測試環境中,Luca 3.0在GMAT官方模擬考試題中的表現,同樣也是GPT-4整體相當(其中閱讀達到GPT-4的97%水位)。

而Luca 3.0之所以能夠取得這般成績,除了背后CPM大模型升級這個因素之外,面壁智能在微調方面也做了相應的策略:

一是課程學習(Curriculum learning,CL)的訓練策略,模仿人類的由易到難的學習過程,先在預訓練中讓模型學習底層推理規律,然后在對齊階段學習人類的逐步推理思維。

二是思維鏈(Chain-of-thought,CoT)策略,對推理過程分解,讓模型的推理更加具有可解釋性。

(PS:目前Luca已經正式面向公眾開放服務,是可以免費體驗的那種哦~)

在底層基礎設施的其他方面,例如訓練、壓縮和推理,面壁智能也自研了自己的一套打法:

  • BMTrain:大模型高效訓練框架
  • BMInf:大模型高效推理框架
  • BMCook:大模型高效壓縮框架

據說其大模型已集成超過16000多個真實API,可實現一鍵接入,調用工具解決更多復雜任務。

此外,面壁智能還部署了Int8量化模型,讓模型推理成本降低50%。

總結來說,面壁智能探索了出更為低成本、高效率的模型訓練方法,讓大模型不僅能“訓出來”,還能“訓得好”、“用得好”。

這可能就是這家創業公司推動“大模型+Agent”應用落地的實力和底氣。

還有更大的一盤棋

不過除此之外,基于大模型底座的基礎能力,面壁智能還曾開源了兩項重磅的工作——AgentVerseXAgent。

加上之前我們提到的ChatDev,三者共同形成了面壁智能的“三駕馬車”,圍繞的核心便是AI智能體。

AgentVerse是一個大模型驅動的智能體通用平臺,它的作用就是打造各式各樣的AI智能體,讓它們具備感知、思考、推理、理解、協作和執行的能力,以便“組團打怪”。

XAgent是大模型驅動的AI智能體應用框架,它可以讓智能體們具備自主規劃和決策能力,能夠理解人類指令,制定復雜計劃并自主采取行動完成任務。

而ChatDev則更為聚焦,是大模型驅動的多智能體協作開發框架,采用軟件工程瀑布模型的思想,將軟件開發分為軟件設計、系統開發、集成測試、文檔編制四個主要環節。

但若是我們將此次發布的所有“單節點”聯系到一起,就能發現,面壁智能實則是在下一盤更大的棋——

左手大模型,右手AI智能體,要打造的是一個智能體網絡(Internet of Agents,IoA)。

因為在面壁智能看來,我們已經經歷了從互聯網到物聯網的過渡,而接下來的駛向便是智聯網。

如果說互聯網是二維信息的聯通、物聯網是三維空間的聯結,那么智聯網則是進入更高維度的智能體互聯。

而在智聯網中,AI智能體應當是最為關鍵的存在,它可以是擬人的原生智能體,也可以是現實中的人和物體的數字孿生智能體。

通過智能體的連接,可以讓AI真正為人類服務,提供價值(生產力的提升、交互方式的改變)

以一個大膽的想象來比喻,可能在智聯網的將來,家中的哪怕是一張桌子、一臺冰箱,也會具備智能體的特性,可以與人和其它物體做智能交互。

而這,也正是面壁智能愿景的由來——智周萬物

“智”即AI Agent智能體;“萬物”可以是人,可以是物。

AI Agent智能體網絡是連接現實世界與虛擬世界的橋梁,并使其真正交互和協作起來,創造價值。

不過有一說一,智聯網的理想雖好,但現實的情況是,即使是ChatDev和第三代大模型的發布,也只能視為邁向愿景的一步。

那么面壁智能是否有足夠的實力能夠在將來解鎖“智周萬物”呢?

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-08-19 08:29:40

2025-02-25 07:49:36

智能體數據庫DeepSeek

2024-04-25 07:10:00

圖像生成模型AdobeAI 模型

2023-11-26 00:30:05

2019-04-11 13:34:24

2018-10-19 12:27:23

人工智能機器學習技術

2021-07-28 08:51:51

AI 數據人工智能

2020-10-26 10:18:55

百度EasyDL

2024-04-30 08:28:44

開源大模型Llama

2012-06-28 10:26:51

Silverlight

2023-11-01 19:05:18

云棲大會螞蟻集團AI風控引擎

2025-05-07 00:10:00

2024-01-26 10:19:00

AI模型

2011-08-08 09:22:10

Python

2023-07-12 14:45:38

2024-04-26 07:48:45

DockerLLama3模型

2025-05-14 01:00:00

AI智能體人工智能

2022-12-16 09:55:50

網絡架構OSI

2023-11-23 19:26:43

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 蜜桃在线播放 | 日韩综合一区 | 婷婷色在线 | 中文欧美日韩 | 亚洲欧美一区二区三区情侣bbw | 日韩精品一区二区三区免费视频 | 成人在线免费看 | 欧美精品一区三区 | 日韩高清中文字幕 | av一区二区在线观看 | 久久久天天 | 日本高清在线一区 | 极品国产视频 | 亚洲国产高清高潮精品美女 | 在线看亚洲 | 免费骚视频 | www.天天操.com | 久久久久久www | 欧美黄色性生活视频 | 97精品一区二区 | 亚洲在线成人 | 国产欧美精品一区二区 | 欧美性大战xxxxx久久久 | 中文字幕第三页 | 在线看片网站 | 久久大香 | 欧美一级久久久猛烈a大片 日韩av免费在线观看 | 欧美一级二级视频 | 91综合在线视频 | 中文字幕欧美一区 | 人成久久 | 成人精品视频 | 毛片av免费在线观看 | 在线播放国产视频 | 日本成人久久 | 精品福利在线视频 | 一区二区三区四区在线视频 | 91欧美精品成人综合在线观看 | 欧美性猛交一区二区三区精品 | 天天天操操操 | 午夜性色a√在线视频观看9 |