從想法到上線僅需幾分鐘:用豆包大模型1.6和火山引擎AI云原生工具棧構(gòu)建雙語播客網(wǎng)頁
一個想法,幾分鐘后,可以變成一個上線的網(wǎng)站。
你沒看錯,這不是科幻電影,而是 Agentic AI 時代帶給開發(fā)者的時代紅利啊。
大家好,我是一名開發(fā)者,也是一枚AI博主。
和許多同行一樣,我被 AI Agent 的驚人潛力深深吸引,但同時也為其復(fù)雜的構(gòu)建和部署流程感到頭疼。
如何才能穩(wěn)定、高效地打造一個生產(chǎn)級的 Agent 應(yīng)用?
最近,火山引擎提出了一個名為 “AI 云原生” 的全新 Agent 開發(fā)范式,號稱能將從想法到產(chǎn)品的路徑縮短到極致。
口說無憑,體驗為王。
這篇文章,就是我親身體驗火山引擎這套“全家桶”的完整記錄。
我的目標(biāo)是:構(gòu)建一個智能的“中英雙語學(xué)習(xí)”Agent,讓它根據(jù)我的指令,從零生成一個功能完善、樣式精美的雙語學(xué)習(xí)網(wǎng)頁。
劇透一下:結(jié)果遠超預(yù)期。
?? 我的“AI 云原生”工具箱
在開始構(gòu)建之前,先介紹一下這次火山引擎為我提供的“打怪裝備”:
?? “大腦” - 豆包大模型 1.6
最新發(fā)布的豆包主力模型由三個模型組成,擁有強大的代碼、推理和多模態(tài)能力。
doubao-seed-1.6:All-in-One 的綜合模型,國內(nèi)首個支持256K 上下文的思考模型,支持深度思考、多模態(tài)理解、圖形界面操作等多項能力。支持選擇開啟或關(guān)閉深度思考、自適應(yīng)思考三種方式。
doubao-seed-1.6-thinking:在代碼、數(shù)學(xué)、邏輯推理等基礎(chǔ)能力上進一步提升;支持256K 上下文。
doubao-seed-1.6-flash:豆包大模型1.6系列的極速版本,支持深度思考、多模態(tài)理解、256K 上下文;延遲極低。
火山引擎
圖片
AI頭部KOL @數(shù)字生命卡茲克 卡佬對高考全國新一卷數(shù)學(xué)單科做了測評,豆包的成績是144分,全國第一,實至名歸。
本次我主要使用 ??seed-1.6?
? 版本,據(jù)說它針對前端編程能力做了特別加強。
??? “工作臺” - Trae IDE
本次開發(fā)的核心環(huán)境是Trae,一個深度集成了從模型調(diào)用到應(yīng)用部署全鏈路的在線 IDE。
下載地址:??https://www.trae.cn/??
?? “連接器” - MCP Market
簡單理解,它是一個能力市場,能將火山官方云服務(wù)(如 veFass)和第三方工具作為 Agent 的“插件”,極大地擴展了 Agent 的能力邊界。
火山引擎的MCP廣場集成了豐富的官方云服務(wù)(云計算、存儲,還有飛書的MCP)及優(yōu)質(zhì)三方生態(tài)工具,支持Remote MCP,Local MCP 部署方式。
本次我們將會用到minimax的MCP,需要用到使用語音合成服務(wù),用于文本轉(zhuǎn)錄,生成音頻等。
使用MiniMax MCP,需要安裝Python包管理器uv。
MiniMax Server的配置示例如下
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": [
"minimax-mcp",
"-y"
],
"env": {
"MINIMAX_API_KEY": "xxx",
"MINIMAX_MCP_BASE_PATH": "D:\\AI\\AI",
"MINIMAX_API_HOST": "https://api.minimax.chat",
"MINIMAX_API_RESOURCE_MODE": "url"
}
}
}
}
API Key需要與Host匹配,出現(xiàn)API Error: invalid api key錯誤,需要檢查API Host是否正確:
- 國際版Host:??https://api.minimaxi.chat??(額外的字母i)
- 國內(nèi)版Host:??https://api.minimax.chat??(用國內(nèi)即可)
然后在Trae中進行手動配置:
加載之后顯示正常即可使用。
還要安裝Fetch,Anthropic官方提供了一個網(wǎng)頁抓取MCP Server(免費、無需配置其他信息):
{ "mcpServers": { "Fetch": { "command": "uvx", "args": [ "mcp-server-fetch" ], "env": {} } } }
直接選擇添加即可。
?? “發(fā)射臺” - veFass 部署服務(wù)
一個能將靜態(tài)網(wǎng)頁一鍵部署到公網(wǎng)的解決方案,是這次我們能快速看到成果的關(guān)鍵。
火山引擎原生MCP-VeFaas,能夠?qū)TML頁面部署到火山引擎,自動轉(zhuǎn)換靜態(tài)網(wǎng)頁,創(chuàng)建API網(wǎng)關(guān),返回一個公網(wǎng)訪問地址。
然后添加到Trae里面,正常顯示如下。
有了這套裝備,我的“中英雙語學(xué)習(xí)”Agent 構(gòu)建之旅,正式開始!
構(gòu)建之旅:創(chuàng)建“中英雙語學(xué)習(xí)”Agent
2025/6/14
第一步:一切的開始——提示詞工程 (Prompt Engineering)
一個好的 Agent,始于一個好的 Prompt。
我最初的想法很模糊:“幫我做一個中英文雙語學(xué)習(xí)播客網(wǎng)頁”。這種指令對于 AI 來說,信息量太少,無法產(chǎn)出理想結(jié)果。
幸運的是,火山引擎發(fā)布的 PromptPilot 工具幫了大忙。
這里訪問:??https://promptpilot.volcengine.com/startup??
它像一個循循善誘的導(dǎo)師,通過提問引導(dǎo)我將模糊的想法具象化,最終優(yōu)化成一個細(xì)節(jié)豐富的請求。
看下優(yōu)化前后的對比:
優(yōu)化前 ??
1.首先調(diào)用聯(lián)網(wǎng)搜索服務(wù),將收集到的信息整理到md文檔。
2.然后將md文檔用老外聲音生成音頻。
3.然后用生成的音頻和md文檔生成一個美觀的HTML頁面,確保頁面上音頻可播放。
4.最后把HTML頁面部署到公網(wǎng)上。
優(yōu)化后 ??
你需要完成一系列任務(wù),具體目標(biāo)是根據(jù)給定的搜索查詢,通過聯(lián)網(wǎng)搜索收集信息,整理成md文檔,再將md文檔用老外聲音生成音頻,接著用生成的音頻和md文檔生成一個美觀且音頻可播放的HTML頁面,最后把HTML頁面部署到公網(wǎng)上。
首先,請仔細(xì)閱讀以下搜索查詢內(nèi)容:
<搜索查詢>
{{SEARCH_QUERY}}
</搜索查詢>
接下來,請按照以下步驟完成任務(wù):
1. 調(diào)用聯(lián)網(wǎng)搜索服務(wù),根據(jù)搜索查詢收集相關(guān)信息,并將這些信息整理成一個md文檔。確保文檔內(nèi)容結(jié)構(gòu)清晰、邏輯連貫。在完成這一步后,在<完成步驟1>標(biāo)簽中確認(rèn)完成,并簡要說明文檔的大致內(nèi)容和結(jié)構(gòu)。
2. 使用合適的語音合成工具,將整理好的md文檔內(nèi)容用老外聲音生成音頻文件。選擇音質(zhì)較好、發(fā)音標(biāo)準(zhǔn)的語音。完成后,在<完成步驟2>標(biāo)簽中確認(rèn)完成,并說明選擇的語音合成工具和語音類型。
3. 利用生成的音頻文件和md文檔生成一個美觀的HTML頁面。頁面布局要合理,確保音頻在頁面上可以正常播放。你可以使用HTML、CSS和JavaScript等技術(shù)來實現(xiàn)。完成后,在<完成步驟3>標(biāo)簽中確認(rèn)完成,并簡要描述頁面的布局和設(shè)計特點。
4. 將生成的HTML頁面部署到公網(wǎng)上??梢赃x擇合適的免費或付費的托管服務(wù)。完成后,在<完成步驟4>標(biāo)簽中確認(rèn)完成,并提供部署后的公網(wǎng)鏈接。
請嚴(yán)格按照上述步驟依次執(zhí)行任務(wù),并確保每一步的輸出符合要求。
這個過程,讓我深刻體會到:與 Agent 協(xié)作,本質(zhì)上是一場高質(zhì)量的溝通。
第二步:見證奇跡——豆包 1.6 從文本到代碼
接下來是核心環(huán)節(jié)。
結(jié)合優(yōu)化后的 Prompt,在Trae里面創(chuàng)建了新的智能體,
創(chuàng)建好智能體之后,就可以在對話框里面進行操作了。
調(diào)用豆包 seed-1.6 模型執(zhí)行任務(wù)。
首先輸入我想生成的內(nèi)容,比如我想讓他生成labubu的內(nèi)容。
按下回車,幾秒鐘后,豆包 1.6驅(qū)動的智能體 開始“思考”并輸出代碼。整個過程行云流水,它幾乎完美地理解了我的任務(wù)焦慮。
我截圖可以看一下,他給我們生成了MD文件,里面是關(guān)于labubu的信息,而且還有溯源的鏈接。
然后接下來會去生成音頻和網(wǎng)頁HTML文件。
啟動服務(wù)之后就去調(diào)用服務(wù)進行部署,并且可以在本地看到啟動的網(wǎng)頁。
其實聽完,就會發(fā)現(xiàn),只有一個男生的聲音,比較單調(diào),并且還不是標(biāo)準(zhǔn)的播客形式,需要進一步優(yōu)化。
第三步:快速審查——在 Trae IDE 中微調(diào)
代碼生成后,自動出現(xiàn)在 Trae IDE 的編輯器中。
我快速瀏覽了一遍,代碼結(jié)構(gòu)清晰,注釋合理。
我只做了一個微小的調(diào)整——將整個播放器的音色調(diào)整為男女雙人播客,有雙人互動,并且整個過程不超過2分鐘。
重新調(diào)整提示詞,使用promptpilot進行創(chuàng)作。
調(diào)整之后的提示詞:
你需要完成一系列任務(wù),最終將生成的內(nèi)容部署到公網(wǎng)上。具體步驟如下:
首先,你將進行聯(lián)網(wǎng)搜索。要搜索的關(guān)鍵詞為:
<search_query>
{{SEARCH_QUERY}}
</search_query>
<第一步:信息收集與文檔整理>
<思考>
[仔細(xì)分析搜索到的信息,篩選出與搜索關(guān)鍵詞相關(guān)且有價值的內(nèi)容]
</思考>
將收集到的信息整理成一份md文檔。確保文檔結(jié)構(gòu)清晰,內(nèi)容有條理。整理完成后,將md文檔內(nèi)容放在<md_document>標(biāo)簽內(nèi)。
<md_document>
[在此處填寫整理好的md文檔內(nèi)容]
</md_document>
<第二步:播客內(nèi)容生成與音頻生成>
將md文檔內(nèi)容轉(zhuǎn)化為男女雙人播客互動的內(nèi)容。充分考慮雙人對話的特點,使內(nèi)容自然流暢。轉(zhuǎn)化完成后,將播客內(nèi)容放在<podcast_content>標(biāo)簽內(nèi)。
<podcast_content>
[在此處填寫轉(zhuǎn)化后的播客內(nèi)容]
</podcast_content>
使用男女雙人聲音將播客內(nèi)容生成為音頻。
<第三步:HTML頁面創(chuàng)建>
使用生成的音頻和模擬的播客男人生成一個美觀的HTML頁面,確保頁面上音頻可正常播放。將HTML頁面的代碼放在<html_page>標(biāo)簽內(nèi)。
<html_page>
[在此處填寫HTML頁面的代碼]
</html_page>
<第四步:部署到公網(wǎng)>
將生成的HTML頁面部署到公網(wǎng)上。部署完成后,在<deployment_url>標(biāo)簽內(nèi)提供公網(wǎng)訪問的URL。
<deployment_url>
[在此處填寫公網(wǎng)訪問的URL]
</deployment_url>
最新的雙人播客內(nèi)容已經(jīng)生成好了,已經(jīng)符合我的預(yù)期了。
然后依次將男聲和女聲的音頻合成出來,這部分其實是把所有的男聲和所有的女聲進行一次性合成,最終按照順序進行合并。
但是生成的音頻片段,在最終呈現(xiàn)的時候,還是需要合并到一起,可以告訴智能體我們的需求。
第四步:一鍵發(fā)射——使用 veFass MCP 部署
最后一步,也是最驚艷的一步。
在 Trae 環(huán)境中,我直接調(diào)用了 ??veFass?
? 這個 MCP 工具。
它就像一個“部署按鈕”,我只需輸入一個我想用的項目名稱,點擊執(zhí)行。
使用過程記得給API網(wǎng)關(guān)授權(quán),賬戶里面還得有錢,不然會報錯。
幾秒鐘后,一個公網(wǎng)可以訪問的 URL 就生成了!
從代碼生成到網(wǎng)站上線,整個過程無縫銜接,沒有任何傳統(tǒng)開發(fā)中的環(huán)境配置、服務(wù)器設(shè)置、域名解析等繁瑣操作。
性能評測:豆包 1.6 與“AI 云原生”表現(xiàn)如何?
2025/6/14
代碼質(zhì)量
豆包 1.6 生成的 HTML/CSS 代碼質(zhì)量非常高。它不僅準(zhǔn)確實現(xiàn)了我對網(wǎng)頁元素的請求,代碼本身也非常整潔、現(xiàn)代化,并且考慮到了基本的響應(yīng)式布局。這證實了其在前端頁面生成方面的定向增強名不虛傳。
開發(fā)體驗 - “AI 云原生”的真正優(yōu)勢
如果說豆包模型是出色的“執(zhí)行者”,那么整個“AI 云原生”技術(shù)棧就是無與倫比的“指揮系統(tǒng)”。
傳統(tǒng)流程:
??從需求收集?
?? -> ??UI/UX 設(shè)計?
?? -> ??前端開發(fā)?
?? -> ??后端開發(fā)?
?? -> ??環(huán)境配置?
?? -> ??部署上線?
?? -> ??調(diào)試,整個?
?耗時數(shù)天到數(shù)周。
而AI 云原生流程:從??想法 & Prompt?
??-> ??AI 生成 & 微調(diào)?
?? -> ??一鍵部署?
?,耗時:數(shù)分鐘。
效率提升何止十倍!模型(豆包)、開發(fā)環(huán)境(Trae)和部署(veFass)之間的無縫協(xié)同,正是“AI 云原生”范式的核心價值所在。
它將開發(fā)者從繁重的“體力勞動”中解放出來,讓我們能專注于最重要的事——創(chuàng)造。
這次評測,讓我真切地感受到了 Agentic AI 帶來的革命性變化。
火山引擎的這套生態(tài)系統(tǒng),不僅僅是幾個強大工具的簡單堆砌。它通過“AI 云原生”的理念,將大模型、開發(fā)工具鏈和云服務(wù)深度融合,真正將從一個想法到一個生產(chǎn)級 Agent 的實現(xiàn)路徑,縮短到了前所未有的地步。
圖片
“AI 云原生”不再是一個空洞的概念,它是一個已經(jīng)可以落地、高效、且體驗極佳的開發(fā)范式。
一個屬于開發(fā)者的新時代,已經(jīng)拉開序幕。
本文轉(zhuǎn)載自????AIGC新知???,作者:絳燁
