紅帽:以開(kāi)源之力破局,做 AI 時(shí)代的“解耦者”
原創(chuàng)“AI 的未來(lái)是開(kāi)放的,并且是由紅帽驅(qū)動(dòng)的!”紅帽全球副總裁兼大中華區(qū)總裁曹衡康在 2025 紅帽媒體 Open 講活動(dòng)上如是說(shuō)。
面對(duì)大模型混戰(zhàn)、算力成本高、安全隱憂難解等行業(yè)痛點(diǎn),紅帽以一套貫穿“算力-模型-數(shù)據(jù)-應(yīng)用”的全棧開(kāi)源方案,試圖為企業(yè)打造一條可掌控、低成本、高兼容的 AI 落地路徑。其核心邏輯清晰而堅(jiān)定,以開(kāi)源的方法論解耦技術(shù)枷鎖,讓企業(yè)自由駕馭任意模型、任意加速器、任意云。
紅帽 AI 的“Any”哲學(xué),重構(gòu)企業(yè) AI 自由版圖
我們經(jīng)常看到,紅帽在發(fā)布產(chǎn)品時(shí),會(huì)多次出現(xiàn)“Any(任意)”這個(gè)詞。any cloud,any platform,any hardware,any model,any server,any cloud……而這正是紅帽打造產(chǎn)品的理念。
紅帽大中華區(qū)方案架構(gòu)部總經(jīng)理王慧慧介紹道,紅帽是一家開(kāi)源公司,目標(biāo)是通過(guò)中間層來(lái)解耦硬件和應(yīng)用。通過(guò)打造中間層產(chǎn)品,讓客戶不用擔(dān)心底層硬件設(shè)備,業(yè)務(wù)運(yùn)行在云端還是本地,使用大模型的品牌,以及開(kāi)發(fā)應(yīng)用的語(yǔ)言,讓企業(yè)徹底擺脫技術(shù)選型的難題,真正實(shí)現(xiàn)“任意模型、任意加速器、任意云”的自由部署。
這一理念在 AI 領(lǐng)域涉及四個(gè)層面,從推理加速到數(shù)據(jù)工程,從全棧平臺(tái)到智能體生態(tài),紅帽正以開(kāi)源為基礎(chǔ),重塑企業(yè)級(jí) AI 的生產(chǎn)范式。
首先是推理層面,紅帽推出高效大模型推理解決方案。基于 vLLM 社區(qū)打造的企業(yè)級(jí)推理服務(wù)器,集成量化壓縮工具鏈,對(duì) Qwen、DeepSeek 等主流開(kāi)源模型實(shí)現(xiàn)性能躍升,并且首創(chuàng)llm-d引擎,支持超大規(guī)模推理。
其次是智能數(shù)據(jù)工程平臺(tái)。通過(guò) InstructLab 實(shí)現(xiàn)多語(yǔ)言數(shù)據(jù)對(duì)齊,Doding 引擎處理非結(jié)構(gòu)化數(shù)據(jù),OpenShift AI 集成 Kubeflow 分布式訓(xùn)練框架,讓私域數(shù)據(jù)真正賦能模型進(jìn)化。
第三是全棧 AI 基礎(chǔ)平臺(tái)。全棧 AI 基礎(chǔ)平臺(tái)覆蓋數(shù)據(jù)合成、模型優(yōu)化和生產(chǎn)推理全流程。OpenShift AI 標(biāo)準(zhǔn)化模型庫(kù)和特征倉(cāng)庫(kù),以及MLOps 觀測(cè)體系(監(jiān)控/告警/溯源)的引入,讓企業(yè)從“試驗(yàn)室原型”平滑過(guò)渡至“生產(chǎn)級(jí)負(fù)載”。
第四是智能體開(kāi)發(fā)生態(tài)。以 Llama Stack 統(tǒng)一 API 層整合推理/RAG/工具調(diào)用能力,通過(guò)模型上下文協(xié)議(MCP)實(shí)現(xiàn)智能體互聯(lián)。企業(yè)無(wú)需綁定特定模型或平臺(tái),即可構(gòu)建自主協(xié)作的 AI 智能體。
雙引擎破局 AI 推理“最后一公里”
當(dāng)業(yè)界困于模型訓(xùn)練的爭(zhēng)論時(shí),紅帽已經(jīng)敏銳地捕捉到 AI 商業(yè)化的站在拐點(diǎn)的契機(jī)。王慧慧指出,過(guò)去產(chǎn)業(yè)界聚焦在模型訓(xùn)練階段,探討模型選擇與部署方式,這本質(zhì)上是技術(shù)準(zhǔn)備期,因?yàn)?AI 并沒(méi)有為企業(yè)帶來(lái)實(shí)際價(jià)值,或者是“真金白銀”的收入。
據(jù) Gartner 報(bào)告數(shù)據(jù)顯示,到 2028 年,80%以上的數(shù)據(jù)中心工作負(fù)載加速器將專門部署用于推理,而不是訓(xùn)練用途。可見(jiàn),未來(lái)更多的計(jì)算資源都是集中在推理階段,這也是紅帽大力投入到推理方面的原因。
在推理層面,業(yè)界普遍遇到兩個(gè)問(wèn)題,如何使用最小的硬件設(shè)備、最小的成本,完成最高性能推理。二是是否可以將推理的工作量分散到不同服務(wù)器上進(jìn)行,而不是集中在單一一臺(tái)服務(wù)器上。
為此,紅帽以兩大技術(shù)利器破局,vLLM 推理服務(wù)器和 llm-d 分布式推理引擎。
vLLM 推理服務(wù)器向上無(wú)縫集成 Qwen、DeepSeek、Llama、Mistral 等主流開(kāi)源模型,通過(guò)獨(dú)創(chuàng)的量化壓縮工具鏈實(shí)現(xiàn)性能指標(biāo)提升,向下兼容 NVIDIA、AMD、Google TPU、AWS Neuron 等加速器。值得注意的是,vLLM 推理服務(wù)器的架構(gòu)更加靈活,既可以運(yùn)行在單臺(tái)服務(wù)器,又可以橫向擴(kuò)展至多節(jié)點(diǎn)集群,并且跨越物理機(jī)、虛擬機(jī)、私有云及邊緣設(shè)備實(shí)現(xiàn)一致體驗(yàn)。
王慧慧表示,紅帽的產(chǎn)品布局始終貫穿著“解耦”哲學(xué)。“從 Linux 到容器,從 vLLM 到 llm-d,我們幫助用戶規(guī)避復(fù)雜的硬件環(huán)境、開(kāi)發(fā)技術(shù)和過(guò)載的模型選擇。”
這種理念延伸至交付模式:企業(yè)可獨(dú)立部署 vLLM 推理服務(wù)器,或者選擇 RHEL AI(操作系統(tǒng)+推理服務(wù)捆綁包),也可以嵌入 OpenShift AI 平臺(tái),三種形態(tài)自由適配不同場(chǎng)景,既能獨(dú)立運(yùn)行發(fā)揮專長(zhǎng),亦可組合實(shí)現(xiàn)“1+1>2”的協(xié)同效應(yīng)。
llm-d 分布式推理引擎,是基于 Kubernetes 容器架構(gòu)與 vLLM 分布式邏輯,它將推理任務(wù)智能拆解到多臺(tái)服務(wù)器協(xié)同處理,突破單機(jī)算力天花板,實(shí)現(xiàn)大規(guī)模推理。此外,企業(yè)可按需構(gòu)建 llm-d 分布式推理架構(gòu),并支持私域劃分,可按照部門劃分專屬資源池,確保敏感數(shù)據(jù)不越界。這一創(chuàng)新吸引 AMD、Cisco、IBM、Hugging Face 等巨頭加入聯(lián)盟,共同推動(dòng)分布式推理標(biāo)準(zhǔn)化。
在紅帽的藍(lán)圖中,推理不再是孤立的技術(shù)節(jié)點(diǎn),而是連接模型價(jià)值與商業(yè)回報(bào)的樞紐。當(dāng)“任意模型、任意加速器、任意云”的兼容性成為現(xiàn)實(shí),企業(yè)終于能擺脫技術(shù)枷鎖,專注讓 AI 真正服務(wù)于業(yè)務(wù)增長(zhǎng)的核心命題。
以開(kāi)放協(xié)議重構(gòu) AI 協(xié)作范式
在推理技術(shù)突破之后,紅帽正沿著“任意模型、任意加速器、任意云”的理念延伸至智能體領(lǐng)域,以開(kāi)放協(xié)議重構(gòu)企業(yè) AI 協(xié)作的底層規(guī)則。
2025 年也被稱為是 AI 智能體元年。王慧慧坦言,智能體還是剛剛興起,還不能完全斷定智能體的未來(lái)發(fā)展方向。在紅帽看來(lái),Llama Stack 工具鏈與模型上下文協(xié)議(MCP)會(huì)是未來(lái)熱門走向,也是目前較為領(lǐng)先的技術(shù)堆棧。
因此,紅帽 AI 平臺(tái)引入了 Llama Stack 工具鏈和 MCP 協(xié)議,使開(kāi)發(fā)者擺脫模型與平臺(tái)的綁定,通過(guò)紅帽 AI 平臺(tái)打造屬于自己的智能體,讓開(kāi)發(fā)人員無(wú)需關(guān)心模型選擇和數(shù)據(jù)平臺(tái)。
如今,各家模型廠商都在打造自己的智能體生態(tài),那么紅帽的智能體開(kāi)發(fā)生態(tài)又有哪些優(yōu)勢(shì)呢?紅帽大中華區(qū)首席架構(gòu)師張家駒介紹了三點(diǎn)優(yōu)勢(shì)。
首先,紅帽通過(guò)一套開(kāi)源技術(shù)和堆棧貫穿虛擬化應(yīng)用、云原生架構(gòu)和智能體開(kāi)發(fā),徹底打破傳統(tǒng) IT 系統(tǒng)與智能體之間的割裂。其次,紅帽通過(guò)集成不同協(xié)議,支持開(kāi)發(fā)者自由選擇模型,避免被技術(shù)綁架,當(dāng)前已經(jīng)集成 MCP 協(xié)議,A2A 協(xié)議也在快速推進(jìn)中。第三,紅帽也在和低代碼開(kāi)發(fā)平臺(tái)進(jìn)行合作,企業(yè)可以在紅帽 AI 平臺(tái)上使用低代碼開(kāi)發(fā)工具開(kāi)發(fā)自己的企業(yè)級(jí)應(yīng)用。
通過(guò)協(xié)議開(kāi)放、技術(shù)解耦與生態(tài)協(xié)同,紅帽為企業(yè) AI 應(yīng)用開(kāi)辟了從工具到平臺(tái)、從單點(diǎn)應(yīng)用到生態(tài)網(wǎng)絡(luò)的進(jìn)化路徑。
結(jié)語(yǔ)
“當(dāng)下企業(yè)若想開(kāi)展企業(yè)級(jí) AI 建設(shè),找紅帽就對(duì)了。”曹衡康表示,紅帽以全棧解決方案、成本卓效、安全可控和開(kāi)放生態(tài)四大優(yōu)勢(shì),成為企業(yè)級(jí) AI 建設(shè)的優(yōu)選伙伴。
當(dāng)業(yè)界仍在爭(zhēng)論大模型與小模型、公有云與私有部署時(shí),紅帽已用開(kāi)源之手推開(kāi)一扇新門,沒(méi)有非此即彼的站隊(duì),只有基于開(kāi)放標(biāo)準(zhǔn)的自由組合。在這場(chǎng) AI 重塑生產(chǎn)力的長(zhǎng)征中,紅帽正以解耦為劍,以兼容為盾,成為企業(yè)穿越技術(shù)迷霧的引路者。