為什么你的 AI 數(shù)據(jù)戰(zhàn)略應(yīng)該包含 MCP
隨著代理系統(tǒng)變得越來(lái)越復(fù)雜,企業(yè)能力在這些系統(tǒng)中作為工具出現(xiàn),建立明確且一致的規(guī)則對(duì)于自主工作流程的成功至關(guān)重要。
模型上下文協(xié)議 (MCP) 為代理、LLM 和企業(yè)系統(tǒng)提供通用語(yǔ)言。將 MCP 納入 AI 數(shù)據(jù)戰(zhàn)略的企業(yè)將能夠構(gòu)建新功能,確保信任和可審計(jì)性,并適應(yīng)快速發(fā)展的創(chuàng)新。競(jìng)爭(zhēng)優(yōu)勢(shì)將源于周到的設(shè)計(jì)、強(qiáng)大的可操作性和學(xué)習(xí)意愿。
這篇文章介紹了 MCP 作為 AI 原生集成標(biāo)準(zhǔn)的工作原理、其主要特性、與 API 的關(guān)系、相對(duì)于 RAG 系統(tǒng)的優(yōu)勢(shì)、實(shí)施策略以及組織的運(yùn)營(yíng)考慮因素。
什么是 MCP?它為何重要?
MCP 于 2024 年底推出,是一種開放的 AI 原生協(xié)議,用于描述外部工具、函數(shù)、API 和數(shù)據(jù)集,使 LLM 能夠自行決定如何以及何時(shí)使用它們。它基于數(shù)十年 API、SOAP、REST 和 OpenAPI/Swagger 的經(jīng)驗(yàn)教訓(xùn)——但至關(guān)重要的是,它是為機(jī)器而非人類的消費(fèi)和推理而設(shè)計(jì)的。
MCP 支持功能發(fā)現(xiàn),代理或 LLM 可以確定哪些操作是可行的,以及成功執(zhí)行這些操作所需的上下文。它通過(guò)詳細(xì)的描述提供豐富的語(yǔ)義,幫助 LLM 理解如何使用、何時(shí)以及為何使用一項(xiàng)功能。MCP 通過(guò)一致的接口公開各種資源(API、數(shù)據(jù)庫(kù)和內(nèi)部工具),從而提供一致性。它還通過(guò)提供一個(gè)抽象層來(lái)支持可組合性,該抽象層用于在復(fù)雜的代理工作流中連接、組合和編排服務(wù)和數(shù)據(jù)源。
示例:Excel 即服務(wù)
假設(shè)一位業(yè)務(wù)用戶想要通過(guò) AI 助手操作 Excel 電子表格中的數(shù)據(jù)。傳統(tǒng)方法需要專門構(gòu)建的 API 連接器或自定義提示“配方”,用于執(zhí)行每個(gè)操作,例如添加行、重新計(jì)算列或設(shè)置格式。這種集成非常繁瑣。
借助 MCP,Excel 服務(wù)可以通過(guò) MCP 公開其功能(包括其存儲(chǔ)的數(shù)據(jù)類型和提供的功能)。代理可以讀取這些信息,推斷可用的操作,并執(zhí)行諸如“添加季度增長(zhǎng)率列”之類的任務(wù),而無(wú)需進(jìn)行自定義集成工作。
MCP 與 API 的關(guān)系和區(qū)別
MCP 可以被視為一次進(jìn)化的飛躍。傳統(tǒng)的 API 充當(dāng)系統(tǒng)交互的“名詞和動(dòng)詞”,而 MCP 不僅闡明了存在哪些操作,還闡明了如何以豐富、靈活的方式(適合 AI 代理)使用它們。
API 和 MCP 都提供了定義客戶端可以對(duì)系統(tǒng)執(zhí)行哪些操作的契約。它們都可以組合起來(lái),以編排更復(fù)雜的工作流程。兩者都依賴于良好的設(shè)計(jì),因?yàn)樵O(shè)計(jì)不良的 API 或描述不良的 MCP 端點(diǎn)會(huì)導(dǎo)致混亂、功能無(wú)法使用或下游問(wèn)題。
然而,它們之間存在著關(guān)鍵的區(qū)別。API 是為人類開發(fā)人員設(shè)計(jì)的,而 MCP 是為能夠讀取并“推理”詳細(xì)描述和上下文的 AI 模型設(shè)計(jì)的。API 通常需要手動(dòng)編寫,而 MCP 則明確面向能夠?qū)崟r(shí)決定使用哪些工具以及如何使用的代理推理系統(tǒng)。MCP 可以輕松地以自由形式的敘述(而不僅僅是形式參數(shù))來(lái)描述語(yǔ)義關(guān)系和上下文——這有助于 LLM 驅(qū)動(dòng)的決策。
假設(shè)用例:ERP 集成
一家零售商的 ERP 系統(tǒng)包含數(shù)十個(gè) API(庫(kù)存、定價(jià)、訂單)。以前,開發(fā)人員必須學(xué)習(xí)每個(gè) API,閱讀文檔,編寫代碼,并處理各種邊緣情況。
通過(guò) MCP,一個(gè)描述良好的界面即可展現(xiàn)業(yè)務(wù)優(yōu)先的功能:“檢索當(dāng)前庫(kù)存水平”、“檢查缺貨訂單”、“將價(jià)格上調(diào) 5%”。負(fù)責(zé)“準(zhǔn)備低庫(kù)存警報(bào)報(bào)告”的 LLM 代理可以使用語(yǔ)義描述來(lái)發(fā)現(xiàn)、組合和排序這些功能,即使這些功能是跨 API、數(shù)據(jù)庫(kù)或遺留系統(tǒng)實(shí)現(xiàn)的。
超越檢索增強(qiáng)生成:人工智能應(yīng)用集成的下一步
檢索增強(qiáng)生成 (RAG)幫助模型在推理時(shí)檢索外部信息,并通過(guò)最新或特定于企業(yè)的上下文來(lái)增強(qiáng)其響應(yīng)能力。然而,RAG 主要關(guān)注的是數(shù)據(jù)檢索,而非操作。
MCP 更進(jìn)一步,提供了工具契約,使 LLM 不僅能夠查找信息,還能調(diào)用操作。它通過(guò)描述提供語(yǔ)義指導(dǎo),闡明工具的功能、使用時(shí)機(jī)、副作用以及預(yù)期的輸入/輸出類型。MCP 支持統(tǒng)一的編排,使 LLM 能夠以單一、一致的方式理解后端并與之交互,無(wú)論后端是 REST API、直接 SQL 接口還是其他接口。
示例:自動(dòng)化支出管理
想要實(shí)現(xiàn)月度費(fèi)用審批自動(dòng)化的企業(yè)可以使用 LLM 代理,該代理會(huì)檢查已提交的請(qǐng)求(使用 RAG),然后使用 MCP 公開的 SQL 數(shù)據(jù)庫(kù)工具來(lái)審計(jì)預(yù)算消耗,在發(fā)現(xiàn)異常時(shí)調(diào)用 MCP 的“通知管理器”功能,并在 MCP 公開的 ERP 系統(tǒng)中記錄記錄。該代理無(wú)需使用脆弱的腳本或點(diǎn)對(duì)點(diǎn)集成,而是在豐富的 MCP 描述指導(dǎo)下動(dòng)態(tài)導(dǎo)航功能。
MCP設(shè)計(jì)和操作化的重要性
對(duì)于 API 而言,成功通常取決于清晰、以開發(fā)者為中心的設(shè)計(jì)。而使用 MCP,您編寫的模型會(huì)關(guān)注每一個(gè)字詞。LLM 能夠處理詳盡的文檔、示例和細(xì)微差別,因此,全面性和清晰度會(huì)帶來(lái)回報(bào)。
一個(gè)好的薪資 MCP 端點(diǎn)不僅僅是被描述為“update_salary”。其文檔解釋道:“使用此功能調(diào)整員工薪酬。典型場(chǎng)景:年度加薪、特別獎(jiǎng)金。要求:employee_id、new_salary、reason。觸發(fā)通知給人力資源和財(cái)務(wù)部門。”
一個(gè)糟糕的例子是“可調(diào)用對(duì)象:update(eid,val)”,它沒(méi)有提供任何上下文,可能會(huì)被 LLM(或人類)誤用或忽略。
陷阱:糟糕的設(shè)計(jì)會(huì)延續(xù)下去
與 API 一樣,后端結(jié)構(gòu)與業(yè)務(wù)流程之間缺乏一致性會(huì)導(dǎo)致混亂。將原始數(shù)據(jù)庫(kù)模式表達(dá)為 MCP 端點(diǎn),或用技術(shù)術(shù)語(yǔ)公開每個(gè)方法,都違背了初衷。LLM 可以彌補(bǔ)一些歧義,但無(wú)法完全克服清晰度或業(yè)務(wù)上下文的缺失。
資源考慮
AI 操作并非免費(fèi):每個(gè)令牌和每次調(diào)用都需要計(jì)算資源,進(jìn)而也需要資金。如果客服人員天真地重復(fù)或過(guò)度調(diào)用,后端可能會(huì)不堪重負(fù),預(yù)算也可能超支。
緩解策略包括使用精確的、以任務(wù)為中心的 MCP 端點(diǎn),在 MCP 描述中指示成本、副作用或推薦的使用模式,并根據(jù)需要實(shí)施緩存或限制,同時(shí)將這些限制告知代理。
新的測(cè)試、監(jiān)控和管理模式
測(cè)試確定性 API 很簡(jiǎn)單,但由 MCP 支持的代理 AI 引入了可變性:相同的請(qǐng)求可能會(huì)根據(jù)上下文、負(fù)載或細(xì)微的提示差異產(chǎn)生不同的工具鏈。
MCP 世界中的 QA 包括合成任務(wù)生成以創(chuàng)建代表性任務(wù)并自動(dòng)化測(cè)試運(yùn)行、邊緣案例分析以監(jiān)控?zé)o效的工具選擇或資源問(wèn)題,以及凍干模式以將可靠的工具鏈“凍結(jié)”為固定序列或新的 MCP 端點(diǎn)。
自動(dòng)化的連續(xù)體:代理和程序
并非所有問(wèn)題都需要自由形式的代理編排。許多企業(yè)工作流程一旦發(fā)現(xiàn),最好進(jìn)行硬編碼,以提高效率和可預(yù)測(cè)性。相同的 MCP 基礎(chǔ)架構(gòu)可以同時(shí)支持這兩種方法,在需要的地方提供靈活性,在其他地方提供確定性。
企業(yè)戰(zhàn)略的最終考慮
MCP 屬于 AI 數(shù)據(jù)庫(kù),因?yàn)樗ㄟ^(guò)減少逐案定制集成的需要來(lái)加速集成,通過(guò)詳細(xì)描述的功能來(lái)提高透明度和信任度,通過(guò)防止“失控”的計(jì)算費(fèi)用來(lái)降低成本,并通過(guò)帶來(lái)適應(yīng)性來(lái)確保架構(gòu)的未來(lái)性。
可行的步驟包括從小處著手,通過(guò) MCP 公開關(guān)鍵 API 或工具,通過(guò)詳細(xì)說(shuō)明功能使用的原因、時(shí)間和后果來(lái)進(jìn)行清晰的設(shè)計(jì),迭代和凍結(jié)成功的工作流程,規(guī)劃包括成本和資源監(jiān)控在內(nèi)的運(yùn)營(yíng),并通過(guò)試點(diǎn)和分析進(jìn)行邊做邊學(xué)。
常見(jiàn)問(wèn)題
人工智能中的數(shù)據(jù)戰(zhàn)略是什么?
人工智能中的數(shù)據(jù)戰(zhàn)略是指組織如何收集、管理、存儲(chǔ)和使用數(shù)據(jù)來(lái)驅(qū)動(dòng)人工智能系統(tǒng)的全面規(guī)劃。它涵蓋數(shù)據(jù)治理、質(zhì)量控制、集成方法以及像 MCP 這樣的工具,使人工智能系統(tǒng)能夠有效地訪問(wèn)和使用組織數(shù)據(jù)。良好的人工智能數(shù)據(jù)策略能夠確保人工智能代理能夠發(fā)現(xiàn)、理解并合理利用所有可用的數(shù)據(jù)資源和工具,從而實(shí)現(xiàn)業(yè)務(wù)價(jià)值。
什么是 AI-first 數(shù)據(jù)策略?
AI 優(yōu)先的數(shù)據(jù)策略優(yōu)先考慮專為 AI 消費(fèi)而非人類消費(fèi)而設(shè)計(jì)的數(shù)據(jù)系統(tǒng)。它致力于通過(guò)實(shí)施 MCP 等協(xié)議,使 AI 系統(tǒng)能夠理解上下文、發(fā)現(xiàn)功能并采取適當(dāng)?shù)男袆?dòng),從而使數(shù)據(jù)具備 AI 就緒性。這種方法強(qiáng)調(diào)語(yǔ)義豐富性、跨不同數(shù)據(jù)源的一致性以及服務(wù)的可組合性,從而使 AI 代理能夠高效工作,而無(wú)需大量的人工干預(yù)或針對(duì)每個(gè)用例進(jìn)行自定義集成。
數(shù)據(jù)策略的一個(gè)例子是什么?
數(shù)據(jù)策略的一個(gè)實(shí)際例子是企業(yè)實(shí)施 MCP 來(lái)統(tǒng)一對(duì)其各個(gè)系統(tǒng)的訪問(wèn)。例如,零售商可能會(huì)制定一個(gè)全面的數(shù)據(jù)策略,該策略包括:
- 通過(guò) MCP 接口公開庫(kù)存、定價(jià)和訂單系統(tǒng)
- 為每項(xiàng)功能創(chuàng)建清晰的語(yǔ)義描述
- 對(duì)人工智能代理交互實(shí)施適當(dāng)?shù)臏y(cè)試和監(jiān)控
- 建立數(shù)據(jù)訪問(wèn)和操作的治理協(xié)議
- 開發(fā)成本控制機(jī)制以防止失控的計(jì)算費(fèi)用
- 創(chuàng)建一個(gè)流程來(lái)識(shí)別成功的 AI 工作流程,并對(duì)其進(jìn)行“冷凍干燥”以提高效率
- 構(gòu)建具有一致元數(shù)據(jù)標(biāo)準(zhǔn)的集中式數(shù)據(jù)湖
- 在信息進(jìn)入人工智能系統(tǒng)之前建立數(shù)據(jù)質(zhì)量控制流程
這種方法可以使企業(yè)逐步構(gòu)建人工智能功能,同時(shí)保持對(duì)代理與關(guān)鍵業(yè)務(wù)系統(tǒng)交互方式的控制。