為什么你的 AI 數(shù)據(jù)戰(zhàn)略應(yīng)該包含 MCP

作者：曉曉 2025-06-25 02:30:00

這篇文章介紹了 MCP 作為 AI 原生集成標(biāo)準(zhǔn)的工作原理、其主要特性、與 API 的關(guān)系、相對(duì)于 RAG 系統(tǒng)的優(yōu)勢(shì)、實(shí)施策略以及組織的運(yùn)營(yíng)考慮因素。

隨著代理系統(tǒng)變得越來(lái)越復(fù)雜，企業(yè)能力在這些系統(tǒng)中作為工具出現(xiàn)，建立明確且一致的規(guī)則對(duì)于自主工作流程的成功至關(guān)重要。

模型上下文協(xié)議 (MCP) 為代理、LLM 和企業(yè)系統(tǒng)提供通用語(yǔ)言。將 MCP 納入 AI 數(shù)據(jù)戰(zhàn)略的企業(yè)將能夠構(gòu)建新功能，確保信任和可審計(jì)性，并適應(yīng)快速發(fā)展的創(chuàng)新。競(jìng)爭(zhēng)優(yōu)勢(shì)將源于周到的設(shè)計(jì)、強(qiáng)大的可操作性和學(xué)習(xí)意愿。

什么是 MCP？它為何重要？

MCP 于 2024 年底推出，是一種開放的 AI 原生協(xié)議，用于描述外部工具、函數(shù)、API 和數(shù)據(jù)集，使 LLM 能夠自行決定如何以及何時(shí)使用它們。它基于數(shù)十年 API、SOAP、REST 和 OpenAPI/Swagger 的經(jīng)驗(yàn)教訓(xùn)——但至關(guān)重要的是，它是為機(jī)器而非人類的消費(fèi)和推理而設(shè)計(jì)的。

MCP 支持功能發(fā)現(xiàn)，代理或 LLM 可以確定哪些操作是可行的，以及成功執(zhí)行這些操作所需的上下文。它通過(guò)詳細(xì)的描述提供豐富的語(yǔ)義，幫助 LLM 理解如何使用、何時(shí)以及為何使用一項(xiàng)功能。MCP 通過(guò)一致的接口公開各種資源（API、數(shù)據(jù)庫(kù)和內(nèi)部工具），從而提供一致性。它還通過(guò)提供一個(gè)抽象層來(lái)支持可組合性，該抽象層用于在復(fù)雜的代理工作流中連接、組合和編排服務(wù)和數(shù)據(jù)源。

示例：Excel 即服務(wù)

假設(shè)一位業(yè)務(wù)用戶想要通過(guò) AI 助手操作 Excel 電子表格中的數(shù)據(jù)。傳統(tǒng)方法需要專門構(gòu)建的 API 連接器或自定義提示“配方”，用于執(zhí)行每個(gè)操作，例如添加行、重新計(jì)算列或設(shè)置格式。這種集成非常繁瑣。

借助 MCP，Excel 服務(wù)可以通過(guò) MCP 公開其功能（包括其存儲(chǔ)的數(shù)據(jù)類型和提供的功能）。代理可以讀取這些信息，推斷可用的操作，并執(zhí)行諸如“添加季度增長(zhǎng)率列”之類的任務(wù)，而無(wú)需進(jìn)行自定義集成工作。

MCP 與 API 的關(guān)系和區(qū)別

MCP 可以被視為一次進(jìn)化的飛躍。傳統(tǒng)的 API 充當(dāng)系統(tǒng)交互的“名詞和動(dòng)詞”，而 MCP 不僅闡明了存在哪些操作，還闡明了如何以豐富、靈活的方式（適合 AI 代理）使用它們。

API 和 MCP 都提供了定義客戶端可以對(duì)系統(tǒng)執(zhí)行哪些操作的契約。它們都可以組合起來(lái)，以編排更復(fù)雜的工作流程。兩者都依賴于良好的設(shè)計(jì)，因?yàn)樵O(shè)計(jì)不良的 API 或描述不良的 MCP 端點(diǎn)會(huì)導(dǎo)致混亂、功能無(wú)法使用或下游問(wèn)題。

然而，它們之間存在著關(guān)鍵的區(qū)別。API 是為人類開發(fā)人員設(shè)計(jì)的，而 MCP 是為能夠讀取并“推理”詳細(xì)描述和上下文的 AI 模型設(shè)計(jì)的。API 通常需要手動(dòng)編寫，而 MCP 則明確面向能夠?qū)崟r(shí)決定使用哪些工具以及如何使用的代理推理系統(tǒng)。MCP 可以輕松地以自由形式的敘述（而不僅僅是形式參數(shù)）來(lái)描述語(yǔ)義關(guān)系和上下文——這有助于 LLM 驅(qū)動(dòng)的決策。

假設(shè)用例：ERP 集成

一家零售商的 ERP 系統(tǒng)包含數(shù)十個(gè) API（庫(kù)存、定價(jià)、訂單）。以前，開發(fā)人員必須學(xué)習(xí)每個(gè) API，閱讀文檔，編寫代碼，并處理各種邊緣情況。

通過(guò) MCP，一個(gè)描述良好的界面即可展現(xiàn)業(yè)務(wù)優(yōu)先的功能：“檢索當(dāng)前庫(kù)存水平”、“檢查缺貨訂單”、“將價(jià)格上調(diào) 5%”。負(fù)責(zé)“準(zhǔn)備低庫(kù)存警報(bào)報(bào)告”的 LLM 代理可以使用語(yǔ)義描述來(lái)發(fā)現(xiàn)、組合和排序這些功能，即使這些功能是跨 API、數(shù)據(jù)庫(kù)或遺留系統(tǒng)實(shí)現(xiàn)的。

超越檢索增強(qiáng)生成：人工智能應(yīng)用集成的下一步

檢索增強(qiáng)生成 (RAG)幫助模型在推理時(shí)檢索外部信息，并通過(guò)最新或特定于企業(yè)的上下文來(lái)增強(qiáng)其響應(yīng)能力。然而，RAG 主要關(guān)注的是數(shù)據(jù)檢索，而非操作。

MCP 更進(jìn)一步，提供了工具契約，使 LLM 不僅能夠查找信息，還能調(diào)用操作。它通過(guò)描述提供語(yǔ)義指導(dǎo)，闡明工具的功能、使用時(shí)機(jī)、副作用以及預(yù)期的輸入/輸出類型。MCP 支持統(tǒng)一的編排，使 LLM 能夠以單一、一致的方式理解后端并與之交互，無(wú)論后端是 REST API、直接 SQL 接口還是其他接口。

示例：自動(dòng)化支出管理

想要實(shí)現(xiàn)月度費(fèi)用審批自動(dòng)化的企業(yè)可以使用 LLM 代理，該代理會(huì)檢查已提交的請(qǐng)求（使用 RAG），然后使用 MCP 公開的 SQL 數(shù)據(jù)庫(kù)工具來(lái)審計(jì)預(yù)算消耗，在發(fā)現(xiàn)異常時(shí)調(diào)用 MCP 的“通知管理器”功能，并在 MCP 公開的 ERP 系統(tǒng)中記錄記錄。該代理無(wú)需使用脆弱的腳本或點(diǎn)對(duì)點(diǎn)集成，而是在豐富的 MCP 描述指導(dǎo)下動(dòng)態(tài)導(dǎo)航功能。

MCP設(shè)計(jì)和操作化的重要性

對(duì)于 API 而言，成功通常取決于清晰、以開發(fā)者為中心的設(shè)計(jì)。而使用 MCP，您編寫的模型會(huì)關(guān)注每一個(gè)字詞。LLM 能夠處理詳盡的文檔、示例和細(xì)微差別，因此，全面性和清晰度會(huì)帶來(lái)回報(bào)。

一個(gè)好的薪資 MCP 端點(diǎn)不僅僅是被描述為“update_salary”。其文檔解釋道：“使用此功能調(diào)整員工薪酬。典型場(chǎng)景：年度加薪、特別獎(jiǎng)金。要求：employee_id、new_salary、reason。觸發(fā)通知給人力資源和財(cái)務(wù)部門。”

一個(gè)糟糕的例子是“可調(diào)用對(duì)象：update（eid，val）”，它沒(méi)有提供任何上下文，可能會(huì)被 LLM（或人類）誤用或忽略。

陷阱：糟糕的設(shè)計(jì)會(huì)延續(xù)下去

與 API 一樣，后端結(jié)構(gòu)與業(yè)務(wù)流程之間缺乏一致性會(huì)導(dǎo)致混亂。將原始數(shù)據(jù)庫(kù)模式表達(dá)為 MCP 端點(diǎn)，或用技術(shù)術(shù)語(yǔ)公開每個(gè)方法，都違背了初衷。LLM 可以彌補(bǔ)一些歧義，但無(wú)法完全克服清晰度或業(yè)務(wù)上下文的缺失。

資源考慮

AI 操作并非免費(fèi)：每個(gè)令牌和每次調(diào)用都需要計(jì)算資源，進(jìn)而也需要資金。如果客服人員天真地重復(fù)或過(guò)度調(diào)用，后端可能會(huì)不堪重負(fù)，預(yù)算也可能超支。

緩解策略包括使用精確的、以任務(wù)為中心的 MCP 端點(diǎn)，在 MCP 描述中指示成本、副作用或推薦的使用模式，并根據(jù)需要實(shí)施緩存或限制，同時(shí)將這些限制告知代理。

新的測(cè)試、監(jiān)控和管理模式

測(cè)試確定性 API 很簡(jiǎn)單，但由 MCP 支持的代理 AI 引入了可變性：相同的請(qǐng)求可能會(huì)根據(jù)上下文、負(fù)載或細(xì)微的提示差異產(chǎn)生不同的工具鏈。

MCP 世界中的 QA 包括合成任務(wù)生成以創(chuàng)建代表性任務(wù)并自動(dòng)化測(cè)試運(yùn)行、邊緣案例分析以監(jiān)控?zé)o效的工具選擇或資源問(wèn)題，以及凍干模式以將可靠的工具鏈“凍結(jié)”為固定序列或新的 MCP 端點(diǎn)。

自動(dòng)化的連續(xù)體：代理和程序

并非所有問(wèn)題都需要自由形式的代理編排。許多企業(yè)工作流程一旦發(fā)現(xiàn)，最好進(jìn)行硬編碼，以提高效率和可預(yù)測(cè)性。相同的 MCP 基礎(chǔ)架構(gòu)可以同時(shí)支持這兩種方法，在需要的地方提供靈活性，在其他地方提供確定性。

企業(yè)戰(zhàn)略的最終考慮

MCP 屬于 AI 數(shù)據(jù)庫(kù)，因?yàn)樗ㄟ^(guò)減少逐案定制集成的需要來(lái)加速集成，通過(guò)詳細(xì)描述的功能來(lái)提高透明度和信任度，通過(guò)防止“失控”的計(jì)算費(fèi)用來(lái)降低成本，并通過(guò)帶來(lái)適應(yīng)性來(lái)確保架構(gòu)的未來(lái)性。

可行的步驟包括從小處著手，通過(guò) MCP 公開關(guān)鍵 API 或工具，通過(guò)詳細(xì)說(shuō)明功能使用的原因、時(shí)間和后果來(lái)進(jìn)行清晰的設(shè)計(jì)，迭代和凍結(jié)成功的工作流程，規(guī)劃包括成本和資源監(jiān)控在內(nèi)的運(yùn)營(yíng)，并通過(guò)試點(diǎn)和分析進(jìn)行邊做邊學(xué)。

常見(jiàn)問(wèn)題

人工智能中的數(shù)據(jù)戰(zhàn)略是什么？

人工智能中的數(shù)據(jù)戰(zhàn)略是指組織如何收集、管理、存儲(chǔ)和使用數(shù)據(jù)來(lái)驅(qū)動(dòng)人工智能系統(tǒng)的全面規(guī)劃。它涵蓋數(shù)據(jù)治理、質(zhì)量控制、集成方法以及像 MCP 這樣的工具，使人工智能系統(tǒng)能夠有效地訪問(wèn)和使用組織數(shù)據(jù)。良好的人工智能數(shù)據(jù)策略能夠確保人工智能代理能夠發(fā)現(xiàn)、理解并合理利用所有可用的數(shù)據(jù)資源和工具，從而實(shí)現(xiàn)業(yè)務(wù)價(jià)值。

什么是 AI-first 數(shù)據(jù)策略？

AI 優(yōu)先的數(shù)據(jù)策略優(yōu)先考慮專為 AI 消費(fèi)而非人類消費(fèi)而設(shè)計(jì)的數(shù)據(jù)系統(tǒng)。它致力于通過(guò)實(shí)施 MCP 等協(xié)議，使 AI 系統(tǒng)能夠理解上下文、發(fā)現(xiàn)功能并采取適當(dāng)?shù)男袆?dòng)，從而使數(shù)據(jù)具備 AI 就緒性。這種方法強(qiáng)調(diào)語(yǔ)義豐富性、跨不同數(shù)據(jù)源的一致性以及服務(wù)的可組合性，從而使 AI 代理能夠高效工作，而無(wú)需大量的人工干預(yù)或針對(duì)每個(gè)用例進(jìn)行自定義集成。

數(shù)據(jù)策略的一個(gè)例子是什么？

數(shù)據(jù)策略的一個(gè)實(shí)際例子是企業(yè)實(shí)施 MCP 來(lái)統(tǒng)一對(duì)其各個(gè)系統(tǒng)的訪問(wèn)。例如，零售商可能會(huì)制定一個(gè)全面的數(shù)據(jù)策略，該策略包括：