成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

登上熱搜!Prompt不再是AI重點,新熱點是Context Engineering

人工智能 新聞
Phil Schmid 介紹上下文工程的文章成為 Hacker News 榜首,還登上了知乎熱搜榜。

最近「上下文工程」有多火?Andrej Karpathy 為其打 Call,Phil Schmid 介紹上下文工程的文章成為 Hacker News 榜首,還登上了知乎熱搜榜。

image.png

之前我們介紹了上下文工程的基本概念,今天我們來聊聊實操。

為什么關注「上下文工程」

我們很容易將 LLM 擬人化——把它們當作能夠「思考」、「理解」或「感到困惑」的超級助手。從工程學的角度來看,這是一個根本性的錯誤。LLM 并不具備信念或意圖,它是一個智能的文本生成器。

更準確的看法是:LLM 是一個通用的、不確定的函數(shù)。這個函數(shù)的工作方式是:你給它一段文本(上下文),它會生成一段新的文本(輸出)。

image.png

  • 通用:意味著它能處理各種任務(如翻譯、寫代碼),無需為每個任務單獨編程。
  • 不確定:意味著同樣的輸入,每次可能得到稍有不同的輸出。這是它的特點,不是毛病。
  • 無狀態(tài):意味著它沒有記憶。你必須在每次輸入時,提供所有相關的背景信息,它才能「記住」對話。

這個視角至關重要,因為它明確了我們的工作重心:我們無法改變模型本身,但可以完全控制輸入。所有優(yōu)化的關鍵,在于如何構建最有效的輸入文本(即上下文),來引導模型生成我們期望的輸出。

「提示詞工程」一度很火,但它過于強調尋找一句完美的「魔法咒語」。這種方法在真實應用中并不可靠,因為「咒語」可能因模型更新而失效,且實際輸入遠比單句指令復雜。

一個更精準、更系統(tǒng)的概念是「上下文工程」。

圖片

兩者的核心區(qū)別在于:

  • 提示詞工程:核心是手動構思一小段神奇的指令,如同念咒。
  • 上下文工程:核心是構建一個自動化系統(tǒng),像設計一條「信息流水線」。該系統(tǒng)負責從數(shù)據(jù)庫、文檔等來源自動抓取、整合信息,并將其打包成完整的上下文,再喂給模型。

正如 Andrej Karpathy 所說,LLM 是一種新型的操作系統(tǒng)。我們的任務不是給它下達零散的命令,而是為它準備好運行所需的所有數(shù)據(jù)和環(huán)境。

上下文工程的核心要素

簡單說,「上下文工程」就是打造一個「超級輸入」的工具箱。我們聽到的各種時髦技術(比如 RAG、智能體),都只是這個工具箱里的工具而已。

目標只有一個:把最有效的信息,用最合適的格式,在最恰當?shù)臅r機,喂給模型。

image.png

以下是工具箱里的幾種核心要素:

  • 指令:下達命令這是最基礎的,就是直接告訴模型該做什么。比如命令它「扮演一個專家」,或者給它看幾個例子,讓它照著學。
  • 知識:賦予「記憶」 模型本身沒有記憶,所以我們要幫它記住。在聊天機器人里,就是把聊天記錄一起發(fā)給它。如果記錄太長,就做個「摘要」或者只保留最近的對話。
  • 工具:
  • 檢索增強生成 (RAG):給它一本「開卷考試」用的參考書為了防止模型瞎說(產(chǎn)生幻覺),我們可以讓系統(tǒng)先從我們自己的知識庫(比如公司文檔)里查找相關資料,然后把「參考資料」和問題一起交給模型,讓它根據(jù)事實來回答。
  • 智能體:讓它自己去「查資料」

image.png

這是更高級的玩法。我們不再是提前準備好所有資料,而是讓一個聰明的「智能體」自己判斷需要什么信息,然后主動使用工具(比如上網(wǎng)搜索、查數(shù)據(jù)庫)去尋找答案,最后再匯總起來解決問題。

總而言之,所有這些技術,無論簡單還是復雜,都是在回答這一個問題:「怎樣才能給模型打造出最完美的輸入內容?」

上下文工程的實踐方法論

使用 LLM 更像做科學實驗,而不是搞藝術創(chuàng)作。你不能靠猜,必須通過測試來驗證。

工程師的核心能力不是寫出花哨的提示,而是懂得如何用一套科學流程來持續(xù)改進系統(tǒng)。這套流程分兩步:

第一步:從后往前規(guī)劃(定目標 → 拆任務)

從你想要的最終結果出發(fā),反向推導出系統(tǒng)的樣子。

  • 先想好終點:明確定義你希望 LLM 輸出的完美答案是什么樣的(內容、格式等)。
  • 再倒推需要什么原料:要得到這個完美答案,LLM 的輸入(上下文)里必須包含哪些信息?這就定義了你的系統(tǒng)需要準備的「原料包」。
  • 最后設計「流水線」:規(guī)劃出能夠自動生產(chǎn)這個「原料包」的系統(tǒng)。

第二步:從前往后構建(搭積木 → 總裝)

規(guī)劃好后,開始動手搭建。關鍵是:搭好一塊,測一塊,最后再組裝。

  • 先測試「數(shù)據(jù)接口」:確保能穩(wěn)定地獲取原始數(shù)據(jù)。
  • 再測試「搜索功能」:單獨測試檢索模塊,看它找資料找得準不準、全不全。
  • 然后測試「打包程序」:檢查那個把所有信息(指令、數(shù)據(jù))組裝成最終輸入的程序是否正常工作。
  • 最后才進行「總裝測試」:當所有零件都確認無誤后,再連接起來,對整個系統(tǒng)進行端到端測試。這時,你可以完全專注于評估 LLM 的輸出質量,因為你知道它收到的輸入肯定是正確的。

核心思想就是:通過這種「先規(guī)劃、后分步搭建和測試」的嚴謹流程,我們將使用 LLM 從憑感覺的藝術,變成了有章可循的工程科學。

實踐

更具體的實踐方法,大家可以參考 Langchain 最新的博客和視頻,里面詳細介紹了上下文工程當前主流的四大核心方法,并展示了 LangChain 生態(tài)中 LangGraph 和 LangSmith 如何助力開發(fā)者高效實施上下文工程。

image.png

  • 博客地址:Context Engineering for Agents
  • 視頻地址:Context Engineering for Agents (LangChain)
責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-26 08:27:00

2018-04-03 11:05:06

微軟Windows業(yè)務調整

2015-03-30 15:28:42

創(chuàng)業(yè)創(chuàng)業(yè)融資七牛

2009-12-16 09:44:57

Linux桌面Linux

2011-11-21 13:11:46

Wi-Fi下一代熱點

2012-03-14 15:06:11

用友云計算

2009-06-12 08:39:07

BSM運維管理北塔

2020-11-11 14:56:00

Docker容器工具

2024-11-13 10:26:25

2015-11-23 13:17:42

引導設計

2011-09-20 09:38:55

2017-03-14 13:28:53

2011-03-17 13:59:14

和信創(chuàng)天終端管理虛擬終端管理系統(tǒng)

2011-09-20 10:24:30

2021-06-30 08:49:02

人工智能AI深度學習

2015-10-28 11:17:27

螞蟻金服互聯(lián)網(wǎng)阿里云

2020-02-12 09:05:51

機器人人工智能物聯(lián)網(wǎng)

2024-06-11 09:07:12

服務端http客戶端

2012-07-18 16:49:17

戴爾服務器

2013-07-03 09:32:31

IEInternet Ex
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: av中文字幕网 | 蜜桃av一区二区三区 | 三级黄色片在线播放 | 黑人精品 | 午夜精品久久久 | 成人在线一区二区 | 日韩精品一区二区三区中文字幕 | 华丽的挑战在线观看 | 日韩高清成人 | 久久久久久美女 | 久久精品视频在线观看 | 91大片 | 一区二区三区视频在线 | 国产精品一区一区 | 色噜噜色综合 | 久久久久久久久久久久久九 | 黄色网址在线免费播放 | 国产色99 | 欧美日韩电影在线 | www,黄色,com| 国产精品免费大片 | 国产精品有限公司 | 天天看天天干 | 91成人在线视频 | 一级特黄色毛片 | 日韩免费一区 | 久久夜色精品国产 | 欧洲亚洲一区 | 亚洲精品一区二区冲田杏梨 | 久久小视频 | 亚洲91精品 | 欧美日韩一区二区电影 | 香蕉一区 | 亚洲中午字幕 | 欧洲一级视频 | 成人黄色电影在线播放 | 特级特黄特色的免费大片 | 欧美黄色大片在线观看 | 久久av网| 九九热精品在线视频 | 欧美黄色一区 |