成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

1688 AI導(dǎo)購探索:智能體驅(qū)動的場景化導(dǎo)購實(shí)踐分享

人工智能
本文將分享淘天集團(tuán) 1688 事業(yè)部團(tuán)隊(duì)過去一年多在 AI+ 導(dǎo)購領(lǐng)域的一些探索和實(shí)踐,即智能體驅(qū)動的場景化導(dǎo)購。

一、場景化導(dǎo)購背景

1. 為什么要做場景化導(dǎo)購

為什么要做場景化導(dǎo)購?通常,用戶訪問電商平臺時帶有明確的需求。他們會通過搜索、瀏覽推薦等方式尋找相關(guān)商品,隨后進(jìn)行篩選決策,最終完成交易和履約。在這一過程中,尋找和篩選階段構(gòu)成了導(dǎo)購環(huán)節(jié)。

當(dāng)前電商平臺存在幾個問題:

  • 消費(fèi)群體差異化需求未得到充分識別。不同消費(fèi)群體在訪問電商平臺時,其關(guān)注點(diǎn)存在顯著差異,但平臺未能有效區(qū)分。例如,育兒群體可能對促銷和價格優(yōu)惠特別敏感,平臺應(yīng)針對性地提供更有效的展示和提醒。
  • 商品篩選階段信息繁雜、效率低下。現(xiàn)有電商平臺上信息種類繁多,包括各種優(yōu)惠政策、服務(wù)條款以及用戶評價等。然而,這些信息往往散落在圖片、文字等不同載體中,導(dǎo)致用戶難以快速獲取對自身有價值的信息。
  • 難以滿足非標(biāo)準(zhǔn)化購物行為。例如,當(dāng)用戶搜索服裝后希望進(jìn)行更多個性化篩選時,平臺往往只能提供標(biāo)準(zhǔn)化、被動式的導(dǎo)購流程,如選擇配送地址、篩選包郵商品或選擇尺碼等。這種扁平化的體驗(yàn)難以滿足用戶的多樣化需求。我們希望中心貨架平臺能從扁平化體驗(yàn)走向垂直化、主動式的體驗(yàn),這是我們做智能體驅(qū)動場景化導(dǎo)購的出發(fā)點(diǎn)和初衷。

2. 什么是場景化導(dǎo)購

場景化導(dǎo)購可以通過三個關(guān)鍵詞來概括:貼切、沉浸和信任。

  • 貼切:針對特定人群的差異化需求,提供更具針對性的服務(wù)"界面",即定制化的交互過程。例如,對于寶媽群體,平臺應(yīng)該提供與其相關(guān)的采購知識,并根據(jù)不同孕齡階段調(diào)整信息內(nèi)容。此外,平臺還需要提供豐富的商品輔助信息。
  • 沉浸:提升消費(fèi)者購物過程的便捷性和連貫性,改善當(dāng)前割裂的消費(fèi)體驗(yàn)。目前,消費(fèi)者在瀏覽平臺上的商品后,往往需要在小紅書、B站等不同平臺間切換,以獲取博主評價、產(chǎn)品評測或優(yōu)惠信息。場景化導(dǎo)購旨在整合這些信息,提供一站式的購物體驗(yàn)。
  • 信任:幫助消費(fèi)者全面了解商品,增強(qiáng)其決策信心。例如,根據(jù)消費(fèi)者的關(guān)注點(diǎn)(如售后服務(wù)),突出顯示相關(guān)的用戶反饋,如"多位用戶反饋該商家的售后服務(wù)非常可靠"。

從人群定制化服務(wù)出發(fā),通過主動引導(dǎo)和互動式導(dǎo)購,為消費(fèi)者提供一個全面、連貫且值得信賴的購物體驗(yàn)。

3. 場景化導(dǎo)購智能體框架

產(chǎn)品和技術(shù)層面的場景化導(dǎo)購智能體框架主要包含以下幾個方面:

  • 工具:1688 平臺擁有豐富的服務(wù)資源,包括商品搜索、圖像搜索、比價雷達(dá),以及平臺商品價格走勢、物流服務(wù)等一系列原生服務(wù)工具。
  • 買家畫像:平臺在用戶采購過程中,會關(guān)注并分析用戶信息和行為特征,構(gòu)建更細(xì)粒度的畫像。
  • 意圖理解與過程把控:系統(tǒng)能夠追蹤并理解用戶的需求意圖。比如,當(dāng)用戶表達(dá)“想要為參加聚會購買合適的衣服搭配”這樣較為復(fù)雜的需求時,系統(tǒng)能夠基于用戶的上下文,將導(dǎo)購任務(wù)進(jìn)行合理拆解。
  • AI 場景化導(dǎo)購應(yīng)用:包括但不限于 AI 穿搭推薦、AI 商品搜尋、AI 商品分析建議等場景化導(dǎo)購智能體。

4. 場景化導(dǎo)購智能體的挑戰(zhàn)

場景化導(dǎo)購智能體有幾個挑戰(zhàn)需要去解決:

  • 復(fù)雜意圖理解:在實(shí)際場景中,用戶需求的表達(dá)往往更為復(fù)雜。例如,購買連衣裙時,用戶可能會描述“想買一件適合特定場合穿著的小碎花連衣裙”。這種復(fù)雜的需求描述可能需要通過與智能體多輪交互對話來逐步獲取信息。在此情況下,需要構(gòu)建一個能夠組織和記憶買家在平臺上整個行為的結(jié)構(gòu)化系統(tǒng)。
  • 平臺原生應(yīng)用的集成與調(diào)用:這包括原生工具與智能體之間的交互和調(diào)用適配,與搜索工具的聯(lián)動,以及潛在的數(shù)據(jù)分析聯(lián)動等。
  • 場景化知識構(gòu)建與分析:智能體的關(guān)鍵在于數(shù)據(jù)的差異性。1688 導(dǎo)購智能體與其他導(dǎo)購智能體的區(qū)別并不在于所使用的模型或鏈路,而在于我們擁有獨(dú)特的數(shù)據(jù)資源。這是平臺沉淀垂直領(lǐng)域智能體的核心價值。我們已構(gòu)建了自己的知識體系,包括知識鏈路以及圖片類多模態(tài)數(shù)據(jù)的處理方法。

二、場景化導(dǎo)購智能體實(shí)踐

1. 買家對話意圖和行為動線意圖識別

對話消息意圖的識別,最簡單的情形是單人消息,例如描述一個較為復(fù)雜的需求,如為全家聚會購買衣物的要求。在使用大型語言模型進(jìn)行識別時,通常會采用結(jié)構(gòu)化的思維鏈(Format Chain of Thought)。這種方法使得模型不必立即輸出結(jié)果,而是先進(jìn)行一段分析以理解用戶意圖,隨后再執(zhí)行相應(yīng)的操作。然而,在很多情況下,與用戶的交互會涉及多輪對話。我們需要判斷何時應(yīng)對多輪對話的上下文進(jìn)行壓縮或重寫,何時可以保留全部信息。此外,提示詞(Prompt)的描述應(yīng)當(dāng)結(jié)構(gòu)化,一方面是因?yàn)榻Y(jié)構(gòu)化語言在底層描述上具有普遍適用性,另一方面則是由于預(yù)訓(xùn)練階段大量的代碼語料使得大型語言模型能夠更好地理解和處理這種結(jié)構(gòu)性。

在線上環(huán)境中,意圖分析經(jīng)常會出現(xiàn)錯誤。例如,用戶詢問關(guān)于尺碼的問題,但系統(tǒng)卻將其解讀為關(guān)于材質(zhì)的問題。對于這種情況,需要建立相應(yīng)的反饋機(jī)制。目前的處理方式是將這類案例存儲在錯誤庫中。有了錯誤庫之后,整個流程就遵循檢索增強(qiáng)生成(Retrieval-Augmented Generation)的邏輯,即在接收到問題后,需要補(bǔ)充知識內(nèi)容以構(gòu)建一個信息量更豐富的上下文。

除了消息類的意圖識別,我們還在探索在客戶端上分析用戶行為軌跡意圖的可行性,并進(jìn)一步引導(dǎo)輔助決策。這就需要將一個相對小型的模型集成到客戶端上。我們嘗試了從幾十兆字節(jié)到幾百兆字節(jié)不等的模型,盡管仍面臨不少挑戰(zhàn),但這種邊緣智能的解決方案不僅能適應(yīng)實(shí)時反饋的場景,還能充分利用邊緣計(jì)算能力來優(yōu)化產(chǎn)品體驗(yàn),同時對用戶數(shù)據(jù)的隱私保護(hù)更為友好。

圖片

2. 計(jì)劃式學(xué)習(xí)-用小模型追蹤對齊任務(wù)狀態(tài)

當(dāng)大型語言模型剛剛問世時,業(yè)界鮮有團(tuán)隊(duì)著手研究計(jì)劃式學(xué)習(xí),即利用小型模型在 Agent 架構(gòu)中承擔(dān)規(guī)劃任務(wù)。所謂計(jì)劃式學(xué)習(xí),可以以購買手機(jī)支架為例進(jìn)行闡釋:模型應(yīng)具備任務(wù)識別能力,為完成購買手機(jī)支架的目標(biāo),需制定商品搜索計(jì)劃。該計(jì)劃的主題是手機(jī)這一商品類別,對此需要收集相關(guān)信息(如預(yù)算和品牌等)。為了完成這一計(jì)劃,模型需要向用戶提問,例如詢問預(yù)算。若用戶回答"100 元左右",部分信息便得到更新。隨后,模型繼續(xù)詢問品牌偏好等問題。信息收集完畢后,模型將生成一個查詢語句,如"100 元左右的任意品牌手機(jī)支架",然后執(zhí)行商品搜索操作并返回結(jié)果。

在計(jì)劃式學(xué)習(xí)的指令微調(diào)(SFT)階段,我們采用了對話式訓(xùn)練模式,即構(gòu)造多輪交互式指令以激發(fā)基礎(chǔ)模型對任務(wù)形態(tài)的理解。SFT 完成后,還可通過進(jìn)一步對齊來提高模型的追蹤準(zhǔn)確性。追蹤準(zhǔn)確性指的是模型在詢問完預(yù)算后是否會繼續(xù)詢問品牌,而非生成無關(guān)內(nèi)容。這種能力難以僅通過 SFT 培養(yǎng),需要通過對齊訓(xùn)練來強(qiáng)化模型的內(nèi)在結(jié)構(gòu)性約束。

我們進(jìn)行了對比實(shí)驗(yàn),在 Bloom 1.5B 基礎(chǔ)模型上,經(jīng)過強(qiáng)化學(xué)習(xí)對齊后,其信息追蹤準(zhǔn)確性提高了 5 個百分點(diǎn)。許多普遍的對齊實(shí)現(xiàn),通常不是對整個序列進(jìn)行評分和約束,而是僅對最后一個 token 進(jìn)行約束。在我們的場景中,除了最后一個 token 外,我們還利用第一個 token 來提高意圖識別的準(zhǔn)確性。

圖片

3. 場景離線知識和實(shí)時知識

知識是智能體系的核心,主要包含兩個部分:其一為離線知識庫,涵蓋商品信息等百科知識以及外部知識的綜合;其二為實(shí)時場景化知識。由于諸多商品信息具有實(shí)時性,如價格波動和優(yōu)惠變化等,因此部分信息需支持在線調(diào)用。同理,我們通過結(jié)構(gòu)化的思維鏈(Format COT)來控制檢索增強(qiáng)生成(RAG)的過程,以提高準(zhǔn)確性。輸出流程包括四個步驟:首先生成分析結(jié)果(Thought),其次得出結(jié)論(Conclusion),再進(jìn)行校驗(yàn)(Rethink),最后實(shí)施風(fēng)格控制輸出。

圖片

4. Format-COT 的 RAG 生成控制

什么是 Format-COT 的 RAG 生成控制?從結(jié)構(gòu)化角度而言,通常建議采用 XML 格式,因?yàn)?XML 具有較強(qiáng)的通用性,有利于模型的識別和處理。例如,在商品信息(offer info)中,需要找出支持問題(question)部分的相關(guān)信息,進(jìn)行分析,然后按照指定的輸出格式(output format)來生成回答。

商品信息 RAG 召回的內(nèi)容包括商品標(biāo)題以及通過多模態(tài)處理得到的圖像到文本的離線數(shù)據(jù)。將這些信息整合后,首先進(jìn)行初步分析(thought),然后得出結(jié)論(conclusion)。但是,結(jié)論不能直接輸出,還需要進(jìn)行重新思考(rethink)。在提示詞(prompt)層面也可以控制幻覺現(xiàn)象,這里需要生成一些額外內(nèi)容來進(jìn)行控制,評估置信度的高低,最后再通過一些風(fēng)格控制來形成最終輸出。

例如,在用戶詢問商品尺寸的場景下,結(jié)論部分不應(yīng)直接輸出所有規(guī)格尺寸的描述給用戶,因?yàn)樵诒磉_(dá)規(guī)則(express rule)部分會有相應(yīng)的約束。當(dāng)尺碼類信息較多時,最好再添加一些風(fēng)格和格式約束,以進(jìn)一步控制其表達(dá)方式,確保輸出給用戶的信息簡潔明了。

圖片

5. 復(fù)雜需求描述 & 商品搜索

在探討如何實(shí)現(xiàn) AI 原生聯(lián)動搜索時,不妨以一個具體場景為例:假設(shè)用戶需要尋找一件適合周末聚會穿著的連衣裙,且預(yù)算控制在 200 元以內(nèi)。這類復(fù)雜需求在當(dāng)前電商搜索系統(tǒng)中往往難以精準(zhǔn)匹配理想商品。然而,借助大型語言模型(LLM)的能力,我們可以構(gòu)建更智能的搜索流程。首先,LLM 會對用戶需求進(jìn)行深入分析,識別出關(guān)鍵要素,如“周末連衣裙”或“晚宴連衣裙”等類別,并提取隱含的需求參數(shù)。隨后,模型將生成相應(yīng)的商品 Query,用于進(jìn)行初步召回。在得到相關(guān)商品列表后,系統(tǒng)會進(jìn)行匹配過濾,剔除不符合要求的商品。最后,LLM 會對篩選后的結(jié)果進(jìn)行整合,生成一體化的輸出。

圖片

(1)需求解析和語義商品召回

需求解析是指用戶提出需求后,如何調(diào)用相應(yīng)工具的過程;而商品召回則是指根據(jù)給定的商品 Query 召回相關(guān)商品的過程。當(dāng)一個需求到來時,大型語言模型會通過 COT 引導(dǎo),生成潛在的搜索引擎習(xí)慣的商品 Query(通常電商搜索引擎對形容詞加名詞品類描述的查詢支持較好)。接下來是 RAG 的借鑒。由于不同搜索引擎支持的參數(shù)各異,需要根據(jù)配置文檔,讓模型借鑒知識,從需求中提取適當(dāng)?shù)膮?shù)。比如“200 元以下”的價格限制,以及默認(rèn)的“包郵”等參數(shù),隨后調(diào)用搜索工具。

在獲取大量商品后,需進(jìn)行匹配和排序。我們使用 M3E 模型對商品信息和用戶需求進(jìn)行向量化,這構(gòu)成了基礎(chǔ)召回部分。如果缺乏資源或語料來訓(xùn)練大規(guī)模垂直領(lǐng)域表征模型,可以先嘗試使用通用的 M3E 或 BGE 嵌入。在信息明確的情況下,這些通用語義表征的噪聲通常不會過大。然而,向量召回的語義漂移問題是需要關(guān)注的。例如,"婚禮連衣裙"可能被誤認(rèn)為"時尚連衣裙"而被召回。因此,需要第二個模塊,即使用傳統(tǒng)的深度學(xué)習(xí)模型(e.g. RoBERTa)進(jìn)行相關(guān)性打分。這類模型通過標(biāo)題和相應(yīng)的人工構(gòu)造查詢進(jìn)行訓(xùn)練。目前,更重的 LLM 重排方案也可考慮,但需要根據(jù)系統(tǒng)和場景實(shí)際評估。

圖片

(2)ReACT 的搜索優(yōu)化

下一階段是 ReACT 的搜索優(yōu)化。需求解析后會產(chǎn)生多個查詢,其中一些長尾查詢難以召回商品,甚至可能出現(xiàn)空召回的情況。因此,需要根據(jù)這一反饋信號對查詢進(jìn)行改寫,并進(jìn)行二次嘗試。這個過程實(shí)質(zhì)上是通過結(jié)果對輸入進(jìn)行修正的逐步優(yōu)化收斂,而這種鏈路的實(shí)現(xiàn)只有在大型語言模型的驅(qū)動下才成為可能。當(dāng)然,最終還需要施加規(guī)則約束,以防止過多的嘗試次數(shù)。理論上,所有能夠提供反饋信號的工具調(diào)用都可以通過 ReACT 的過程來進(jìn)行優(yōu)化。然而,目前在效率方面仍然存在一些待解決的問題。就電子商務(wù)搜索而言,供給側(cè)本身也會參與鏈路的聯(lián)動優(yōu)化。ReACT 或者說通過結(jié)果反饋來優(yōu)化收斂的模式,可能會為我們打開更廣闊的想象空間。

圖片

6. 多模態(tài)商品信息分析

在電子商務(wù)領(lǐng)域,大量商品信息以圖片形式呈現(xiàn)。對于這部分信息的處理,主要有兩種邏輯:一種是在線構(gòu)建圖文混合的多模態(tài)知識庫,然后進(jìn)行多模態(tài)的檢索增強(qiáng)生成(RAG);另一種是離線將信息統(tǒng)一處理成結(jié)構(gòu)化的文本知識。我們在實(shí)踐中選擇了后者。前者存在幾個問題:首先,多模態(tài)大模型的推理能力尚不夠強(qiáng);其次,這種方式會顯著增加系統(tǒng)鏈路的復(fù)雜度。本文將從一個視角闡述當(dāng)前多模態(tài)大模型在推理方面的局限性。目前,主流的多模態(tài)架構(gòu)分為兩類:圖文編碼分離和圖文編碼統(tǒng)一。使用第一種架構(gòu)時,多模態(tài)的感知(視覺編碼)和多模態(tài)的推理(模態(tài)橋接到 LLM)在某種程度上是分離的,模態(tài)橋接后段并未能在預(yù)訓(xùn)練中實(shí)現(xiàn)規(guī)模化(scaling),天然形成了推理效果瓶頸。對于第二種統(tǒng)一架構(gòu),以 GPT-4o 為代表,目前在多模態(tài)數(shù)據(jù)層面的規(guī)模法則(scaling law)似乎還不夠顯著,其在圖像理解和推理方面相比文本處理仍有不小差距。

因此,我們目前更傾向于信任多模態(tài)模型的感知能力。我們會將商品詳情圖中的文字信息提取出來,構(gòu)建結(jié)構(gòu)化的文本知識。純文本大模型在理解這些信息方面表現(xiàn)更為出色。在這個過程中,我們還會進(jìn)行評測,判斷是否可能產(chǎn)生幻覺。最終,我們將所有信息整合成統(tǒng)一的文本商品知識,用于整體的商品信息分析或?qū)з忂^程。從長遠(yuǎn)來看,端到端的多模態(tài) RAG 能處理更豐富的場景,信息損失程度也會更低,但這有賴于多模態(tài)大模型的進(jìn)一步發(fā)展。

圖片

7. AI + 效果評測

所有上述工作完成后,還需對大模型的通用輸出進(jìn)行評測。這部分任務(wù)無法像標(biāo)準(zhǔn)輸出任務(wù)那樣提供測試集,而外包標(biāo)注從時間和成本角度考慮都相對較高,難以作為日常頻繁的評測環(huán)節(jié)。因此,自然而然地想到是否可以利用大模型來進(jìn)行評測。運(yùn)用大模型進(jìn)行評測時,需要明確定義評測維度和目標(biāo)等方面,以構(gòu)造相應(yīng)的提示引導(dǎo)。例如,針對賣點(diǎn)生成任務(wù)的評測,需要考察其準(zhǔn)確性、賣點(diǎn)生成的邏輯性,以及最基本的不涉及色情暴力等風(fēng)險問題。對于大模型生成的評測結(jié)果,可以通過人工抽樣分析,以驗(yàn)證評測結(jié)果的正確性。我們還研究了通過微調(diào)小規(guī)模模型來對大模型生成的任務(wù)結(jié)果進(jìn)行更低資源成本評測的可行性。從部分實(shí)驗(yàn)數(shù)據(jù)來看,這種方法顯示出一定的效果。然而,在實(shí)際應(yīng)用中存在較大局限性,因?yàn)闊o論是數(shù)據(jù)還是數(shù)據(jù)格式都與任務(wù)高耦合,這意味著難以實(shí)現(xiàn)通用化。

三、場景化導(dǎo)購案例

1. AI 智能找挑輔助

打開 1688 應(yīng)用程序后,進(jìn)入任意商品的詳情頁面,例如某款女裝連衣裙的詳情頁。當(dāng)您詢問關(guān)于這些商品的采購建議、質(zhì)量評估或賣點(diǎn)等問題時,系統(tǒng)會根據(jù)您的人群屬性(如都市女白領(lǐng)、程序員、全職媽媽等),給出針對性的回答,并為您總結(jié)最有價值的商品評價內(nèi)容。

圖片

同時,在著裝搭配方面,如果您是女性用戶,想要購買一件適合晚間約會的連衣裙,系統(tǒng)可以為您提供穿搭建議以增添魅力。我們會通過夸克搜索引擎獲取相關(guān)信息,然后利用大型語言模型進(jìn)行分析,確定最適合約會場合的風(fēng)格。隨后,系統(tǒng)會為您推薦一套完整的穿搭方案,這背后是有專業(yè)知識支撐的,例如襯衫與高跟鞋或耳環(huán)的搭配。當(dāng)您面臨兩件連衣裙的選擇困難時,系統(tǒng)可以提供商品對比功能。它會告訴您哪件更適合您,同時考慮性價比因素。如果您繼續(xù)詢問是否有同款推薦,系統(tǒng)會執(zhí)行兩個步驟:首先從上下文中識別目標(biāo)商品,然后通過圖像搜索找出相似款式。若您在推薦需求中表達(dá)了更多具體選擇信息,系統(tǒng)也會相應(yīng)地進(jìn)行精確篩選操作。

圖片

2. smart shopping

我們還嘗試了一個更加端到端的 AI + 電商搜索 demo,叫做 smart shopping,它能夠提供一種更加整體化的 AI + 找挑體驗(yàn)路徑。例如,當(dāng)您需要尋找春季流行服飾時,系統(tǒng)會主動訪問一個趨勢分析的服務(wù)來獲得相關(guān)數(shù)據(jù),并緊接著生成一份采購建議。完成這一步驟后,系統(tǒng)開始調(diào)用平臺的商品搜索獲取候選商品并根據(jù)前面的需求、知識進(jìn)行深度選品分析。最終會向用戶呈現(xiàn)一個包含三件商品的采購方案。方案中詳細(xì)說明了每件商品適合您的理由,這些理由是伴隨整個信息流程產(chǎn)生的,而非與搜索過程割裂。

圖片

3. 原生導(dǎo)購鏈路全域 tips

我們也嘗試在 APP 的更多地方,通過一些方式提醒用戶下一步要怎么做,比如用哪一張優(yōu)惠券更劃算,夏天到了需要去采購一些什么東西,整個過程當(dāng)中會有更強(qiáng)的引導(dǎo)。

四、未來 AI 導(dǎo)購的一些隨想

商品信息分發(fā)將向采購解決方案分發(fā)的方向演進(jìn)。目前,電商平臺會為用戶推薦或搜索商品,這是非常淺層且零碎的信息化連接。我們期望能夠提供一個更完整的解決方案直面用戶。打個比方,就像一位值得信賴的主播在為用戶指引,用戶之所以買單,本質(zhì)還是基于長期采購結(jié)果反饋而形成的信任機(jī)制。我們必然不可能真的成為主播或 mcn,但供應(yīng)鏈和前場的定制化分析對接是能產(chǎn)品化的。

從被動式應(yīng)答轉(zhuǎn)向主動式問題解決。被動式應(yīng)答模式需要用戶逐步推動,例如用戶輸入特定衣物的需求及條件,系統(tǒng)隨后根據(jù)輸入提供檢索結(jié)果。未來,我們希望能夠主動幫助用戶收斂需求,從而提升整體購物體驗(yàn)。

從“大家的 1688”蛻變?yōu)椤澳愕?1688”當(dāng)前電商平臺的千人千面很大程度上仍停留在短期、淺層的偏好迎合,比如用戶購買了帽子后繼續(xù)推薦帽子。雖然某些采購場景可能樂見,但這顯然不是真正個性體驗(yàn)。我們對未來的期望是,電商平臺能夠?qū)γ课挥脩粜纬缮钊肭议L效的理解。例如,對于一位新晉寶媽,平臺應(yīng)該圍繞其未來一年與嬰兒相關(guān)的采購需求提供定制服務(wù)。不單是垂直,而是往陪伴的邏輯上走,真正的長生成周期服務(wù)貼合。

最后歡迎大家下載 1688 的 APP,去體驗(yàn)我們的 AI 采購助手。

五、Q&A

Q1:計(jì)劃式學(xué)習(xí)那里沒有 RAG?

A1:它是在用戶要買手機(jī)支架的前提下猜出來去問預(yù)算和品牌,如果要買一張椅子,它會去問材質(zhì)和可能長寬高,基礎(chǔ)大模型本身蘊(yùn)含的知識會讓他在 0-shot 的時候想到一些可能的商品-屬性關(guān)聯(lián),當(dāng)然微調(diào)指令中提及的關(guān)聯(lián)多少也會影響到。這個框架本身是可以配合 RAG 的,當(dāng)開啟某類商品的采買,例如手機(jī)支架,第一步就是做一個知識庫的 function-call,從知識庫把手機(jī)支架采買需要引導(dǎo)詢問的關(guān)鍵屬性放進(jìn)一個結(jié)構(gòu)性上下文中。從這里也可以看出,這個模型起到的作用是一個 planning 的角色,在整個 Agent 系統(tǒng)中做好調(diào)度。在實(shí)際落地中,對 planning 的理解和推理都有很大的挑戰(zhàn),尤其是復(fù)雜場景中,這個 bloom 1.5B 上的實(shí)驗(yàn)只是說明了一種訓(xùn)練的可行性,以及這種方式在特定垂直場景下能以低資源看到的一些效果邊界,實(shí)際情況中,需要根據(jù)場景作出調(diào)整。

Q2:商品召回的時候怎么判斷 query 和商品 match?

A2:用商品的標(biāo)題匹配是不是 match,這個時候用 embedding 去做召回的時候,它會有漂移,就是有可能它不是一個時尚休閑連衣裙,而是一件婚禮連衣裙,它的 embedding 可能會很接近,這個時候需要有個監(jiān)督模型在后面來判斷 true or false,即這個 query 和商品是不是匹配?這個模型是要訓(xùn)練的,要構(gòu)造一些 query 和 title 的關(guān)系對,生成的 query 和商品的 title 過濾掉那些閾值比較低的候選。但這套方案是建立在一個理想的假設(shè)上,就是商品的標(biāo)題是反映真實(shí)信息的且描述了商品真實(shí)要點(diǎn),這屬于供給側(cè)信息的問題,我們目前也遇到一些挑戰(zhàn)。

Q3:怎么保證整個鏈路準(zhǔn)確?

A3:我們通過 COT 的邏輯,盡可能讓它先分析一下,生成對應(yīng)的 advice, advice 里面本身會有一些上下文來保證生成商品詞是盡可能跟需求比較相關(guān)的,有了這個過程相對來說它的幻覺會弱一點(diǎn),但是如果一定要解決,讓它生成的 query 絕對滿足用戶的描述,那指標(biāo)是很難絕對被量化的,原因有些時候它的 query 是開放式的,只能通過后面鏈路去慢慢調(diào)整它,甚至多輪對話再去調(diào)整它。它本身整個就是 pipeline 的,不是端到端的,所以其實(shí)很難保證每個環(huán)節(jié)沒有噪音,每個地方的噪音都會累積下來。比如匹配模型不太準(zhǔn),把一些錯誤的商品放進(jìn)來了,后面還會有大模型來做篩選哪些是適合的商品,它大概會幫你過濾出來。

Q4:AI 導(dǎo)購助手上線的時候有沒有業(yè)務(wù)指標(biāo)評測,比如銷量或者轉(zhuǎn)化率?以及有沒有做過 AB test?

A4:我們現(xiàn)在大概整個灰度的用戶量就幾萬,其實(shí)很少,它現(xiàn)在沒有轉(zhuǎn)化價值,但是值不值得去做這件事情?從第一性原理去出發(fā),它是解決用戶問題的,從產(chǎn)品邏輯上面來看,它確實(shí)是一種更好的體驗(yàn)方向。所以我們現(xiàn)在不會嚴(yán)格去監(jiān)測所謂的轉(zhuǎn)化率,因?yàn)檗D(zhuǎn)化率太深了,大概率沒有那么優(yōu)秀,肯定在首頁去優(yōu)化 CTR 更好一些。我們會去監(jiān)測 AI 助手用戶的使用輪次,用戶進(jìn)來之后有沒有意愿長期地溝通下去?或者對于一些特定問題,用戶點(diǎn)贊、點(diǎn)踩,通過這種方式去分析用戶對產(chǎn)品的認(rèn)同度。先不關(guān)注電商平臺的所謂轉(zhuǎn)化指標(biāo),而是先回歸到一個產(chǎn)品去看它的功能有效性、完整性和用戶的體驗(yàn)反饋。

責(zé)任編輯:姜華 來源: DataFunTalk
相關(guān)推薦

2011-08-30 22:59:31

一體機(jī)導(dǎo)購

2011-05-05 09:50:24

噴墨打印機(jī)導(dǎo)購

2019-12-12 14:30:15

智能一點(diǎn)智能導(dǎo)購對話機(jī)器人

2025-04-07 02:00:00

2009-04-03 09:53:00

交換機(jī)無線產(chǎn)品導(dǎo)購

2009-08-23 15:06:29

2012-11-02 12:50:12

一體機(jī)

2012-04-19 15:09:04

打印機(jī)推薦

2025-06-27 07:00:00

智能體人工智能AI

2012-03-28 11:21:13

復(fù)合一體機(jī)導(dǎo)購

2009-02-21 11:35:27

路由器中小網(wǎng)絡(luò)模塊化

2009-02-20 16:33:35

2012-04-20 10:20:56

復(fù)合一體機(jī)導(dǎo)購指南

2023-09-20 15:22:17

人工智能數(shù)據(jù)

2009-06-09 14:08:07

防雷設(shè)備選購飛魚星

2012-04-11 14:21:33

激光打印機(jī)推薦

2009-07-04 10:23:22

布線系統(tǒng)家庭產(chǎn)品

2009-02-21 11:13:42

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 一区二区免费在线观看 | 色综合天天天天做夜夜夜夜做 | 男女午夜激情视频 | 国产精品久久久久9999鸭 | 国产欧美在线 | 欧美日韩国产一区二区 | 久久久妇女国产精品影视 | 日韩伦理电影免费在线观看 | 操久久| 国产日韩欧美在线一区 | 亚洲 欧美 另类 日韩 | 91网视频 | 天天干天天想 | 日韩一区和二区 | 九热在线 | 日本高清不卡视频 | 国产精品亚洲精品 | 高清av一区 | 亚洲视频观看 | 毛片.com | 欧美日韩亚洲一区 | 91看片免费 | 国产精品视频一二三区 | 国产一区久久久 | 国产成人久久精品一区二区三区 | 高清一区二区三区 | 在线成人免费视频 | 亚洲精品99| av黄色网| 91综合在线观看 | 成人性视频免费网站 | 涩涩视频网站在线观看 | 亚洲成av人片在线观看无码 | 久久九 | 在线日韩在线 | 精久久久 | 国产免费人成xvideos视频 | 鸡毛片| 中文字幕在线观看一区 | 三级视频在线观看电影 | 亚洲欧美日韩在线 |