作者 | 云昭
每當(dāng)一項(xiàng)新技術(shù)剛走進(jìn)大眾視野的5年里,這個(gè)階段的新產(chǎn)品總是讓人視為“雞肋”一樣的存在,即便是閱產(chǎn)品無數(shù)的投資人,也難免莞爾一笑,吐出一句大實(shí)話:乏善可陳。
其實(shí),這不止是用戶和投資界的反饋,AI產(chǎn)品創(chuàng)造者同樣也有慘痛的經(jīng)歷。“我們的AI產(chǎn)品發(fā)布那天,我確信我們會(huì)改變游戲規(guī)則。所有那些不眠之夜,所有無休止的迭代,所有我傾注的心血,只為打造一款革命性的產(chǎn)品。一切都為了這一刻!”
“但隨后,一切都沉寂了,沒人使用它。”不僅數(shù)據(jù)異常冰冷:參與度低、采用率為零,就連反饋也像刀子一樣狠——“令人困惑”、“垃圾”、“不靠譜”。
1.90%的AI產(chǎn)品在用戶記憶中陣亡
各位不妨回想一下自己在手機(jī)或電腦端在用的AI應(yīng)用,究竟還有哪些產(chǎn)品的AI功能讓你眼前一亮,并堅(jiān)持使用超過了6個(gè)月?
從去年年初開始,我們就時(shí)不時(shí)在采訪中向?qū)Ψ綊伋鲞@個(gè)問題,我們得到的答案不超過這4款,看看是不是精準(zhǔn)命中了你的答案:ChatGPT、豆包、Cursor、Notion。
ps:DeepSeek作為后起之秀,吃了發(fā)布時(shí)間晚的虧,所以不在此之列。
當(dāng)然這并不意味著其他的AI產(chǎn)品有多大問題,比如前兩年年紅極一時(shí)的AI生圖工具M(jìn)idjourney、主打音樂創(chuàng)作的Suno以及視頻創(chuàng)作的可靈AI都是備選項(xiàng)之一,但在適配體量和口碑聲量上遠(yuǎn)不及前面提到的產(chǎn)品。
而就在在這僅有的4款之中,前兩款驚人地一致,全是“產(chǎn)模一體”(產(chǎn)品即模型),只剩下Cursor和Notion還算是有相對(duì)垂直的應(yīng)用場(chǎng)景。
正如一位開發(fā)者所說:“Copilot/Aider/Claude Code都很棒,但我很難想到我使用的其他工具中,哪個(gè)是用LLM改進(jìn)過的。”
為什么會(huì)這樣?在一切皆可AI的今天,除了Cursor和Notion備受推崇之外,其他的很多知名產(chǎn)品都在大眾的記憶中陣亡了。此外,有媒體甚至爆料,許多受訪的高級(jí)知識(shí)型工作者其實(shí)根本對(duì)ChatGPT“不感冒”。
不得不感嘆:歷史總是驚人的相似,仿佛我們回到了2022年,低代碼產(chǎn)品陷入的市場(chǎng)怪象:“老板們看了必須上,使用者試了試不想用。”
回到AI的語境之下,我們了解到一線的用戶是這樣回答的:
“現(xiàn)在90%的 AI 功能感覺都是附加的,毫無用處。”
“這還不包括價(jià)格。有些服務(wù)商甚至為了所謂的“AI 功能”而多收 50% 甚至 100% 的費(fèi)用。”
“除了AI編碼功能之外,我其實(shí)很難想到哪個(gè)AI功能真正讓我喜歡。”
2.問題出現(xiàn)了:舊App開發(fā)封禁了大模型
近期,YC合伙人Pete發(fā)表了一篇博客:《horseless carriage》(無馬的馬車)并以Gmail郵件草稿功能為例,痛斥了目前AI應(yīng)用在設(shè)計(jì)上的無用性!
Gmail 團(tuán)隊(duì)打造了一輛“無馬的馬車”,因?yàn)樗麄冎謱⑷斯ぶ悄芴砑拥剿麄儸F(xiàn)有的電子郵件客戶端中,而不是思考如果從頭開始設(shè)計(jì)一個(gè)包含人工智能的電子郵件客戶端會(huì)是什么樣子。
他們的應(yīng)用是將人工智能塞進(jìn)一個(gè)為日常人工工作設(shè)計(jì)的界面中,而不是一個(gè)為自動(dòng)化日常工作設(shè)計(jì)的界面中。
解釋一下,這里的“無馬的馬車”,是指蒸汽機(jī)革命初期初代汽車的雛形,外表看起來依舊是一輛馬車,只不過沒有馬,后面多了一個(gè)蒸汽機(jī)而已。當(dāng)時(shí)的人們看到之后沒法接受:寧愿選擇馬而不是蒸汽機(jī)。
Pete指出,初代的無馬馬車誕生于“舊世界思維”,它借鑒了馬車的樣子,本質(zhì)上無異于用發(fā)動(dòng)機(jī)取代馬匹,卻沒有重新設(shè)計(jì)車輛以應(yīng)對(duì)更高的速度。在他看來,現(xiàn)在很多AI應(yīng)用也一樣,都像Gmail的Gemini集成一般,毫無用處、令人惱火。
圖片
1803年蒸汽馬車設(shè)計(jì)圖
Pete具體指出,這項(xiàng)功能是讓Gemini生成了一封措辭合理的草稿,但可惜的是,這封郵件的語氣和其本人截然不同。
此外除了語氣問題以外,生成的郵件比本人親自寫的郵件都要長。很多人包括谷歌團(tuán)隊(duì)都把問題甩給了AI,認(rèn)為是AI還不夠聰明,無法寫出好的電子郵件。
但這其實(shí)并不是 AI 模型問題:Gemini是一個(gè)非常強(qiáng)大的模型,它完全有能力寫出好的電子郵件。問題在于,Gmail團(tuán)隊(duì)設(shè)計(jì)的應(yīng)用程序,它限制了模型的發(fā)揮。在他看來,AI 原生軟件應(yīng)該最大限度地提升用戶在特定領(lǐng)域的影響力。AI 原生的Email應(yīng)該最大限度地減少用戶花在發(fā)送和閱讀郵件上的時(shí)間,而AI 原生的會(huì)計(jì)軟件則應(yīng)該最大限度地減少會(huì)計(jì)人員記賬的時(shí)間,就這么樸素的道理。
言外之意,Pete認(rèn)為現(xiàn)在的AI應(yīng)用開發(fā)只是在模仿舊的軟件開發(fā)方式,而這種舊世界的方式已經(jīng)限制了大模型的能力發(fā)揮。
3.失敗的不是技術(shù),而是與真人的聯(lián)系
微軟CEO納德拉在剛剛過去的LlamaCon上表示了類似的觀點(diǎn)。他認(rèn)為,人工智能很有潛力,但是需要軟件和管理變革配套。現(xiàn)在的AI,就像是一架“沒有馬的馬車”。“變革不止是技術(shù),還有人們對(duì)新技術(shù)的新方式。”他還引用電從被發(fā)現(xiàn)到應(yīng)用于工廠生產(chǎn)經(jīng)歷了50年的例子,表明,雖然距離AI真正改變生產(chǎn)生活不需要50年那么久,但距離AI被放進(jìn)新的生產(chǎn)系統(tǒng),還需要時(shí)間。
那么,在AI 適配的新系統(tǒng)被發(fā)現(xiàn)之前,我們需要了解除了技術(shù)之外的限制因素。
首先,“拿著錘子找釘子”往往會(huì)導(dǎo)致破產(chǎn)。很多AI項(xiàng)目出發(fā)點(diǎn)都是以技術(shù)為出點(diǎn),因?yàn)殚_發(fā)者的確需要清楚大模型的能力的上下限,然而這往往會(huì)導(dǎo)致“拿著錘子找釘子”,不能識(shí)別并解決目標(biāo)用戶的真實(shí)痛點(diǎn)。這個(gè)過程中,公司很容易忽略完整的用戶調(diào)查,進(jìn)而阻止了最終用戶參與開發(fā)階段。這種情況下誕生的產(chǎn)品,要么過于復(fù)雜、要么與用戶無關(guān)。
一個(gè)明顯的例子是IBM的AI醫(yī)療項(xiàng)目Watson for Oncology,雖然獲得6200萬美元投資,但由于AI卻生成了不安全的治療方案,而且與腫瘤醫(yī)生的工作流程脫節(jié),最后項(xiàng)目告吹了。
一位AI產(chǎn)品發(fā)布失敗的創(chuàng)業(yè)者總結(jié)了沉痛教訓(xùn):打造人工智能只是成功的一半,如果你不深入了解你的用戶——他們害怕什么,他們需要什么,是什么讓他們興奮——你就永遠(yuǎn)無法贏得他們的信任。而信任才是最重要的。
screenshotone.com 的創(chuàng)始人 Dmytro Krasun 也給出了同樣的建議:如果不知道要向誰銷售你的產(chǎn)品,就不要生產(chǎn)它。
如果是B端產(chǎn)品,這種現(xiàn)象也更加嚴(yán)重。很多公司采用AI,僅僅是因?yàn)锳I火,而不是首先確定AI的業(yè)務(wù)應(yīng)用方向。
一個(gè)典型的例子就是很多人為自己公司開發(fā)智能體,總是誤以為“復(fù)雜才是高級(jí)”,追求長鏈路的復(fù)雜任務(wù),從而導(dǎo)致項(xiàng)目失敗率和成本抖升。這種被稱為“閃亮物體綜合癥”的現(xiàn)象導(dǎo)致資源的無謂消耗,卻無法產(chǎn)生可量化的商業(yè)效益。這也是很常見的“技術(shù)目標(biāo)和業(yè)務(wù)目標(biāo)不匹配”,雖然解決方案可以正常運(yùn)作,但卻無法解決市場(chǎng)上的根本問題。
其次,對(duì)于數(shù)據(jù)質(zhì)量和治理的重視程度不夠。AI系統(tǒng)的有效運(yùn)行依賴于高質(zhì)量的訓(xùn)練數(shù)據(jù)和決策數(shù)據(jù)。許多AI項(xiàng)目失敗的原因在于它們使用的數(shù)據(jù)不足,這些數(shù)據(jù)要么過時(shí),要么存在偏見,從而降低信任度和可用性水平。
這里也有一個(gè)例子。亞馬遜此前開發(fā)了一個(gè)人工智能招聘系統(tǒng),該系統(tǒng)從帶有男性偏見的歷史招聘數(shù)據(jù)中學(xué)習(xí),從而產(chǎn)生了帶有性別歧視的建議。由于缺乏適當(dāng)?shù)臄?shù)據(jù)治理監(jiān)督,亞馬遜最終不得不放棄該項(xiàng)目。
誠然,現(xiàn)在的大模型技術(shù)發(fā)展還處在早期階段,本身技術(shù)的研究還存在諸如安全、可解釋性等一些短板需要進(jìn)一步補(bǔ)齊。但這并不是許多AI產(chǎn)品不受歡迎的主要原因,更多還是用戶需求的錯(cuò)位理解以及企業(yè)落地過程中的工程環(huán)節(jié)等問題。
4.不要愛上你的產(chǎn)品,愛上解決用戶的問題
一款人工智能產(chǎn)品,不能引起用戶的共鳴,技術(shù)上即便再出色,也將毫無意義。為用戶提供信任、可用性和價(jià)值才是構(gòu)建AI產(chǎn)品的關(guān)鍵。
開發(fā)AI產(chǎn)品,不妨提醒自己:不要迷失在尋找這項(xiàng)技術(shù)所能實(shí)現(xiàn)的可能性中。而是要時(shí)刻關(guān)心“為人而建”,
因?yàn)橛脩舨⒉魂P(guān)心你的算法,他們?cè)诤醯氖撬绾巫屗麄兊纳罡p松。所以,了解他們的行為、他們的時(shí)間都花在了哪里,以及他們不喜歡工作流程中的哪些方面。不要只問他們想要什么,還要觀察他們做了什么。所有這些都將幫助你打造一款用戶樂于使用的產(chǎn)品。
此外,盡早關(guān)注數(shù)據(jù)質(zhì)量。無論人工智能多么復(fù)雜,糟糕的數(shù)據(jù)都會(huì)導(dǎo)致糟糕的結(jié)果。在開始構(gòu)建之前,投入時(shí)間和精力進(jìn)行數(shù)據(jù)清理、數(shù)據(jù)整理和數(shù)據(jù)多樣化至關(guān)重要。這就像蓋房子一樣——你的數(shù)據(jù)就是地基。如果它出現(xiàn)裂縫或不平整,整個(gè)結(jié)構(gòu)就會(huì)倒塌。并且不要忘記不時(shí)檢查您的數(shù)據(jù);六個(gè)月前有效的方法今天可能就不起作用了。
最后,少即是多,快速證明價(jià)值。正如前文多提到的,追求復(fù)雜是一個(gè)典型的產(chǎn)品開發(fā)誤區(qū)。很多人認(rèn)為推出一款擁有眾多炫酷功能的人工智能產(chǎn)品就能給利益相關(guān)者留下深刻印象。然而,事實(shí)并非如此,它非但沒有打動(dòng)用戶、贏得他們的信任,反而讓他們感到困惑,甚至厭棄。所以,從一個(gè)小的、專注的場(chǎng)景開始,解決一個(gè)特定的問題。在取得第一個(gè)成功之后,再將其作為跳板進(jìn)一步拓展你的產(chǎn)品。
而對(duì)于企業(yè)而言,還有一點(diǎn)值得補(bǔ)充,即設(shè)定明確的目標(biāo),即便是實(shí)驗(yàn)性質(zhì)的探索,同樣有必要。開始開發(fā)工作之前應(yīng)該建立具體的以業(yè)務(wù)為中心的成功標(biāo)準(zhǔn),這樣可以讓開發(fā)人員專注于解決具體問題,而不是為了追求尖端技術(shù)。
不要愛上你的人工智能,而要愛上解決用戶問題這件事。這才是讓你的產(chǎn)品收獲用戶的不二法門。
參考鏈接:
https://koomen.dev/essays/horseless-carriages/#a-better-email-assistant