成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

集中接入:將大模型統(tǒng)一管理起來(lái),你覺(jué)得怎么樣?

人工智能
我們以 One API 為例介紹了大模型代理的設(shè)置過(guò)程,主要就是渠道和令牌的管理。除了大模型代理的基本功能,One API 還提供了模型重定向能力,它可以在運(yùn)行時(shí)對(duì)應(yīng)用端請(qǐng)求的模型進(jìn)行修改,實(shí)現(xiàn)一些特殊的功能。

為什么要集中接入?

集中接入,就是把大模型的接入統(tǒng)一到一個(gè)地方管理起來(lái),下面這張圖可以很好地幫我們理解集中接入:

圖片圖片

從這個(gè)圖上,你已經(jīng)看出來(lái)了,所謂的集中接入,其實(shí)就是構(gòu)建了一個(gè)代理,我們后面就稱它為大模型代理。

到這里,你可能產(chǎn)生這樣的疑問(wèn):我直接用大模型不好嗎?為什么還要在中間加上一層代理呢?

我在前面說(shuō)過(guò),集中接入是一種架構(gòu)上的調(diào)整,顧名思義,我需要是一個(gè)服務(wù),才會(huì)有架構(gòu)調(diào)整的說(shuō)法。如果在本地就可以運(yùn)行起來(lái)的一些程序,確實(shí)沒(méi)有必要在中間加入一層。但在真實(shí)的項(xiàng)目中,我們往往是要構(gòu)建一個(gè)服務(wù),這時(shí)集中接入的價(jià)值就體現(xiàn)出來(lái)了。

之所以要有一個(gè)中間層,最直接的一個(gè)問(wèn)題就是限流問(wèn)題。大模型服務(wù)本身資源消耗很大,提供大模型服務(wù)的供應(yīng)商為了保證盡可能多的用戶享受到正常的服務(wù),所以,它對(duì)單用戶實(shí)施了限流。以 OpenAI API 為例,下面就是它的限流標(biāo)準(zhǔn),其中 RPM 是 requests per minute(每分鐘請(qǐng)求數(shù)),TPM 是 tokens per minute(每分鐘 Token 數(shù))。

圖片圖片

如果我們是一個(gè)人或是規(guī)模比較小的服務(wù),這個(gè)限流標(biāo)準(zhǔn)大概是夠用的,但如果我們要對(duì)外提供服務(wù),這個(gè)標(biāo)準(zhǔn)大概率是不夠用的。解決這個(gè)問(wèn)題最簡(jiǎn)單的辦法就是多申請(qǐng)一些賬號(hào),形成一個(gè)號(hào)池,這樣限流標(biāo)準(zhǔn)對(duì)我們來(lái)說(shuō)就大幅度提高了,但隨之而來(lái)的一個(gè)問(wèn)題就是如何管理號(hào)池。

稍微仔細(xì)想一下,你就會(huì)發(fā)現(xiàn),實(shí)現(xiàn)一個(gè)還不錯(cuò)的號(hào)池管理還是比較麻煩的。比如,按什么方式在不同的賬號(hào)之間進(jìn)行選擇,怎樣管理失效的賬號(hào)等等。真的要實(shí)現(xiàn)好一個(gè)號(hào)池,就等于實(shí)現(xiàn)了一個(gè)完整的運(yùn)維工具,可是,你的應(yīng)用目標(biāo)是做一個(gè) AI 應(yīng)用。與其自己實(shí)現(xiàn)這么一套完整的功能,還不如用已有的工具來(lái)完成這個(gè)目標(biāo)。是的,已經(jīng)有一些現(xiàn)成的工具可以完成這個(gè)目標(biāo)。

當(dāng)使用了大模型代理

我們先來(lái)看看如果把接入管理獨(dú)立出來(lái)之后,會(huì)產(chǎn)生怎樣的變化。

首先肯定是解決了多賬號(hào)管理的問(wèn)題。所有的賬號(hào)都配置在這個(gè)代理上,而對(duì)于我們自己的應(yīng)用而言,只配置一個(gè)賬號(hào)就好。這個(gè)大模型代理通常會(huì)采用 OpenAI 兼容的 API,也就是說(shuō),你完全可以用 OpenAI API 的使用方式使用它,一般來(lái)說(shuō),我們只要替換一下 API_BASE 和 API_KEY,而其它的代碼可以完全保持不變。這也是我們代理能夠平滑接入的原因。

有了大模型代理之后,我們還可以有一些其它的變化。一個(gè)典型的應(yīng)用場(chǎng)景就是接入不同的供應(yīng)商。雖然我們一直在講 OpenAI API,但由于眾所周知的原因,我們并不能直接訪問(wèn) OpenAI API。

一個(gè)常見(jiàn)的解決辦法是,通過(guò)一些供應(yīng)商來(lái)進(jìn)行訪問(wèn)。一般來(lái)說(shuō),我們并不會(huì)依賴于一家供應(yīng)商,所以,配置多個(gè)供應(yīng)商也是很常見(jiàn)的。有了大模型代理之后,這些復(fù)雜性就從我們的應(yīng)用中剝離出去了。

圖片圖片

不同的供應(yīng)商上提供的 API 可能會(huì)有所差異。比如,微軟的 Azure 也提供了 OpenAI 的服務(wù),但接口略有差異。如果是自己的代碼,我們就需要自己管理這種差異。有了大模型代理,我們就可以把這種復(fù)雜性交給代理,而讓我們的代碼采用統(tǒng)一的接口進(jìn)行訪問(wèn)。

前面討論的還都是 OpenAI 的模型。既然有了大模型代理,我們完全可以再進(jìn)一步,通過(guò)它訪問(wèn)不同的模型。事實(shí)上,很多供應(yīng)商就提供了類似的能力,比如 OpenRouter 就提供了許多不同模型的訪問(wèn)能力,而它們都是基于 OpenAI 兼容接口的。通過(guò)大模型代理,我們也可以訪問(wèn)不同的大模型。

不僅僅是使用別人的服務(wù),我們甚至可以訪問(wèn)自己本地部署的大模型。后面我們講到本地部署大模型時(shí),我們會(huì)談到如何利用大模型代理訪問(wèn)本地大模型。

總之,有了大模型代理之后,各種接入問(wèn)題的復(fù)雜度就完全交給它了。在應(yīng)用端來(lái)看,接入就完全簡(jiǎn)化成一個(gè) OpenAI 的接入接口。這也是我們前面重點(diǎn)介紹 OpenAI API 接口的原因。另外,我們前面說(shuō)過(guò),LangChain 在一些場(chǎng)景下是不適用的,其中的一個(gè)原因就是它提供的一些抽象在某些情況下是失效的。有了大模型代理,LangChain 提供的模型抽象就顯得沒(méi)有必要了。

大模型代理示例

能夠提供大模型代理的工具有很多,下面我以 One-API 為例介紹一下基本的用法。One-API 就是一個(gè)典型的大模型代理,它提供了以 OpenAI API 接口訪問(wèn)各種大模型的能力。我們常見(jiàn)的一些大模型在 One-API 中都得到了支持,比如,GPT、Claude、文心一言、通義千問(wèn)等等。它在行業(yè)內(nèi)得到了很廣泛地使用,所以,它在能力上也得到了很多擴(kuò)展,比如,計(jì)費(fèi)管理、渠道管理等等。

安裝 One-API 最簡(jiǎn)單的方式是使用 Docker,比如:

docker run --name one-api -d --restart always -p 3000:3000 -e SQL_DSN="root:123456@tcp(localhost:3306)/oneapi" -e TZ=Asia/Shanghai -v /home/ubuntu/data/one-api:/data justsong/one-api

在實(shí)際使用中,我們會(huì)根據(jù)自己的實(shí)際情況修改數(shù)據(jù)庫(kù)配置(SQL_DSN),如果配置了 SQL_DSN,One-API 會(huì)使用 MySQL 作為數(shù)據(jù)庫(kù)。此外需要調(diào)整的配置就是映射目錄,這個(gè)目錄里存放的是數(shù)據(jù)和日志:

-v /home/ubuntu/data/one-api:/data

啟動(dòng)之后,訪問(wèn)對(duì)應(yīng)的地址,比如,在本地啟動(dòng)就是訪問(wèn) http://localhost:3000/,你就會(huì)看到它的界面。要想看到更多的配置項(xiàng),需要進(jìn)行登錄。

圖片圖片

這里面的重點(diǎn)是渠道,這對(duì)應(yīng)的就是我們前面提到的服務(wù)供應(yīng)商。我們可以添加新的渠道,這里主要的幾個(gè)選項(xiàng)是:

類型:它決定了在轉(zhuǎn)發(fā)過(guò)程中采用什么 API 接入到后端的模型上,比如,OpenAI 就會(huì)采用 OpenAI API。

模型:這個(gè)渠道支持的模型,比如,gpt-4o-mini。每個(gè)渠道可以配置很多的模型。

連接信息:接入地址(代理)和 API Key(密鑰),如果是同一個(gè)供應(yīng)商的多個(gè)賬號(hào),可以采用批量創(chuàng)建的方式,輸入多個(gè) API Key。

圖片圖片

在這個(gè)配置里,有一個(gè)比較有意思的配置是模型重定向,就是把一個(gè)模型名稱轉(zhuǎn)換成另外一個(gè)模型的名稱。一種典型的用法是,把一個(gè)比較昂貴的模型用另外一個(gè)便宜的模型代替。比如,早期的 GPT-4 價(jià)格是很高的,而后期的 GPT-4o 價(jià)格就要便宜不少,而且性能會(huì)更強(qiáng)大。我們就可以在這里做一個(gè)映射,讓?xiě)?yīng)用請(qǐng)求過(guò)來(lái)的 GPT 4,而真正請(qǐng)求到后端都是 GPT-4o。

還有一種用法是,給模型起一個(gè)新名稱。這樣一來(lái),我們的應(yīng)用提供給用戶的是一個(gè)自定義的名稱,請(qǐng)求到代理上之后,再轉(zhuǎn)成真正的模型發(fā)出去,以此屏蔽掉后端真正的模型。我們?cè)诓簧賾?yīng)用上見(jiàn)到的所謂自己的模型,都可以這么實(shí)現(xiàn)出來(lái)。

如果配置了多個(gè)渠道之后,我們可以在渠道列表看到后面截圖里的選項(xiàng)。

圖片圖片

在這里我們可以做一些運(yùn)維類的工作,比如,禁用失效的渠道。還有一個(gè)點(diǎn)是優(yōu)先級(jí),它是用來(lái)確定訪問(wèn)順序的。比如,多個(gè)渠道都提供了 gpt-4o-mini 這個(gè)模型,我們會(huì)訪問(wèn)優(yōu)先級(jí)高的渠道。

設(shè)置了模型之后,我們還需要添加 API Key,也就是這里的令牌。我們可以根據(jù)自己的需要設(shè)置相應(yīng)的權(quán)限。

圖片圖片

具體的 API Key 是自動(dòng)生成的。我們創(chuàng)建好令牌之后,可以在令牌列表中找到。只要在這里復(fù)制就可以得到所需的 API Key 了。

后面的操作我們都很熟悉了,就是把 One API 的訪問(wèn)地址和 API Key 配置到我們的代碼里,和平時(shí)使用 OpenAI API 是一樣的。

總結(jié)

我們討論了一種需要在架構(gòu)上做調(diào)整的工程實(shí)踐:集中接入。在這個(gè)實(shí)踐中,我們引入了一個(gè)大模型代理,將所有與接入有關(guān)的復(fù)雜度都放到了這個(gè)代理上,比如:

它可以解決多賬號(hào)的管理,從而解決了大模型服務(wù)的限流問(wèn)題;

通過(guò)多供應(yīng)商的管理,我們就不必依賴于某家特定的供應(yīng)商;

大模型代理可以屏蔽不同的供應(yīng)商之間的差異;

它還可以統(tǒng)一地接口訪問(wèn)不同的模型;

應(yīng)用只通過(guò) OpenAI API 訪問(wèn)統(tǒng)一到接口,將大幅度簡(jiǎn)化應(yīng)用端代碼的編寫(xiě),甚至可以讓 LangChain 構(gòu)建的一些抽象都失效。

我們以 One API 為例介紹了大模型代理的設(shè)置過(guò)程,主要就是渠道和令牌的管理。除了大模型代理的基本功能,One API 還提供了模型重定向能力,它可以在運(yùn)行時(shí)對(duì)應(yīng)用端請(qǐng)求的模型進(jìn)行修改,實(shí)現(xiàn)一些特殊的功能。

如果今天的內(nèi)容你只能記住一件事,那請(qǐng)記住,集中接入將接入的復(fù)雜度轉(zhuǎn)到了大模型代理上,簡(jiǎn)化了應(yīng)用端代碼的編寫(xiě)。

責(zé)任編輯:武曉燕 來(lái)源: 二進(jìn)制跳動(dòng)
相關(guān)推薦

2009-02-25 18:32:39

虛擬化IT服務(wù)器虛擬化

2013-01-17 14:40:19

公有云私有云云操作系統(tǒng)

2013-01-18 14:32:05

云操作系統(tǒng)

2013-11-13 23:14:57

惠普OneView數(shù)據(jù)中心

2023-12-06 08:00:41

2011-08-02 14:18:22

2009-05-05 14:25:49

服務(wù)器管理IBM

2011-10-19 09:57:11

2012-03-30 10:41:52

imo

2019-05-20 11:54:51

Google云AWS CloudKubernetes

2009-09-10 22:46:37

統(tǒng)一管理系統(tǒng)IP可視化華為

2024-12-11 09:13:00

2010-05-10 09:02:50

Visual Stud

2012-02-22 09:41:55

2011-08-02 13:51:33

2011-08-02 14:52:56

流量控制路由器飛星魚(yú)

2011-10-19 09:39:25

2011-12-31 16:26:34

三重保護(hù)信息防泄漏IP-guard

2013-12-16 09:10:35

混合網(wǎng)絡(luò)虛擬化統(tǒng)一管理

2010-06-22 16:53:48

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日韩成人在线免费视频 | 91中文字幕在线观看 | 国产91在线 | 欧美 | 欧美精品中文字幕久久二区 | 一区二区三区中文字幕 | 一本一道久久a久久精品蜜桃 | 亚洲国产精品va在线看黑人 | 久久高清精品 | 精品国产一区二区三区性色av | 欧美日韩一区二区在线 | 精品一区二区三区在线观看国产 | 久久高清| 午夜视频在线观看网址 | 亚洲精品国产成人 | 老子午夜影院 | 免费在线观看91 | 成人亚洲性情网站www在线观看 | 中文字幕在线播放第一页 | 国产成人a亚洲精品 | 日韩成人性视频 | 日本亚洲一区 | 国产婷婷精品 | 国产精品自拍av | 日韩在线电影 | 正在播放国产精品 | 亚洲网在线 | 亚洲精选一区 | 欧美一区二 | 欧美久久一区 | 欧美日韩美女 | 国产精品1区| www国产成人免费观看视频 | 成人超碰 | www亚洲精品 | 2022精品国偷自产免费观看 | 日韩欧美在线不卡 | 久热精品在线观看视频 | 亚洲精品一二三区 | 黄色大片在线免费观看 | 特级丰满少妇一级aaaa爱毛片 | 不卡的av在线 |