Java智能之Spring AI:五分鐘打造智能聊天模型的利器
前言
盡管Python最近成為了編程語言的首選,但是Java在人工智能領域的地位同樣不可撼動,得益于強大的Spring框架。隨著人工智能技術的快速發展,我們正處于一個創新不斷涌現的時代。從智能語音助手到復雜的自然語言處理系統,人工智能已經成為了現代生活和工作中不可或缺的一部分。在這樣的背景下,Spring AI 項目迎來了發展的機遇。盡管該項目汲取了Python項目如LangChain和LlamaIndex的靈感,但Spring AI并不是簡單的移植。該項目的初衷在于推進生成式人工智能應用程序的發展,使其不再局限于Python開發者。
Spring AI 的核心理念是提供高度抽象化的組件,作為開發AI應用程序的基礎。這些抽象化組件具備多種實現,使得開發者能夠以最少的代碼改動便捷地交換和優化功能模塊。
具體而言,Spring AI 提供了支持多種主流模型提供商的功能,包括OpenAI、Microsoft、Amazon、Google和Hugging Face。支持的模型類型涵蓋了從聊天機器人到文本生成、圖像處理、語音識別等多個領域。而其跨模型提供商的可移植API設計,不僅支持同步和流式接口,還提供了針對特定模型功能的靈活選項。
此外,Spring AI 還支持將AI模型輸出映射為POJO,以及與主流矢量數據庫提供商(如Apache Cassandra、Azure Vector Search、MongoDB Atlas等)無縫集成的能力。其功能不僅局限于模型本身,還包括了數據工程中的ETL框架和各種便利的函數調用,使得開發AI應用程序變得更加高效和可靠。
快速實戰
本期實戰是我們的第一篇,旨在通過快速展示Spring AI項目,讓大家了解它的優點和特性。為了方便大家使用,我還將本期的源代碼提交到了倉庫中,并加入了swagger-ui的API調用界面,使得使用起來更加便捷。如果你對此感興趣,歡迎前往查看star。同時,我也會持續維護這個項目,確保它始終保持活躍。
倉庫地址:https://github.com/StudiousXiaoYu/spring-ai-demo
項目生成
當我們開始時,首先需要創建一個項目結構。我們可以前往官方網站,快速生成Spring AI的依賴并創建項目。
圖片
聊天模型
在大型模型中,聊天模型扮演著至關重要的角色。那么,SpringAI是如何對其進行封裝的呢?本期主要著重展示如何有效利用Spring AI的ChatClient,特別是在本示例中應用Spring AI的智能聊天模型。
日志級別
在這個過程中,如果想要查看請求的細節日志,務必將日志級別調整至DEBUG,具體操作如下:
圖片
image
模型配置
當我們使用一個模型時,必須首先在項目中加入相關的依賴,加入依賴后還需要在配置文件中填寫相應的配置信息。
圖片
注入model
那么模型可以自動注入,我們可以直接使用它。在本期演示中,我們將展示三種自定義模型的注入方式,具體如下:
private final ChatClient myChatClientWithSystem;
private final ChatClient myChatClientWithParam;
/**
* 可以選擇自動注入、也可以在方法內自定義,此客戶端無系統文本
*/
private final ChatClient chatClient;
public MyController(ChatClient.Builder chatClientBuilder, MyChatClientWithSystem myChatClient, MyChatClientWithParam myChatClientWithParam) {
this.chatClient = chatClientBuilder.build();
this.myChatClientWithSystem = myChatClient.client();
this.myChatClientWithParam = myChatClientWithParam.client();
}
好的,讓我來解釋一下這三種情況:
- chatClient:這是默認的自動注入的ChatClient,不需要任何條件。
- myChatClientWithParam:這是一個注入系統文本并帶有參數的ChatClient。
- myChatClientWithSystem:這是一個注入帶有系統文本的ChatClient。
好的,第一種情況不需要處理,我們只需要通過配置類簡單配置下面兩種ChatClient。
@Configuration
class Config {
@Bean
MyChatClientWithSystem myChatClientWithSystem(ChatClient.Builder builder) {
MyChatClientWithSystem build = MyChatClientWithSystem.builder()
.client(builder.defaultSystem("你是努力的小雨,一名 Java 服務端碼農,潛心研究著 AI 技術的奧秘。我熱愛技術交流與分享,對開源社區充滿熱情。身兼掘金優秀作者、騰訊云內容共創官、阿里云專家博主、華為云云享專家等多重身份。")
.build()).build();
return build;
}
@Bean
MyChatClientWithParam myChatClientWithParam(ChatClient.Builder builder) {
MyChatClientWithParam build = MyChatClientWithParam.builder()
.client(builder.defaultSystem("你是{user}。")
.build()).build();
return build;
}
}
簡單文本回答
首先,讓我們先來討論一些簡單的問答。
@GetMapping("/ai")
String generationByText(String userInput) {
return this.chatClient.prompt()
.user(userInput)
.call()
.content();
}
在這段簡練代碼中,已經實現了各種封裝和交互,為了更好地演示,我們來展示一下:
圖片
封裝回答實體對象
大家都知道Java是一種面向對象的編程語言,因此在加入人工智能技術時,為了滿足業務需求,將對象納入其中是不可或缺的。那么,如何讓人工智能的回答能夠被Spring框架自動封裝到對象中呢?讓我們來探討一下:
定義一個對象記錄類:一個記錄類(Record Class)的定義,名為 ActorFilms。用于封裝相關字段記錄類自動實現了 toString()、equals()、hashCode() 和 getter 方法,使得對象的字符串表示、相等性比較和哈希計算變得簡單。你可以直接使用 actorFilms.toString()、actorFilms.equals(anotherActorFilms) 和 actorFilms.hashCode()。
public record ActorFilms(String actor, List<String> movies) {
}
@GetMapping("/ai-Entity")
ActorFilms generationByEntity() {
ActorFilms actorFilms = chatClient.prompt()
.user("Generate the filmography for a random actor.")
.call()
.entity(ActorFilms.class);
return actorFilms;
}
可以看到,只需簡單地將entity設置為ActorFilms。接下來,我們需要檢查返回的對象是否符合預期。
圖片
當用戶輸入信息后,系統返回一個實體類型的回答。這種實體類型的回答之所以能夠被封裝,是因為在發送信息時,系統不僅僅發送了用戶輸入的文本,還在其后添加了額外的信息。Generate the filmography for a random actor.\r\nYour response should be in JSON format.\r\nDo not include any explanations, only provide a RFC8259 compliant JSON response following this format without deviation.\r\nDo not include markdown code blocks in your response.\r\nRemove the ```json markdown from the output.\r\nHere is the JSON Schema instance your output must adhere to:\r\n```{\r\n \"$schema\" : \"https://json-schema.org/draft/2020-12/schema\",\r\n \"type\" : \"object\",\r\n \"properties\" : {\r\n \"actor\" : {\r\n \"type\" : \"string\"\r\n },\r\n \"movies\" : {\r\n \"type\" : \"array\",\r\n \"items\" : {\r\n \"type\" : \"string\"\r\n }\r\n }\r\n }\r\n}```\r\n因此,當后續返回的數據為大型模型時,例如{"actor": "Emily Blunt", "movies": ["Edge of Tomorrow", "A Quiet Place", "The Devil Wears Prada", "Sicario", "Mary Poppins Returns"]},這樣一來Spring就可以幫我將其自動封裝起來了。
封裝回答列表實體對象
當我們需要返回一個列表而不是一個對象時,可以輕松地利用Spring AI的封裝功能來實現。讓我們來看看如何操作:
@GetMapping("/ai-EntityList")
List<ActorFilms> generationByEntityList() {
List<ActorFilms> actorFilms = chatClient.prompt()
.user("Generate the filmography of 5 movies for Tom Hanks and Bill Murray.")
.call()
.entity(new ParameterizedTypeReference<List<ActorFilms>>() {
});
return actorFilms;
}
直接使用ParameterizedTypeReference對象即可。為了讓Spring能夠自動封裝返回結果,發送信息時也包含了返回格式信息作為提示?,F在我們來查看演示的結果。
圖片
流式回答
在前面展示的示例中,大型模型一次性完成回答并將其全部輸出給用戶。然而,前端無法實現打字機效果,因此我們決定采用流式回答的方式來進行演示。
@GetMapping("/ai-streamWithParam")
Flux<String> generationByStreamWithParam() {
var converter = new BeanOutputConverter<>(new ParameterizedTypeReference<List<ActorFilms>>() {
});
Flux<String> flux = this.chatClient.prompt()
.user(u -> u.text("""
Generate the filmography for a random actor.
{format}
""")
.param("format", converter.getFormat()))
.stream()
.content();
String content = flux.collectList().block().stream().collect(Collectors.joining());
List<ActorFilms> actorFilms = converter.convert(content);
log.info("actorFilms: {}", actorFilms);
return flux;
}
為了演示用戶信息中的參數傳遞,我對流式回答進行了一個阻塞操作。如果不需要的話,可以將其刪除。另外,由于我需要封裝一個列表對象,所以進行了阻塞操作。實際上,這與上面提到的一樣,即在問答中直接定義了大模型返回的格式。好的,我們來看一下返回結果。
圖片
帶有系統信息的client
這次我們將演示客戶端的配置。在對話中,我們知道有三種身份標識:system、user、assistant。至今,我們尚未展示系統身份標識,但之前我們已經定義了系統形式的客戶端。因此,這次我們將直接使用它:
@GetMapping("/ai-withSystemClient")
Map<String, String> generationByTextWithSystemClient(String message) {
return Map.of("completion", myChatClientWithSystem.prompt().user(message).call().content());
}
這段代碼非常簡單,只需使用ChatClient即可。用戶輸入后,會返回一個Map類型的回答,其中key為"completion",對應的value為回答內容。讓我們一起來看一下結果吧。
圖片
可以看出,實際上他已經將我的system信息包含在內了。
帶有參數信息的client
當您需要演示帶有參數的情況時,您可以考慮以下方法:在用戶輸入后,返回一個Map類型的回答,其中包含鍵值對,鍵為"completion",值為相應的回答。在實際業務場景中,參數是不可避免的,因此這種演示方式可以更好地展示人工智能的適用性。讓我們繼續探討這一點:
@GetMapping("/ai-withParamClient")
Map<String, String> generationByTextWithParamClient(String message, String user) {
return Map.of("completion", myChatClientWithParam.prompt().system(sp ->sp.param("user",user)).user(message).call().content());
}
這里也是很簡單的一句話,所以我們看下效果:
圖片
如果您對回答感到困惑,我們可以查看后臺傳輸日志,以了解傳輸的參數詳情。
圖片
可以注意到,實際上我們已經成功將參數設置完成。
聊天歷史
在最后一個主要的業務場景中,每個人都會有自己的聊天記錄。我們不能一直進行無狀態的對話,這樣會顯得很不智能。因此,必須要有聊天記錄的功能。雖然Spring AI尚未完全確定如何封裝這部分功能,但已經提供了一個簡單的對象類供我們調用。讓我們來看一下:
@GetMapping("/ai-chatMemory")
String generationByChatMemory(HttpServletRequest request, String userInput) {
String sessionId = request.getSession().getId();
chatMemory.add(sessionId, new UserMessage(userInput));
String content = this.chatClient.prompt()
.advisors(new MessageChatMemoryAdvisor(chatMemory))
.user(userInput)
.call()
.content();
chatMemory.add(sessionId, new AssistantMessage(content));
return content;
}
實際上,在這種情況下,我們需要自行創建并維護一個聊天歷史對象。因此,每次進行聊天前和聊天后,我們都應該將所需的信息添加到該對象中,然后直接使用它。讓我們來看一下這種做法的效果:
圖片
圖片
可以看到,實際上在這里已經將歷史記錄一并呈現了出來。
總結
通過本文的介紹,我們深入了解了Spring AI項目的優勢和特性,以及在實際應用中的快速實戰示例。Spring AI作為一個高度抽象化的人工智能應用程序開發框架,為開發者提供了便捷的模型支持、靈活的功能模塊交換和優化能力。它不僅能將AI模型輸出映射為POJO,還能與主流矢量數據庫提供商無縫集成,從而顯著提升開發AI應用程序的效率和可靠性。
與Python相比,Java在企業級應用和大型系統中具有顯著優勢。Java語言的靜態類型和嚴格的編譯時檢查使得代碼更加健壯和易于維護,尤其適合需要高度可靠性和長期支持的項目。同時,Java生態系統的成熟度和廣泛應用確保了開發者可以輕松找到豐富的庫和工具支持,加速開發周期并降低項目風險。