深夜突襲!DeepSeek V3 偷偷更新變強
DeepSeek 剛剛悄然發布了 DeepSeek-V3-0324 模型。這次更新遠超預期,不僅性能大幅提升,而且新增了多項實用功能,讓開發者和企業用戶都為之驚嘆。
回顧之前的 DeepSeek R1 版本,盡管能力出色,但仍存在幾個明顯短板:缺乏函數調用能力、不支持規范化的 JSON 輸出。這些功能對于 AI 在實際業務場景中的應用至關重要。
以下是官方樸實無華的更新日志:
圖片
中文寫作能力測試
提示詞:假設你是一名環保專家,最近你發現了一種新的可持續能源技術。請描述這項技術的原理、優勢以及對環境的潛在影響。
1742904958
寫作能力有了大幅度提升,畢竟基于 R1 ,「左腳踩右腳」
前端開發能力測試
接下來,我測試了它的前端開發能力:
我問了它:技術棧不限制,幫我實現一個網站登錄界面 .html
1742905401
DeepSeek V3 函數調用功能
函數調用是這一功能使大語言模型能夠根據用戶提示,生成調用特定函數的結構化請求,包含函數名稱和必要參數。這為 AI 與外部工具、API 的無縫集成提供了強大支持。
舉例來說,眾所周知大語言模型在處理復雜數學計算時存在局限性。通過函數調用,您可以為模型提供一個 "數學工具庫 ",模型會指示應調用哪個函數以及需要哪些參數。系統執行該函數后,將結果與原始提示一起返回給模型,從而獲得完整、準確的回答。
需要明確的是:模型自身不執行函數,它只是指示應該調用什么函數以及如何調用。
1742906059
實際應用示例
添加依賴
<dependency>
<groupId>dev.langchain4j</groupId>
<artifactId>langchain4j-open-ai</artifactId>
<version>1.0.0-beta2</version>
</dependency>
創建 AI 服務接口
public interface FunctionAssistant {
String chat(String message);
}
用注解實現業務邏輯
public class InvoiceHandler {
@Tool("根據用戶提交的開票信息進行開票 ")
public String handle(String companyName, String dutyNumber, @P("金額保留兩位有效數字 ") String amount) {
log.info("companyName =>>>> {} dutyNumber =>>>> {} amount =>>>> {}", companyName, dutyNumber, amount);
return "開票成功 ";
}
}
測試調用效果
@Test
publicvoidtest2() {
ChatLanguageModelchatLanguageModel= OpenAiChatModel.builder()
.apiKey("sk-")
.modelName("deepseek-chat")
.baseUrl("https://api.deepseek.com/v1")
.logRequests(true)
.logResponses(true)
.build();
FunctionAssistantassistant= AiServices.builder(FunctionAssistant.class)
.chatLanguageModel(chatLanguageModel)
.tools(newInvoiceHandler())
.build();
Stringchat= assistant.chat("幫我開具發票,公司名稱:深圳市騰訊計算機系統有限公司,稅號:91440300734991234A,金額:100.123456");
System.out.println(chat);
}
1742906411
總結彩蛋
從筆者近期對 AI Chat2BI 業務落地的研究來看,V3 相比 R1 推理模型具備更高的可玩性。在 Chat2BI 的優化過程中,我們嘗試了多種策略,但準確性始終難以顯著提升。V3-0324 發布后,我們第一時間進行了實測,結果表明,在國內模型中,唯有 V3-0324 能夠穩定地通過 function 實現 Chat2BI 效果(在相同提示詞、SQL 字段未進行語義或向量優化的情況下,該模型自身的能力遠超大部分調優手段。當然,Claude 3.7 Sonnet 也展現了驚艷的表現)。
本次更新彌補了諸多短板,使 AI 更加深度融入業務流程,未來可期待更多 AI 創新案例的涌現。唯有真正賦能業務,AI 才能創造真正的價值。
1742922457