出品 | 51CTO技術棧(微信號:blog51cto)
1月30日,訊飛星火認知大模型V3.5成功發布!用核心能力的突破,回應時代的疑問。邁向更通用、實用的全民開放大模型,訊飛星火全面對標國際先進水平,同時首次發布星火語音大模型和星火開源大模型。
1、對標GPT-4 Turbo七大能力全面提升
作為首個基于全國產算力平臺“飛星一號”訓練的全民開放大模型,訊飛星火V3.5實現了文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力等七大核心能力的全面提升。
對標國際領先,在語言理解、數學能力已超過GPT-4 Turbo,代碼達到GPT-4 Turbo 96%,多模態理解達到GPT-4V 91%,再次將國產大模型推向新高度。
圖片
對于大模型將如何解決世界剛需?科大訊飛董事長劉慶峰給出全新的答案——賦能萬物互聯時代人機交互、賦能知識學習與內容創作、提升數智化生產力。
大模型從科技概念,逐漸落地剛需場景,變革個人工作模式。企業與個人不再追問何為生成式AI,轉而希望了解如何應用該技術解放生產力。
不得不提的一個驚艷發布:訊飛智文!
“請為我生成一份合肥文旅產業發展報告”,一句簡單的指令詞,就能快速生成符合要求的PPT文檔。依托星火大模型的文本與多模態生成能力,訊飛智文輕松實現“一鍵AI配圖、模板秒切換、AI撰寫文本”等高效操作。
圖片
對于已生成好的PPT文檔,借助訊飛星火強大語言理解的加持,訊飛智文能夠秒級生成演講腳本。融合AI虛擬人技術,讓每個PPT都搭配一個專業講解員,進一步解放生產力。
2、星火語音大模型首發全語音交互,主流語音識別超OpenAI
作為科大訊飛的強項領域,對于這場發布會,大家非常期待語音大模型的推出。據悉,剛剛過去的2023年,在“國際聲學場景和事件檢測及分類挑戰賽、國際機器口語翻譯評測比賽”等語音行業權威賽事,訊飛再奪冠軍。
而大模型的橫空出世,給語音研究帶來了新的技術邏輯,創造了語音技術發展的全新機會。憑借模型大尺寸,海量數據訓練后,能夠實現更精細的模型描述、更精準的語義理解以及更統一的多任務建模,帶來的直接表現就是語音合成的韻律表現力和擬人度更高。
圖片
基于大語言模型框架,結合訊飛多維度語音屬性解耦表征預訓練,星火語音大模型正式發布!不僅是把國際通用的常規語音大模型框架用好、用足、用到位,同時把訊飛多年的、獨一無二的、拿了中國專利金獎的核心能力整合進去。
在星火語音大模型,中文、英語、法語、俄語等首批37個主流語種的語音識別效果已經超過OpenAI Whisper V3。同時,在多語種語音合成方面,首批40個語種平均MOS分絕對提升0.25,超擬人語音合成擬人度達到83%+。
圖片
現在,訊飛星火App已深度集成星火語音大模型,讓用戶可以給大模型“打電話”,隨時召喚需要的“賈維斯”。不論東北話還是外語發言,訊飛星火App都能輕松勝任。
據悉,下載訊飛星火App,即可體驗星火語音大模型。同時,開發者還可以訪問訊飛開放平臺官網,申請星火語音大模型API。