全民LongLLM時代終于到來。本月,中國初創AGI(通用人工智能)公司月之暗面宣布旗下大模型工具KimiChat正式升級到200萬字參數量,與五個月前該大模型初次亮相時的20萬字相比,提升十倍。KimiChat的升級徹底引爆市場,同時也引起長文本大模型(LongLLM)細分賽道更加激烈的競爭。(圖源:阿里通義千問)昨日,阿里旗下的大模型工具通義千問宣布迎來重磅升級,向所有人開放最高1000萬字的長文本處理能力,更重要的是,這項升級完...
2024-03-28 10:18:48 3342瀏覽 0點贊 0回復 0收藏
“2024年是大模型應用場景元年,中國完全可以走出一條具有中國特色的大模型發展之路。”周鴻祎的預測還言猶在耳,經歷了“百模大戰”的國產大模型勝出者們,已經吹響了商業場景落地之戰的號角。3月14日,大模型獨角獸智譜AI創始人兼CEO張鵬披露了公司目前的商業化進展:已有超2000家生態合作伙伴,實現了超1000個大模型規模化應用,與超200家企業進行深度共創,涵蓋了傳媒、咨詢、消費、金融、新能源、互聯網、智能辦公等多個細...
2024-03-28 10:13:53 3136瀏覽 0點贊 0回復 0收藏
今年以來,如火如荼的AIGC領域出現了眾多不同的聲音。前不久,某中國著名投資人在一個行業論壇上表示:“大模型行業已經過熱了,在通用大模型領域,已經沒有什么機會了”。行業現實,也呈現出不同的面貌,一方面,不少AI創業公司遲遲找不到可持續的商業模式,融資困難;另一方面,看似主營產品還是十分傳統的老牌玩家卻做的風生水起,譬如微軟去年推出了WindowsAIStudio,開發者可以在其中訪問各種AI模型,并根據自己的需求進行...
2024-03-28 10:09:48 2459瀏覽 0點贊 0回復 0收藏
核心摘要:生命循環,人機共育在宏觀層面上,如果把人工智能看作一種生命體,AIGC+教育的內涵其實是碳基生命和硅基生命的交互和培育問題。AIGC技術是對人腦計算、思考、判斷等內在能力的延伸,是人的智能在機器形態上的規模化聚集、運作和反應。由此,部分基礎性的專業工作被替代,AI在勞動貢獻、價值創造中逐漸與人比肩甚至超越人類,AI和人類共同成為社會貢獻主體。在中觀層面上,AIGC技術在知識量、信息獲取和處理方面的強勢...
2024-03-28 10:03:44 3651瀏覽 0點贊 0回復 0收藏
核心摘要:古人有云:日就月將,學有緝熙于光明。人類對人工智能學的潛心鉆研終于再度獲得重大突破,大模型的涌現能力與AIGC的應用普及為那不一定是AGI但一定更AI的未來提供了確定性的加速度。AI2.0時代的加速到來,不僅是把AI能力融入到現有應用中,更是未來產業范式的再塑造。AI正跳躍式地加速滲透進各行各業,推動一場新的生產力與創造力革命。AI產業鏈各環節參與者的角色功能、產品服務和應用生態可能將發生變化。對此,艾...
2024-03-28 09:55:11 4114瀏覽 0點贊 0回復 0收藏
大家常說,作業是影響家庭和諧的“罪魁禍首”。一到寫作業時間,家里往往雞飛狗跳還會上演鬧劇,父母互相甩鍋,學生嚎啕大哭……如果讓AI加入,會擦出什么不一樣的火花?可以想象一下,情緒穩定的AI伙伴耐心啟蒙輔導、學識淵博的AI知識庫為學生答疑解惑、AI助手實時批改認真糾錯。這一切已經開始成為現實,如今生成式AI、大模型等諸多前沿技術引發的技術革命,正在席卷各行各業,其中教育被看作最具潛力的賽道之一。AI正在為以...
2024-03-28 09:43:11 3006瀏覽 0點贊 0回復 0收藏
不久前,我們推出了最強大的基礎模型Gemini。Gemini是一個多模態模型,它既可以接受文本輸入,也可以接受圖像輸入。我們為Android開發者們介紹一種方法,以幫助您在設備上使用我們最小規模的模型:GeminiNano。GeminiNano可以通過AICore在特定設備上使用。AICore是一種處理模型管理、運行時、安全功能等任務的系統服務,有助于簡化開發者的工作。現在,我們將向您介紹訪問GeminiPro模型的全新方法,該模型可以在Google的數據中...
2024-03-28 09:36:51 3842瀏覽 0點贊 0回復 0收藏
一、引言知識圖譜和大型語言模型都是用來表示和處理知識的手段。不同于大型語言模型,知識圖譜中的知識通常是結構化的,這樣的結構讓其具有更強的準確性和可解釋性。知識圖譜嵌入(KnowledgeGraphEmbedding,KGE)是一種將知識圖譜中的實體和關系轉化為低維度、連續的向量空間表示的技術。這種轉化使得復雜的關系和屬性能夠以向量形式表達,從而便于機器學習算法進行處理。這些技術為各種知識密集型任務(例如信息檢索、問答和...
2024-03-28 09:27:03 3174瀏覽 0點贊 0回復 0收藏
一、引言現階段,程序代碼是解決基于大型語言模型(LLM)的復雜推理任務的有效的方式之一,這類方法通常被稱為"程序或代碼思維鏈"(programofthought)。與傳統思維鏈(chainofthought)方法相比,代碼思維鏈方法將復雜問題分解為可執行的代碼片段,并且利用代碼執行器逐步解決子問題,可以較大程度提升基于大型語言模型的推理能力。然而目前代碼程序數據本身的形式與大模型推理能力之間的相關性仍是未解之謎,我們對于構造何種代碼...
2024-03-27 13:44:37 4620瀏覽 0點贊 0回復 0收藏
一、引言視覺語言模型(VLMs)已在多種多模態理解和生成任務中展現了顯著的性能表現。然而,盡管這些多模態模型在廣泛的任務中表現出色,但是它們能否有效地捕獲結構化知識(即理解對象間關系以及對象與其屬性間關系的能力)仍然是一個未解決的問題。如圖(a)所示,我們在分析CLIP模型時發現,與圖像不匹配的標題(Ahorseisridinganastronaut)相比,圖像與正確匹配的標題(Anastronautisridingahorse)之間的CLIP分數(即語義相...
2024-03-27 11:05:11 3244瀏覽 0點贊 0回復 0收藏
一、引言知識圖譜嵌入(KGE)已被證明是解決知識圖補全(KGC)任務的有效方法。關系模式是指具有特定語義的關系、表示為圖形模式,是影響KGE模型性能的重要因素。雖然之前的工作從理論上分析了KGE模型在不同關系模式下的能力,并建立了更好的關系模式建模與更好的KGC性能之間的粗略聯系,但對關系模式上的KGE模型的全面定量分析仍然缺乏,因此不確定KGE對關系模式的理論支持如何有助于與該關系模式相關的三元組的性能。二、關系模式...
2024-03-27 10:55:49 4204瀏覽 0點贊 0回復 0收藏
引言隨著人工智能的飛速發展,機器學習,特別是深度學習,在過去幾十年中在許多領域和應用中取得了顯著的成就。例如,卷積神經網絡(CNN)在圖像分類和視覺對象識別方面的準確性常常超過人類,推動了自動駕駛車輛、面部識別、手寫識別、圖像檢索和遙感圖像處理等應用的快速發展。同樣,循環神經網絡(RNN)和基于Transformer的模型在序列學習和自然語言理解方面取得了成功,這些技術推動了機器翻譯、語音識別和聊天機器人等應用...
2024-03-27 10:42:52 3602瀏覽 0點贊 0回復 0收藏
引言在自然語言處理(NLP)的眾多應用場景中,大型語言模型(LargeLanguageModel,LLM)展現了其卓越的文本理解與生成能力,不僅在傳統的文本任務上成績斐然,更在生物學、計算化學、藥物研發等跨學科領域證明了其廣泛的應用潛力。盡管如此,生物分子研究領域的特殊性—比如專用數據集的缺乏、數據標注的高復雜度、知識的多元化以及表示方式的不統一—仍舊是當前面臨的關鍵挑戰。針對這些問題,本文提出MolInstructions,這是一...
2024-03-27 10:32:48 2550瀏覽 0點贊 0回復 0收藏
引言基于知識圖譜嵌入的方法在實體對齊領域取得了巨大成功。本文以生成模型的視角重新解構了目前實體對齊方法的范式,展示了其與生成模型間的相似之處,并從理論上揭示了現有的基于生成對抗網絡的方法的局限性。通過引入新的互變分自編碼器(MutualVAE)作為生成模型,本文構建了一個生成式實體對齊框架(GEEA)。GEEA實現了知識圖譜之間的實體轉換,并且能夠從隨機噪聲中生成新的實體。通過理論分析、實體對齊實驗,以及實體合...
2024-03-27 10:21:44 3952瀏覽 0點贊 0回復 0收藏
引言藥物發現的核心環節之一是合成和設計具有理想化學特性的分子。隨著語言模型展現出在解析復雜分子分布方面的潛力,研究人員開始嘗試將分子的SMILES描述符與預訓練語言模型相結合。然而,SMILES描述符的語法特質并不總能保障所生成化學結構的有效性,經常導致生成化學上無意義的字符串。除此之外,雖然分子語言模型在預訓練過程中學習了大量的分子結構信息,它們仍難以準確捕捉到現實世界中化學與生物特性的復雜關系。這使得...
2024-03-27 10:14:43 2965瀏覽 0點贊 0回復 0收藏
一、引言隨著大型語言模型的興起,自然語言處理(NLP)社區面臨的主要挑戰之一是如何高效地對模型進行微調。如果需要短期內改變模型的某些行為,重新進行參數微調可能會過于耗時和昂貴,在這種情況下,模型知識編輯(KnowledgeEditing)技術就顯得尤為重要。本文主要研究模型知識編輯的魯棒性,并重點探索兩個新問題:知識沖突(KnowledgeConflict)和知識扭曲(KnowledgeDistortion)。二、背景本文研究的知識編輯方法均為修改...
2024-03-27 10:00:53 4136瀏覽 0點贊 0回復 0收藏
一、引言多模態知識圖譜補全(MMKGC)通過將實體的結構、視覺和文本信息納入知識圖譜的表示學習模型中,來預測多模態知識圖譜中缺失的三元組。在這個過程中,來自不同模態的信息將共同用于度量一個三元組的合理性。現有的MMKGC方法往往默認MMKG上的模態信息是完整的,或者采用簡單的方法完成缺失模態信息的補全,忽視了實體之間模態信息的不平衡問題,導致模態信息融合不充分以及原始模態信息的低效利用。模態信息的不平衡性主...
2024-03-27 09:52:57 3426瀏覽 0點贊 0回復 0收藏
Sora生成的視頻效果好嗎?確實好。Sora算得上AGI發展歷程上的里程碑嗎?我個人覺得算。我們知道它效果好就行了,有必要知道Sora到底是怎么做的嗎?我覺得最好是每個人能有知情的選擇權,任何想知道的人都能夠知道,這種狀態比較好。那我們知道Sora到底是怎么做出來的嗎?不知道。馬斯克諷刺OpenAI是CloseAI,為示道不同,轉頭就把Grok開源了。且不論Grok效果是否足夠好,馬斯克此舉是否有表演成分,能開源出來這行為就值得稱贊...
2024-03-27 09:38:12 6992瀏覽 0點贊 0回復 1收藏