成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Llama3.2開源:Meta發布1B和3B端側模型、11B和90B多模態模型

發布于 2024-9-27 13:22
瀏覽
0收藏

早上起來發現,Meta AI又開源模型,文本模型開源了端側小模型1B和3B模型,也是首次開源了多模態大模型11B和90B兩個版本;同時還開源了一個 Llama Stack項目。

Blog: https://ai.meta.com/blog/llama-3-2-connect-2024-vision-edge-mobile-devices/
HF: https://huggingface.co/collections/meta-llama/llama-32-66f448ffc8c32f949b04c8cf

其中Llama3.2多模態模型在圖像識別和一系列視覺理解任務方面效果優于Claude 3 Haiku 和 GPT4o-mini。文本模型-Llama3.2-3B模型在循指令、總結、提示重寫和工具使用等任務上優于 Gemma 2 2.6B 和 Phi 3.5-mini 模型。

Llama3.2開源:Meta發布1B和3B端側模型、11B和90B多模態模型-AI.x社區

多模態模型效果

Llama3.2開源:Meta發布1B和3B端側模型、11B和90B多模態模型-AI.x社區

端側模型效果

多模態模型

Llama3.2的11B和90B模型多模態是基于Llama3.1-8B、70B文本模型上,增量增加圖像模型。

pretrain階段:

  • 文本模塊由Llama3.1模型初始化,并初始化圖像編碼器,利用大規模噪聲(圖像、文本、6B數據對)對數據進行預訓練
  • 再用中等規模的高質量的領域、知識增強的(圖像、文本、3M數據對)數據預訓練。

posting-train階段:

  • 通過監督微調、拒絕采樣和直接偏好優化進行多輪對齊
  • 使用 Llama 3.1 模型 過濾和增強 圖像上的問題和答案,利用合成數據生成和獎勵模型對所有候選答案打分排序,獲取高質量的微調數據
  • 還添加了安全數據

端側小模型

1B和3B模型都是基于8B模型裁剪后進行模型初始化,并且利用8B和70B模型進行模型蒸餾,9T數據預訓練。

特別注意,這里蒸餾不是那種通過更大模型進行數據生成的蒸餾,而是再模型訓練階段,利用8B 和 70B 模型輸出的 logits 影響模型loss,也就是傳統的蒸餾方法

Llama3.2開源:Meta發布1B和3B端側模型、11B和90B多模態模型-AI.x社區

在post-traning階段,訓練方式語Llama3.1一致,采樣監督微調、拒絕采樣和直接偏好優化模型。

最后模型支持上下文擴展到 128K 個,同時也針對性優化了模型的多種能力,例如摘要、重寫、指令遵循、語言推理和工具使用。

Llama Stack項目

Github: https://github.com/meta-llama/llama-stack

定義并標準化了將生成式 AI 應用程序推向市場所需的構建模塊,跨越整個開發生命周期:從模型訓練和微調,到評估,再到在生產環境中構建和運行AI Agent。

主要是為了簡化開發人員在不同環境(包括單節點、本地、云和設備上)中使用 Llama 模型的方式,幫助快速實現檢索增強生成、工具使用等能力的快速部署。

本文轉載自 ??NLP工作站??,作者: 劉聰NLP

收藏
回復
舉報
回復
相關推薦
主站蜘蛛池模板: 97视频在线观看免费 | 激情婷婷 | 天堂一区二区三区 | 国产成人精品一区 | 中文字幕精品一区二区三区在线 | 久久久久久久久久久高潮一区二区 | 91精品欧美久久久久久久 | 一区二区在线 | 日韩视频在线免费观看 | 成人在线电影网站 | 国产精品一区在线观看 | 天天操综合网 | 午夜一区 | 国产日产欧产精品精品推荐蛮挑 | 视频一区二区三区在线观看 | 91网在线观看 | 成人精品一区 | 国产精品免费一区二区三区四区 | 国产在线视频网 | 91青娱乐在线 | 手机在线一区二区三区 | 亚洲区一区二 | 国产成人99久久亚洲综合精品 | 一区二区免费看 | 国产一区二区高清在线 | 好姑娘影视在线观看高清 | 国产精品伦理一区二区三区 | 久久免费视频观看 | 国产最好的av国产大片 | 欧美日韩亚洲视频 | 岛国在线免费观看 | 日韩精品一区二区三区四区视频 | 天堂免费看片 | 欧美日韩18 | 黄网站色大毛片 | 精品1区2区 | 精品国产一区二区三区在线观看 | 在线看h| 国产福利在线 | 亚洲欧美日韩国产 | 亚洲自拍偷拍视频 |