成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

ChatGPT和Bard太貴,介紹八個免費開源的大模型解決方案!

人工智能
Flan-T5-XXL在以指令形式表述的數據集上微調了T5模型。指令的微調極大地提高了各種模型類別的性能,如PaLM、T5和U-PaLM。Flan-T5-XXL模型在1000多個額外的任務上進行了微調,涵蓋了更多語言。

1.LLaMA

LLaMA項目包含了一組基礎語言模型,其規模從70億到650億個參數不等。這些模型在數以百萬計的token上進行訓練,而且它完全在公開的數據集上進行訓練。結果,LLaMA-13B超過了GPT-3(175B),而LLaMA-65B的表現與Chinchilla-70B和PaLM-540B等最佳模型相似。

圖片

圖片來自LLaMA

資源:

  • 研究論文:“LLaMA: Open and Efficient Foundation Language Models (arxiv.org)” [https://arxiv.org/abs/2302.13971]
  • GitHub:facebookresearch/llama [https://github.com/facebookresearch/llama]
  • 演示:Baize Lora 7B [https://huggingface.co/spaces/project-baize/Baize-7B]

2.Alpaca

斯坦福大學的Alpaca聲稱它可以與ChatGPT競爭,任何人都可以在不到600美元的情況下復制它。Alpaca 7B是在52K指令遵循的示范上從LLaMA 7B模型中進行微調。

訓練內容|圖片來自斯坦福大學CRFM

資源:

  • 博客:斯坦福大學CRFM。[https://crfm.stanford.edu/2023/03/13/alpaca.html]
  • GitHub:tatsu-lab/stanford_alpaca [https://github.com/tatsu-lab/stanford_alpaca]
  • 演示:Alpaca-LoRA (官方演示已經丟失,這是Alpaca模型的再現) [https://huggingface.co/spaces/tloen/alpaca-lora]

3.Vicuna

Vicuna是在從ShareGPT收集到的用戶共享對話上的LLaMA模型基礎上進行微調。Vicuna-13B模型已經達到了OpenAI ChatGPT和Google Bard的90%以上的質量。它還在90%的情況下超過了LLaMA和斯坦福大學Alpaca模型。訓練Vicuna的成本約為300美元。

圖片

圖片來自Vicuna

資源:

  • 博客文章:“Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality” [https://vicuna.lmsys.org/]
  • GitHub:lm-sys/FastChat [https://github.com/lm-sys/FastChat#fine-tuning]
  • 演示:FastChat (lmsys.org) [https://chat.lmsys.org/]

4.OpenChatKit

OpenChatKit:開源的ChatGPT替代方案,是一個用于創建聊天機器人的完整工具包。它提供了用于訓練用戶自己的指令調整的大型語言模型、微調模型、用于更新機器人響應的可擴展檢索系統以及用于過濾問題的機器人審核的指令。

圖片

圖片來自TOGETHER

可以看到,GPT-NeoXT-Chat-Base-20B模型在問答、提取和分類任務上的表現優于基礎模式GPT-NoeX。

資源:

  • 博客文章:“Announcing OpenChatKit”—TOGETHER [https://www.together.xyz/blog/openchatkit]
  • GitHub: togethercomputer/OpenChatKit [https://github.com/togethercomputer/OpenChatKit]
  • 演示:OpenChatKit [https://huggingface.co/spaces/togethercomputer/OpenChatKit]
  • 模型卡:togethercomputer/GPT-NeoXT-Chat-Base-20B [https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-20B]

5.GPT4ALL

GPT4ALL是一個社區驅動的項目,并在一個大規模的輔助交互語料庫上進行訓練,包括代碼、故事、描述和多輪對話。該團隊提供了數據集、模型權重、數據管理過程和訓練代碼以促進開源。此外,他們還發布了模型的量化4位版本,可以在筆記本電腦上運行。甚至可以使用Python客戶端來運行模型推理。

圖片

圖片來自GPT4ALL

資源:

  • 技術報告:GPT4All [https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf]
  • GitHub: nomic-ai/gpt4al [https://github.com/nomic-ai/gpt4all]
  • 演示:GPT4All(非官方)。[https://huggingface.co/spaces/rishiraj/GPT4All]
  • 模型卡:nomic-ai/gpt4all-lora · Hugging Face [https://huggingface.co/nomic-ai/gpt4all-lora]

6.Raven RWKV

Raven RWKV 7B是一個開源的聊天機器人,它由RWKV語言模型驅動,生成的結果與ChatGPT相似。該模型使用RNN,可以在質量和伸縮性方面與transformer相匹配,同時速度更快,節省VRAM。Raven在斯坦福大學Alpaca、code-alpaca和更多的數據集上進行了微調。

圖片

圖片來自Raven RWKV 7B

資源:

  • GitHub:BlinkDL/ChatRWKV [https://github.com/BlinkDL/ChatRWKV]
  • 演示:Raven RWKV 7B [https://huggingface.co/spaces/BlinkDL/Raven-RWKV-7B]
  • 模型卡:BlinkDL/rwkv-4-raven [https://huggingface.co/BlinkDL/rwkv-4-raven]

7.OPT

OPT:Open Pre-trained Transformer語言模型并不像ChatGPT那樣強大,但它在零樣本和少樣本學習以及刻板偏見分析方面表現出卓越的能力。還可以將它與Alpa、Colossal-AI、CTranslate2和FasterTransformer集成以獲得更好的結果。注意:它上榜的原因是它的受歡迎程度,因為它在文本生成類別中每月有624,710次下載。

圖片

圖片來自(arxiv.org)

資源:

  • 研究論文:“OPT: Open Pre-trained Transformer Language Models (arxiv.org)” [https://arxiv.org/abs/2205.01068]
  • GitHub: facebookresearch/metaseq [https://github.com/facebookresearch/metaseq]
  • 演示:A Watermark for LLMs [https://huggingface.co/spaces/tomg-group-umd/lm-watermarking]
  • 模型卡:facebook/opt-1.3b [https://huggingface.co/facebook/opt-1.3b]

8.Flan-T5-XXL

Flan-T5-XXL在以指令形式表述的數據集上微調了T5模型。指令的微調極大地提高了各種模型類別的性能,如PaLM、T5和U-PaLM。Flan-T5-XXL模型在1000多個額外的任務上進行了微調,涵蓋了更多語言。

圖片

圖片來自Flan-T5-XXL

資源:

  • 研究論文:“Scaling Instruction-Fine Tuned Language Models” [https://arxiv.org/pdf/2210.11416.pdf]
  • GitHub: google-research/t5x [https://github.com/google-research/t5x]
  • 演示:Chat Llm Streaming [https://huggingface.co/spaces/olivierdehaene/chat-llm-streaming]
  • 模型卡:google/flan-t5-xxl [https://huggingface.co/google/flan-t5-xxl?text=Q%3A+%28+False+or+not+False+or+False+%29+is%3F+A%3A+Let%27s+think+step+by+step]

總結

現在有很多開源的可供選擇的大模型,本文涉及到其中比較流行的8個大模型。

責任編輯:武曉燕 來源: Python學研大本營
相關推薦

2023-11-08 14:57:41

2022-11-08 16:17:11

2023-09-06 12:11:21

ChatGPT語言模型

2023-12-15 13:07:00

開源網頁截圖

2023-10-16 07:00:04

大數據SASAnalytics

2023-06-02 08:00:00

ChatGPT人工智能

2020-02-11 08:00:00

開源開源工具人力資源

2024-12-06 10:46:03

2023-02-22 14:50:59

技術AI

2023-01-27 15:38:25

ChatGPT人工智能機器人

2019-03-26 19:30:47

開源備份解決方案

2023-05-16 13:07:57

GPT4ALL語言模型

2024-10-22 16:37:57

2023-11-13 10:11:49

開源前端

2023-11-29 10:16:45

內網開源

2011-03-07 14:52:55

Websense數據泄露防護

2023-05-26 16:42:28

2024-06-14 15:21:15

2023-11-05 12:17:01

Go開源

2024-07-12 11:35:20

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国内精品99| 国产伦精品一区二区三区精品视频 | 久久国产亚洲 | 成人国产在线视频 | 国产小视频精品 | 久久成人国产精品 | 国产精品久久久久久久久久久久久久 | 亚洲精品国产a久久久久久 午夜影院网站 | 美女日批免费视频 | 久久久免费 | 亚洲精品一区在线观看 | 免费一级做a爰片久久毛片潮喷 | 国产免费一区 | 亚洲精品永久免费 | 九九综合九九 | 国际精品鲁一鲁一区二区小说 | 亚洲精品一区二区另类图片 | 久久久久久久综合 | 欧美激情免费在线 | 欧美日韩一区在线 | 成人在线一级片 | 久久久www成人免费精品张筱雨 | 久久久久香蕉视频 | 欧美xxxx色视频在线观看免费 | 视频1区 | 欧美日韩亚洲一区 | 四虎av电影 | 国产精品视频一二三区 | 一级看片免费视频 | 欧美精品一区二区三区在线播放 | 成人一级视频在线观看 | 美女天堂| 久久亚洲国产精品日日av夜夜 | 干狠狠| 欧美国产日韩在线观看 | 国产精品久久 | 亚洲3p | 亚洲免费视频一区二区 | 日韩精品免费视频 | 99久久免费精品视频 | 日韩成年人视频在线 |