成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

如何僅需幾個步驟在您的設備上運行Alpaca-LoRA?

譯文
人工智能
本文介紹了類似ChatGPT的平臺Alpaca-LoRA以及如何在您的設備上運行它。

譯者 | 布加迪

審校 | 重樓

ChatGPT是一種人工智能(AI)語言模型,近幾個月備受關注。它有兩個流行的版本GPT-3.5GPT-4。GPT-4GPT-3.5的升級版,生成的答案更準確。但是ChatGPT存在的主要問題是它不是開源的,也就是說,不允許用戶查看和修改其源代碼。這導致許多問題,比如定制、隱私和AI民主化。

我們需要這樣一種AI聊天機器人可以像ChatGPT一樣工作,但又是免費開源的,而且消耗的CPU資源更少。本文介紹的Alpaca LoRA就是這樣一種AI模型??赐瓯疚暮?,就比較了解,而且可以使用Python在本地機器上運行它。下面不妨先討論一下什么是Alpaca AoRA

Alpaca LoRA的定義

Alpaca是由斯坦福大學的研究小組開發的一種AI語言模型。它使用Meta的大規模語言模型LLaMA。它使用OpenAIGPTtext- davincii -003來微調擁有70億個參數的LLaMA模型。它可供學術和研究界免費使用計算資源的要求很低。

該團隊從LLaMA 7B模型入手,用1萬億token對其進行預訓練。他們從175個由人工編寫的指令輸出對開始,ChatGPTAPI使用這些指令輸出對生成更多對。他們收集了52000個樣本對話,用來進一步微調LLaMA模型。

LLaMA模型有幾個版本,即70億個參數、130億個參數、300億個參數650億個參數。Alpaca可擴展到70億個參數、130億個參數300億個參數650億個參數的模型。

1 Aplaca 7B架構

Alpaca- LoRAStanford Alpaca的小耗電量更少,可以在Raspberry Pie等低端設備上運行。Alpaca-LoRA使用低秩自適應LoRA)來大型模型的訓練,同時消耗更少的內存。

Alpaca LoRA的Python實現

我們將創建一個Python環境在本地機器上運行Alpaca-Lora。需要一個GPU來運行這個模型。它無法CPU上運行或者輸出很緩慢)。如果您使用70億個參數模型,需要至少12GB的內存。如果使用130億參數或300億參數模型,需要更高的內存。

如果您沒有GPU,可以在Google Colab中執行相同的步驟。文末附上了Colab鏈接。

我們將遵循Alpaca-LoRA的這個GitHub代碼存儲。

1. 創建虛擬環境

我們將在虛擬環境中安裝所有庫。這一步不是強制性的,而是推薦。以下命令適用于Windows操作系統。(這一步對于Google Colab來說并非必需)。

創建venv的命令:
$ py -m venv
激活它的命令:
$ .\venv\Scripts\activate
禁用它的命令:
$ deactivate

2. 克隆GitHub代碼存儲庫

現在,我們將克隆Alpaca LoRA的代碼存儲庫。

$ git clone https://github.com/tloen/alpaca-lora.git
$ cd .\alpaca-lora\
安裝庫:
$ PIP install -r .\requirements.txt

3.訓練

名為finettune.py的python文件含LLaMA模型的超參數,比如批處理大小、輪次數量和學習率LR,您可以調整這些參數。運行finetune.py不是必須的。否則,執行器文件從tloen/alpaca-lora-7b讀取基礎模型和權重。

$ python finetune.py \
 --base_model 'decapoda-research/llama-7b-hf' \
 --data_path 'yahma/alpaca-cleaned' \
 --output_dir './lora-alpaca' \
 --batch_size 128 \
 --micro_batch_size 4 \
 --num_epochs 3 \
 --learning_rate 1e-4 \
 --cutoff_len 512 \
 --val_set_size 2000 \
 --lora_r 8 \
 --lora_alpha 16 \
 --lora_dropout 0.05 \
 --lora_target_modules '[q_proj,v_proj]' \
 --train_on_inputs \
 --group_by_length

4. 運行模型

名為generate.py的python文件將從tloen/alpaca-lora-7b讀取Hugging Face模型和LoRA權重。它使用Gradio運行用戶界面,用戶可以在文本框中寫問題,并在單獨的文本框中接收輸出。

注意:如果您Google Colab中進行處理,請在generate.py文件的launch()函數中標記share=True。它將在公共URL上運行界面。否則,它將在localhost http://0.0.0.0:7860上運行。

$ python generate.py --load_8bit --base_model 'decapoda-research/llama-7b-hf' --lora_weights 'tloen/alpaca-lora-7b'

輸出

它有兩個URL,一個是公共的,另一個在本地主機上運行。如果您使用Google Colab,公共鏈接可以訪問。

5. Docker化應用程序

如果想要將應用程序導出到某個地方或面臨一些依賴問題,可以在Docker容器中Docker化應用程序Docker是一個創建應用程序不可變映像的工具。然后可以共享該映像,將其轉換回應用程序,該應用程序可在容器中運行,擁有所有必要的庫、工具、代碼和運行時環境您可以從這里下載Docker for Windows:https://docs.docker.com/desktop/install/windows-install/。

注意如果您使用Google Colab,可以跳過此步驟。

構建容器映像:

$ docker build -t alpaca-lora

運行容器:

$ docker run --gpus=all --shm-size 64g -p 7860:7860 -v ${HOME}/.cache:/root/.cache --rm alpaca-lora generate.py \
 --load_8bit \
 --base_model 'decapoda-research/llama-7b-hf' \
 --lora_weights 'tloen/alpaca-lora-7b'

它將在https://localhost:7860上運行您的應用程序。

Alpaca-LoRA用戶界面

現在,我們已讓Alpaca-LoRA運行起來。接下來,我們將探討它的一些特點,讓它為我們編寫些東西。

圖2. Alpaca-LoRA用戶界面

提供了類似ChatGPT的UI,我們可以在其中提出問題,它會相應地回答問題。它還接受其他參數,比如溫度、Top p、Top k、Beams和Max Tokens。基本上,這些是在評估時使用的生成配置。

有一個復選框Stream Output。如果勾選該復選框,聊天機器人將每次回復一個token(即逐行寫入輸出,類似ChatGPT,如果不勾選該選項,它將一次寫入。

不妨向它提一些問題。

問題1:寫一段Python代碼,求一個數的階乘。

輸出

圖3. 輸出-1

問題2:將“KDnuggets is a leading site on Data Science, Machine Learning, AI and Analytics.翻譯成法語。

輸出

圖4. 輸出-2

與ChatGPT不同,它也有一些限制。它可能無法為您提供最新的信息,因為它沒有聯網。此外,它可能會向社會弱勢群體傳播仇恨和錯誤信息。盡管如此,它仍是一款出色的免費開源工具,計算需求較低。對研究人員和學者開展道德AI和網絡安全活動大有助益

谷歌Colab鏈接

https://colab.research.google.com/drive/1t3oXBoRYKzeRUkCBaNlN5u3xFvhJNVVM?usp=sharing

原文標題:Learn How to Run Alpaca-LoRA on Your Device in Just a Few Steps,作者:Aryan Garg

責任編輯:華軒 來源: 51CTO
相關推薦

2023-06-01 08:18:47

GPT大語言模型

2017-03-09 10:07:04

Ubuntu系統技巧

2022-09-13 08:40:24

AndroidLinux

2023-01-12 08:07:03

Python代碼版權

2017-03-20 14:30:47

香港服務器租用

2025-03-11 08:37:42

2009-09-02 15:37:26

Windows 7Windows XP操作系統

2014-02-13 16:39:00

楊元慶摩托羅拉移動

2023-04-19 11:42:46

2021-09-27 07:57:15

MEAT安全工具安全取證

2021-01-25 08:00:00

Linux系統數據

2015-10-14 10:02:33

ClojureScri Android

2023-01-26 11:56:31

Kubernete虛擬機k3s

2016-02-16 09:36:37

CrossOverLinuxWindows

2022-06-30 13:54:16

BottlesLinuxWindows

2025-04-30 08:30:48

2025-02-11 10:48:08

2025-04-01 08:15:00

漏洞安全報告企業安全

2020-12-02 09:49:07

WiFi

2020-06-04 11:15:14

物聯網LoRa傳感器
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人三级影院 | 亚洲精品永久免费 | 亚洲综合首页 | 青青草视频免费观看 | 精品区一区二区 | 老司机67194精品线观看 | 台湾佬成人网 | 色婷婷久久 | 天天操天天射天天 | 欧美日韩精品一区二区三区四区 | 日韩精品免费在线观看 | 天天综合久久 | 中文字幕亚洲精品 | 国产综合av | 天天爱天天操 | 日韩精品1区2区3区 爱爱综合网 | 日韩在线观看中文字幕 | 亚洲免费在线观看视频 | 日韩精品一区二区三区在线观看 | 精品免费国产一区二区三区 | 欧美一级三级在线观看 | 91精品国产色综合久久不卡蜜臀 | 欧美一级黄色免费看 | 精品视频一区二区 | 日韩色图视频 | 日韩精品在线免费观看 | 国产日产精品一区二区三区四区 | 中文字幕亚洲区一区二 | 中国美女撒尿txxxxx视频 | 成人av免费网站 | 国产在线一区二区 | 国产精品夜间视频香蕉 | av在线一区二区三区 | 精品一二区 | 黄免费观看视频 | 少妇久久久 | www网站在线观看 | 蜜桃黄网 | 欧美日韩在线成人 | 欧美一二三 | av日日操|