成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

AI 大模型的語言不平等:英語最便宜,其它語言要貴得多

人工智能
詞元化模型(即人工智能公司將用戶輸入轉換為計算成本的方式)意味著,除了英語之外的其他語言使用和訓練模型要貴得多。這是因為像中文這樣的語言有著不同、更復雜的結構(無論是從語法還是字符數量上),導致它們需要更高的詞元化率。

7 月 31 日消息,用戶所使用的語言對于大型語言模型(LLM)的費用有很大的影響,可能造成英語使用者和其它語言使用者之間的人工智能鴻溝。最近的一項研究顯示,由于 OpenAI 等服務所采用的的服務器成本衡量和計費的方式,英語輸入和輸出的費用要比其他語言低得多,其中簡體中文的費用大約是英語的兩倍,西班牙語是英語的 1.5 倍,而緬甸的撣語則是英語的 15 倍。

IT之家注意到,推特用戶 Dylan Patel(@dlan522p)分享了一張照片,展示了牛津大學進行的一項研究,該研究發現,讓一個 LLM 處理一句緬甸語句子需要 198 個詞元(tokens),而同樣的句子用英語寫只需要 17 個詞元。詞元代表了通過 API(如 OpenAI 的 ChatGPT 或 Anthropic 的 Claude 2)訪問 LLM 所需的計算力成本,這意味著緬甸語句子使用這種服務的成本比英語句子高出 11 倍。

詞元化模型(即人工智能公司將用戶輸入轉換為計算成本的方式)意味著,除了英語之外的其他語言使用和訓練模型要貴得多。這是因為像中文這樣的語言有著不同、更復雜的結構(無論是從語法還是字符數量上),導致它們需要更高的詞元化率。例如,根據 OpenAI 的 GPT3 分詞器 ,“你的愛意(your affection)”的詞元,在英語中只需要兩個詞元,但在簡體中文中需要八個詞元。盡管簡體中文文本只有 4 個字符(你的愛意),而英文有 14 個字符。

責任編輯:姜華 來源: IT之家
相關推薦

2009-03-25 08:38:56

IE8瀏覽器微軟

2022-04-25 13:20:04

區塊鏈藝術去中心

2022-09-01 21:38:30

加密貨幣區塊鏈金融

2018-06-08 16:28:23

2025-04-22 08:08:37

2022-06-27 10:05:00

微軟人工智能面部識別

2023-05-10 15:49:10

NLP語言模型

2020-10-20 09:45:28

Facebook AI翻譯

2018-03-13 09:34:30

人工智能編程語言Python

2017-02-27 11:53:12

AI學習

2024-03-19 13:12:36

自動駕駛模型

2024-06-06 09:47:56

2023-09-03 16:20:30

2023-03-30 19:17:54

語言編程

2024-01-12 10:29:26

2022-03-16 16:07:05

區塊鏈技術工具

2013-08-23 13:35:30

編程語言程序員

2025-05-30 05:00:00

AI模型數據訓練

2022-05-27 13:45:38

區塊鏈數字鴻溝安全
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 91在线区 | 一区二区三区成人 | 日韩精品成人在线 | 韩日有码| 亚洲国产片 | 国产高清在线 | 久久国产免费 | 男女免费网站 | 久久精品 | 蜜臀久久99精品久久久久野外 | 欧美日韩国产一区二区三区不卡 | 中文字幕伊人 | 成人亚洲视频 | 亚洲欧美精品在线 | 亚洲在线视频 | julia中文字幕久久一区二区 | 国产精品区二区三区日本 | 欧美vide | 欧美精品久久久 | 久久久91 | 精品一区二区三区免费视频 | 欧美综合一区二区 | 国产成人一区二区三区 | 7799精品视频天天看 | 久久亚洲精品国产精品紫薇 | 亚洲欧美日韩国产 | 亚洲一区 | 国产婷婷色综合av蜜臀av | 国内精品久久久久 | 99re视频| 日韩在线h | 日韩一区二区三区在线看 | 亚洲传媒在线 | 欧美aaa一级片 | 精品国产一区二区三区久久 | 中文字幕日韩一区 | 91精品国产91久久久久久丝袜 | 在线a视频 | 亚洲不卡视频 | 午夜极品| 97久久精品午夜一区二区 |