成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Mixtral:數據流中的生成式稀疏專家混合模型

譯文
人工智能
本文探索如何通過Mistral AI公司的開放模型使用新型 GenAI LLM 與數據流管道構建實時 LLM 管道。該模型可以由輕量級無服務器REST API或Transformer庫運行。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

Cloudera公司數據流首席工程師Tim Spann 表示,Mixtral-8x7B大型語言模型(LLM)是一個預先訓練的生成式稀疏專家混合模型。

他表示,這個模型很有趣,也很容易理解。在適當的提示下,它似乎表現很好。而通過用例,他并不確定Mixtral-8x7B是否比Google Gemma、Meta LLAMA2或OLLAMA Mistral更好。

Spann撰寫的文章將展示如何使用Mixtral LLM,只需要幾個步驟就可以針對文本輸入運行Mixtral LLM。

該模型可以由輕量級無服務器REST API或Transformer庫運行。也可以使用GitHub存儲庫,其場景最多可以有32000個令牌。開發人員還可以輸入英語、意大利語、德語、西班牙語和法語的提示。關于如何利用這一模型有很多選項,而本文將展示如何利用Apache NiFi系統構建實時LLM管道。

開發人員需要決定的一個關鍵問題是將使用什么樣的輸入(聊天、代碼生成、問答、文檔分析、摘要等)。一旦決定輸入,需要創建一些提示,并且進行調整。文中將提供一些指導,幫助提高快速構建技能。Spann在其演練教程中介紹一些基本的提示工程。

構建最佳提示的指南

提示符的構建對于使其正常工作非常關鍵,因此使用Apache NiFi系統構建提示符。

流程概述

步驟1:創建并格式化提示符

在構建應用程序時,以下是將要使用的基本提示模板。

提示模板

{ 
"inputs": 
"<s>[INST]Write a detailed complete response that appropriately 
answers the request.[/INST]
[INST]Use this information to enhance your answer: 
${context:trim():replaceAll('"',''):replaceAll('\n', '')}[/INST] 
User: ${inputs:trim():replaceAll('"',''):replaceAll('\n', '')}</s>" 
}

復制

將在ReplaceText處理器的替換值字段中輸入這個提示符。

步驟2:構建對HuggingFace REST API的調用,根據模型進行分類

在數據流中添加一個InvokeHTTP處理器,將HTTP URL設置為Mixtral API URL。

步驟3:查詢轉換和清理結果

使用QueryRecord處理器來清理和轉換抓取generated_text字段的HuggingFace結果。

步驟4:添加元數據字段

使用UpdateRecord處理器來添加元數據字段、JSON讀取器和寫入器,以及文字值替換值策略(Literal Value Replacement Value Strategy)。而正在添加的字段是添加屬性。

發送到Kafka和Slack的概述。

步驟5:將元數據添加到數據流

使用UpdateAttribute處理器來添加正確的“application/json Content Type”,并將模型類型設置為Mixtral。

步驟6:將清理后的記錄發送到Kafka Topic

將它發送到本地Kafka代理(可能是Docker或其他)和flank-mixtral8x7B主題。如果不存在,NiFi和Kafka會自動創建一個。

步驟7:重新嘗試發送

如果出現問題,將嘗試重新發送三次,然后中止。

將數據推送到Slack的概述。

步驟8:將相同的數據發送到Slack供用戶回復

第一步是拆分為單個記錄,每次發送一個記錄。為此使用SplitRecord處理器。

和以前一樣,重用JSON樹讀取器和JSON記錄集編寫器。像往常一樣,選擇“1”作為“每次拆分的記錄”。

步驟9:使生成的文本可用于消息傳遞

使用EvaluateJsonPath從Mixtral (on HuggingFace)提取生成的文本。

步驟10:將回復發送到Slack

使用PublishSlack處理器,這是Apache NiFi 2.0的新功能。這需要設定頻道名稱或頻道ID。選擇使用“Message Text”屬性的發布策略。對于消息文本,使用下面的Slack Response模板。

對于用戶的最終回復需要一個 Slack 響應模板,該模板的格式應符合需要的溝通方式。以下是一個具有基本功能的示例。

Slack響應模板
===============================================================================================================
HuggingFace ${modelinformation} Results on ${date}:
Question: ${inputs}
Answer:
${generated_text}
=========================================== Data for nerds ====
HF URL: ${invokehttp.request.url}
TXID: ${invokehttp.tx.id}
== Slack Message Meta Data ==
ID: ${messageid} Name: ${messagerealname} [${messageusername}]
Time Zone: ${messageusertz}
== HF ${modelinformation}  Meta Data ==
Compute Characters/Time/Type: ${x-compute-characters} / ${x-compute-time}/${x-compute-type}
Generated/Prompt Tokens/Time per Token: ${x-generated-tokens} / ${x-prompt-tokens} : ${x-time-per-token}
Inference Time: ${x-inference-time}  // Queue Time: ${x-queue-time}
Request ID/SHA: ${x-request-id} / ${x-sha}
Validation/Total Time: ${x-validation-time} / ${x-total-time}
===============================================================================================================

運行這一程序時,它將看起來像Slack中的下圖。

現在已經向 Hugging Face 發送了提示,讓它針對 Mixtral 運行,將結果發送到 Kafka,并通過 Slack 回復用戶。

現在已經用零代碼完成了完整的Mixtral應用程序。

結論

現在,已經使用Apache NiFi、HuggingFace和Slack構建了一個完整的往返程序,以使用新的Mixtral模型構建聊天機器人。

學習摘要

  • 學會了如何為HuggingFace Mixtral建立一個提示
  • 學習如何清理數據流
  • 構建一個可以重用的HuggingFace REST調用
  • 處理HuggingFace模型調用結果
  • 發送第一條 Kafka 消息
  • 格式化和構建Slack調用
  • 為生成式人工智能構建一個完整的數據流

如果需要使用新的Apache NiFi 2.0的其他教程,可以查看:

以下是有關構建Slack機器人的更多信息:

Tim Spann正在編寫Apache NiFi 2和生成式人工智能教程。

以下是他提供的一些資源:

Mixtral of Experts

Mixture of Experts Explained 

mistralai/Mixtral-8x7B-v0.1 

Mixtral Overview 

Invoke the Mixtral 8x7B model on Amazon Bedrock for text generation 

Running Mixtral 8x7b on M1 16GB

Mixtral-8x7B: Understanding and Running the Sparse Mixture of Experts by Mistral AI

Retro-Engineering a Database Schema: Mistral Models vs. GPT4, LLama2, and Bard (Episode 3) 

Comparison of Models: Quality, Performance & Price Analysis 

A Beginner’s Guide to Fine-Tuning Mixtral Instruct Model 

原文標題:Mixtral: Generative Sparse Mixture of Experts in DataFlows,作者:Tim Spann

鏈接:https://dzone.com/articles/mixtral-generative-sparse-mixture-of-experts-in-da。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://m.ekrvqnd.cn/aigc/

責任編輯:姜華 來源: 51CTO內容精選
相關推薦

2020-02-06 19:12:36

Java函數式編程編程語言

2012-07-30 08:31:08

Storm數據流

2023-08-04 13:35:00

DeepMind模型

2011-04-14 14:43:38

SSISTransformat

2024-01-10 16:01:28

2011-12-14 15:57:13

javanio

2009-07-15 09:06:11

Linux圖形系統X11的CS架構

2011-04-19 09:18:02

SSIS數據轉換

2023-02-16 08:00:00

數據流客戶端開發數據集

2023-08-31 16:47:05

反應式編程數據流

2021-06-29 19:24:42

數據流數據排序

2016-11-14 19:01:36

數據流聊天系統web

2024-11-13 14:37:30

2022-03-18 08:57:17

前端數據流選型

2009-08-19 10:41:12

Java輸入數據流

2017-11-16 19:26:34

海量數據算法計算機

2021-10-27 10:43:36

數據流中位數偶數

2023-04-18 23:33:46

分類模型辨別式模型生成式模型

2019-12-19 14:38:08

Flink SQL數據流Join

2023-07-13 12:54:42

GPT-4OpenAI
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲自拍偷拍视频 | 国产综合网站 | 在线视频91 | 国产精品久久久久一区二区三区 | 国产精品日韩 | 国产不卡一区 | 91视频在线观看 | 日韩精品二区 | 色播视频在线观看 | 麻豆精品国产91久久久久久 | 网站黄色av | 99精品欧美一区二区三区 | 日本高清精品 | 亚洲a级 | 久久久国产一区二区三区 | 一二三四在线视频观看社区 | 欧美极品一区二区 | 久久久久久国产精品久久 | 人人看人人搞 | 国产精品亚洲一区二区三区在线 | 久久精品国产一区 | 亚洲视频在线一区 | 国产精品国产精品国产专区不卡 | 成人在线中文字幕 | 97久久国产 | 理论片87福利理论电影 | 在线激情视频 | 亚洲一区二区三区桃乃木香奈 | 亚洲 欧美 另类 综合 偷拍 | 狠狠操你 | 国产一级在线观看 | 成人在线精品视频 | 夜夜操天天操 | 好姑娘高清在线观看电影 | 少妇特黄a一区二区三区88av | 亚洲精品一二三 | 欧美日韩久久 | 动漫www.被爆羞羞av44 | 日本a视频 | 午夜网 | 日韩精品免费 |