成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

解說梅西球賽、英雄聯盟,OpenAI GPT-4視覺API被開發者玩出新花樣

人工智能 新聞
GPT-4V 是 OpenAI 前段時間發布的一個多模態大模型,既能像原版的 ChatGPT 一樣通過文字聊天,也能讀懂用戶在聊天中給到的圖像。

文章開始,我們先來看一段球賽解說視頻:

是不是感覺聽起來不太對勁?

你的感覺沒錯,因為這段解說是用 AI 生成的,這個大喊「梅西!梅西!」的聲音居然來自 AI。

這是 X 平臺(原推特)博主 @Gonzalo Espinoza Graham 發布的一段視頻。他表示,在制作過程中,他主要用到了 GPT-4V 和 TTS 兩項技術。

GPT-4V 是 OpenAI 前段時間發布的一個多模態大模型,既能像原版的 ChatGPT 一樣通過文字聊天,也能讀懂用戶在聊天中給到的圖像。更令人興奮的是,在昨天的開發者大會上,OpenAI 宣布,他們已經開放了視覺能力相關的 API——gpt-4-vision-preview。通過這個 API,開發者可以用 OpenAI 最新的 GPT-4 Turbo(視覺版)來開發新應用。

對于這個期待已久的 API,開發者們都躍躍欲試。因此,API 剛開放一天,就有不少開發者曬出了試用結果,這個球賽解說就是其中之一。

圖片

博主表示,為了制作這個解說視頻,他將原視頻的幀分批傳給 gpt-4-vision-preview,然后通過一些簡單的提示(prompt)要求模型生成一段旁白,最后把得到的結果用 TTS(文本轉語音技術)轉成音頻,就可以得到視頻中展示的效果。如果稍加編輯,理論上還能得到更好的結果。按照 OpenAI 目前的定價,制作這個視頻大約要花 30 美元,作者直呼「不便宜」。

相關代碼:https://github.com/ggoonnzzaallo/llm_experiments/blob/main/narrator.ipynb

除了球賽,還有開發者曬出了自己用 OpenAI 視覺 API 解說《英雄聯盟》的 demo,這個 demo 用到的是 LNG 與 T1 的一場比賽視頻,引起了全網 50 多萬網友的圍觀。

圖片

解說效果是這樣的:

不過,這類視頻具體要怎么做呢?好在,除了這些成品效果,部分開發者還曬出了自己總結的教程,以及每個步驟中涉及的具體工具。

從 X 平臺用戶 @小互曬出的內容來開,整個實現過程可以分為 7 步:

  • 提取視頻幀;
  • 構建描述提示;
  • 發送 GPT 請求;
  • 制作語音解說提示;
  • 生成語音解說腳本;
  • 將腳本轉換為音頻;
  • 將音頻與視頻結合。

具體內容請參見以下教程:

圖片

不過,有人在評論區提出疑問:解說的這些比賽都是以前的,實時的比賽能解說嗎?

圖片

能否解說實時的比賽我們現在還看不出來,不過,確實有開發者曬出了用 OpenAI 視覺 API 實時解讀攝像頭內容的 demo:

圖片

項目鏈接:https://github.com/bdekraker/WebcamGPT-Vision

做了類似實驗的開發者評價說,OpenAI 視覺 API 的識別速度很快、準確性也很高。

圖片

甚至有人直接把它當實時繪圖工具來用,把手里的草圖實時轉換為此前調用專業繪圖工具才能繪制的圖表:

圖片

不過,這個實時效果的實驗會受到 OpenAI 設置的速率限制。

圖片

可以說,OpenAI 正通過 GPT-4V 以及剛剛開放的視覺 API 讓全世界看到多模態的力量,以上效果只是冰山一角。

其實,無論是在現實生活中,還是在研究領域,一個能讀懂圖像、視頻的 AI 都有廣泛的用途。

在生活中,它能用于構建更加智能的機器人,讓機器人實時分析眼前的情景,隨機應變,這也是當前大火的具身智能所研究的問題。

國內創業公司開發的具身智能機器人(參見《獨家 | 達摩院后的下一站:陳俊波推出具身智能大模型,要給所有機器人做一顆腦袋》)

此外,它還能用于改善視障群體的生活質量,幫助他們解讀視頻畫面和生活場景。其實,在字節跳動去年舉辦的一個幫助視障群體的公益比賽中,我們就能看到不少類似的創意,只是當時多模態技術還不夠成熟(參見《穿顏色成對的襪子,追最新的?。哼@群 coder 正幫視障者移走身上的大山》)。

在微軟最近的一篇論文中,研究者也展示了他們在這方面取得的進展,比如用 GPT-4V 解讀《憨豆先生》劇情。

這種優秀的視頻解讀能力能夠幫助研究人員更好地理解視頻,從而把廣泛存在的視頻轉化為新的訓練數據,訓練出更聰明的 AI,形成一個閉環。

看來,一個更智能的世界正在加速到來。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-05-09 08:01:23

countdistinctMySQL

2012-11-20 16:23:19

飛輪UPS數據中心電源

2010-09-01 13:47:42

釣魚網站

2025-03-04 07:53:40

2021-01-04 11:14:09

品牌營銷UGC

2017-05-22 15:50:38

ICT華為生態之行

2017-02-27 21:37:49

2024-06-11 09:52:39

2023-11-08 08:15:29

2023-08-23 07:37:50

Windows 11微軟

2013-10-22 09:37:14

網絡配置管理網絡性能監控

2019-07-23 11:20:16

2023-07-07 09:32:57

GPT-4OpenAI

2020-04-29 10:16:51

Zoom網絡攻擊網絡釣魚

2017-05-09 15:53:43

VR創新AR

2013-01-22 11:22:02

聯想Yoga
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲一区国产 | 久久com| 欧美成人二区 | 国产日韩一区二区 | 色视频在线免费观看 | 99精品国产一区二区三区 | 亚洲欧美一区二区三区国产精品 | 久久看精品 | 国产精品久久久久久婷婷天堂 | 神马影院一区二区三区 | 成人亚洲一区 | 亚洲精品美女视频 | h漫在线观看| 日韩高清中文字幕 | 日韩在线 | 亚洲欧美日韩系列 | 久久视频免费看 | 日韩影音 | 久久免费福利 | 欧美一级大片免费看 | 亚洲一区二区免费电影 | 天堂色区 | 国产中文字幕在线观看 | 久久美国| 九九av| 亚洲精品一区二区三区中文字幕 | 国产精品视频在线播放 | 日韩在线一区二区 | 精品一区二区三区91 | 国产成人精品一区二区三区四区 | 国产精品一区在线观看 | 日韩在线一区二区三区 | a级毛片毛片免费观看久潮喷 | 免费99视频 | 天天天操天天天干 | 亚洲啊v在线 | 国产精品久久久久久久久图文区 | 精品国产伦一区二区三区观看说明 | 国产精品一区一区三区 | 91精品在线播放 | 欧美一区二区在线 |