ChatGPT「代碼解釋器」正式解禁!30秒圖片變視頻,動嘴做表
家人們,終于來了!
剛剛,ChatGPT「代碼解釋器」測試版正式向所有Plus用戶開放。
圖片
OpenAI的科學家Karpathy對此還宣傳了一波,代碼解釋器測試版相當強大。
它是你的個人數據分析師:可以讀取上傳的文件、執行代碼、生成圖表、統計分析等等。我預計社區將需要一些時間來充分展示其潛力。
圖片
前段時間,GPT4能力下降在網上引起軒然大波,甚至有人只覺得它比GPT3.5強一點點。
而現在,代碼解釋器讓人們再次感覺到,那個熟悉而且強大的GPT-4又回來了!
插件一上線,許多網友紛紛上手實測了一番。
功能解禁
那么,「代碼解釋器」究竟能做什么?
30秒,圖片變視頻
這不,有網友竟用ChatGPT把圖片變成了視頻。這效果簡直比Midjourney、Runway還炸裂。
圖片
這是如何做到的?網友給出了全套教程。
第一步:打開「代碼解釋器模型」。要啟用它,請進入設置 -> 測試版功能 -> 代碼解釋器。
圖片
步驟二:
從下拉菜單中選擇「代碼解釋器」選項。然后,上傳你想做動畫的圖片。
步驟三:
我想展示一家豪華餐廳的一些食物。因此,我要求ChatGPT將這個食物圖片從左到右制作成動畫。通過修改我的GPT提示(見下文),你可以創建你自己的動畫。
具體prompt如下:
圖片
步驟四:
按回車鍵。30秒后,ChatGPT會給你一個視頻的下載鏈接。
圖片
聯合創始人Greg Brockman轉發稱,在不可能記住ffmpeg調用的情況下,用于圖像轉換的代碼解釋器。
圖片
事實證明,「代碼解釋器」確實很牛,現在截個視頻,只需要一句話就能搞定了。
圖片
「有一定內存容量限制,不過處理小文件是沒問題了。剛扔給TA 4秒鐘的gen-2視頻,截取前兩秒,沒問題,迅速搞定。
會自動試驗合適的代碼,如果要編程序也完全可以先扔給ta某一文件提出要求,然后看看ta提供出來的代碼」。
圖片
PDF轉圖片
國內知名互聯網科技博主「寶玉」用「代碼解釋器」實現了把PDF轉成圖片。
圖片
圖片
以往需要將每頁內容合并成一張圖,而現在,一個prompt就搞定了。
圖片
GIF變視頻
圖片變視頻之外,還可以實現GIF變視頻。
網友給ChatGPT的提示為:我上傳一個GIF,你給我一個5s的MP4,用一個故事性鏡頭緩慢放大。
圖片
上傳GIF
圖片
最后ChatGPT立即生成了視頻
圖片
此外,ChatGPT還能做個「矩陣」GIF出來。
圖片
圖片
生成QR碼
在前兩天,OpenAI宣布ChatGPT「代碼解釋器」即將全面開放。
就展示了一個能夠生成QR碼的例子,短短一句話,簡直動嘴就能完成任務。
「口袋」數據分析師
代碼解釋器最大的用例就是進行數據分析。
比如,讓它分析各國預期壽命數據,世界上最大的城市,(可上傳CSV、word、PDF或視頻文件)
圖片
然后,與數據交談,問任何你可能想問的問題。
或要求從數據中提取獨特的隨機趨勢,以獲得驚喜。
比如,從兩個數據中找出獨特的趨勢,并以表格的形式顯示出來。
圖片
最后一步,可視化。
把數據變成你想要的任何圖表或圖形。最重要的是,只需點擊一下完成。
比如,生成一個散點圖,說明一個國家的人均GDP和其平均預期壽命之間的關系。
圖片
看到這么強大「數據分析師」,網友又開始R.I.P了。
使用指南
「代碼解釋器」怎么用?來自沃頓商學院的一位教授Ethan Mollick專門為此寫了一篇指南。
圖片
首先,Mollick就指出,Code Interpreter這個名字的起法延續了OpenAI給他們自己的產品起爛名兒的悠久傳統。
因為——雖說它叫「代碼解釋器」,但實際上它對那些根本不懂編程的人最有用。
本質上,「代碼解釋器」能讓GPT-4上傳和下載信息,并為用戶編寫和執行程序,這使得AI能夠做到以前無法做的各種事情。
具體來說,它為AI提供了一個解決問題的通用工具箱(通過用Python編寫代碼)、超大內存(最大100MB,可以是壓縮形式),且用戶可以把這個工具箱集成到AI里面,發揮LLM的優勢。
這有助于解決以前版本的 ChatGPT 存在的許多問題。比方說,
它允許AI處理數學(哪怕很復雜),還能更準確地處理單詞(例如實際計算段落中的單詞),底層原因就是,它可以編寫Python代碼來解決LLM在數學和語言方面的天然弱點。
比如像下圖這樣。
圖片
可以看到,「代碼解釋器」能準確計算出段落中單詞的數量。
此外,「代碼解釋器」降低了幻覺和瞎編亂造的發生機率。
當人工智能直接使用Python時,代碼有助于讓它「誠實」。道理也很簡單,如果代碼不正確,Python就會報錯。由于代碼操作的是數據,因此AI不會在數據中插入錯誤信息。
當然,這并不完美。AI仍然有概率會產生幻覺,但其實這并不常見,并且不太可能影響到代碼或者數據本身。
這樣一來,AI就更加靠近通用人工智能了——大量問題可以通過代碼來解決。
而且,GPT-4非常擅長以新穎有趣的方式來決定什么時候用「代碼解釋器」。
Mollick舉了個例子,假如他讓GPT-4向用戶證明地球是圓的,那么就會用上「代碼解釋器」,提供了多個論證,將文本與代碼和圖像結合在一起。
圖片
此前,各個專業需要編程的人都得會點兒寫代碼,但寫完了還得自己調試。就算之前的AI能提供點兒幫助,但是對于沒有Python學習基礎的人來說,還是挺難,得借助AI的力量反復修改代碼。
而現在,有了「代碼解釋器」,AI就能自己糾錯并且Debug了!
接著,Mollick又講了如何用「代碼解釋器」來處理數據,這算是真實戳中大量用戶痛點了。
Mollick表示,「代碼解釋器」的運行水平非常先進,可以自動處理許多復雜的定量分析,并且能夠采用非常復雜的數據方法。
用戶只需點擊加號即可輕松上傳數據,甚至是ZIP文件等壓縮數據。
圖片
同時,在提供數據時,用戶能給個prompt就最好了。然后,AI就可以從上下文里找出數據含義和結構了!
此外,Mollick指出,在使用「代碼解釋器」時,用戶更多的是在和AI進行「對話」,并不需要絞盡腦汁寫一個又嚴謹又凝練的prompt出來。
就像和一個數據分析師聊天一樣,和人怎么交談,就怎么跟「代碼解釋器」溝通。
但是這里有兩個特殊情況,還是需要寫個類似prompt的東西。
一個是AI有時候會不記得自己能干什么,此時就需要一個prompt來給AI點醒。
比如:「你可以制作GIF,請嘗試一下。」
另一種情況是在用戶對結果不滿意的時候,可以通過prompt來讓「代碼解釋器」對結果進行優化。
比如:「請對該結果進行進一步的測試」,或者,「能不能讓這個圖表更好一點」。
圖片
在加載完數據以后,GPT就可以執行數據合并和清理的操作了。具體處理方式相當復雜,但就像上面所提到的一樣,只要把「代碼解釋器」當做一個和你面對面的數據分析師就好了。
同時,Mollick提醒廣大用戶,AI在自我糾錯并改正以后最好還是查一下結果,萬一出錯呢。
圖片
緊接著Mollick實操了一下,他讓「代碼解釋器」搞個預測建模出來,預測超級英雄可能會有什么超能力。
可以看到,「代碼解釋器」構建了一個隨機森林分布器。
圖片
當然,在實操過程中,用戶還是得和GPT「多溝通」。Mollick就不想讓AI用數值數據的方法來估算缺失的數據,Mollick想直接放棄掉沒有的部分。
但他指出,也可以和GPT說,讓它換個別的處理方法。
之后,Mollick給GPT輸入了一個「你可以進行另一個復雜和有趣的分析嗎」的prompt。他表示,「代碼解釋器」選擇的一些分析方法讓他印象深刻。
就像下圖這樣。
「代碼解釋器」巧妙地分析了超級大國的網絡情況。可以看到,方法多樣,而且非常有意思。
圖片
「代碼解釋器」最令人印象深刻的應該就是其推理能力了。Mollick概括為,非常「人性化」。
另外,可視化的交互性水平依然在線,且在不斷提升。用戶可以不斷讓AI來改進或者更改輸出的內容。
Mollick讓AI創建了一個交互式表格,包括6個圖表,其中還有一個是3D的。
為了讓圖表更加美觀,Mollick不斷輸入prompt,調整結果。
最終成果就像下圖右邊這樣。
圖片
十大驚人魔法
網友@GPTDAOCN近日總結了ChatGPT十大令人震驚的用例:
圖片
代碼解釋器的可視化
1. 將GIF轉換為MP4:可以將動態圖片(GIF)轉換為視頻文件(MP4)的功能,使你更方便地分享和使用。
2. 創建各種圖形:你可以利用這個功能來生成各種如柱狀圖、折線圖、餅圖等圖形,直觀地呈現和分析你的數據。
3. 從圖像中提取顏色以創建PNG調色板:這個功能可以從任何一張圖像中提取主要顏色,然后生成一個PNG格式的調色板。
4. 清洗數據以生成深入的可視化:如果你有一些混亂的數據,這個功能可以幫你進行清洗和整理,再將其轉換為清晰的可視化圖形。
5. 將CSV文件轉換為GIF:這個功能可以將CSV(逗號分隔值)文件中的數據以動態的方式展示,生成一張GIF圖。
6. 分析歌單以概括你的音樂品味:你可以利用這個功能來根據你的音樂歌單進行分析,從而概括你的音樂品味。
7. 將你的數據集轉換為一個完全功能的HTML網站:這個功能能將你的數據快速轉換成一個功能齊全的網站,方便你進行展示和分享。
8. 創建可下載的股票數據集:這個功能能幫你創建一份股票數據集,并且這個數據集是可以下載的,方便你進行更深入的分析和研究。
9. 將圖像轉換為文本文件:如果你需要從圖像中提取文字,這個功能可以幫你將圖像中的文字轉換成文本文件。
10. 對未格式化的數據進行詳細分析:對于那些沒有規定格式的原始數據,這個功能能幫你進行深入的分析,以獲取有價值的信息。
其實,代碼解釋器的用例遠不止這些。
網友點評
我正在嘗試ChatGPT代碼解釋器。到目前為止,我只能建議「每個開發者現在就開始研究它」。
Code Interpreter斷了多少人的生路?太多行政每天低效率的處理數據,現在只需要自然語言就可以辦公自動化。