成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

古早費曼論文手寫公式也能轉LaTeX,還能看懂梗圖,馬斯克Grok新功能上線就火了

人工智能 新聞
馬斯克旗下的人工智能公司 xAI 發布的 Grok 大模型有助于實現這一目標 —— 在經歷了最近的一次更新后,Grok 大模型終于能看懂圖像了,甚至還能做公式 OCR、解釋笑話。

設想一下,如果我們能夠將所有 LaTeX 時代之前的文本資料輸入到先進的大型語言模型(LLM)中,并從中獲得格式規范的 LaTeX 文檔庫,這無疑將極大地推動科學文獻的數字化進程和標準化工作。對于科研工作者而言,這不僅僅是技術層面的飛躍,它更標志著知識管理和信息傳播方式的一次重大變革。

馬斯克旗下的人工智能公司 xAI 發布的 Grok 大模型有助于實現這一目標 —— 在經歷了最近的一次更新后,Grok 大模型終于能看懂圖像了,甚至還能做公式 OCR、解釋笑話。

圖片

AI 銷售和營銷自動化平臺 Amplemarket 創始人 Luis Batalha 在試用后表示:借助 Grok,他能把理論物理學家 Feynman 博士論文中的公式轉換成 LaTeX。

圖片

轉化之前的文本長這樣:

圖片

可以看出,里面的公式基本都是手寫的,肉眼辨認尚有難度。而 Grok 可以把它們轉化成如此工整的結果,而且準確率令人驚嘆。

圖片

圖源:https://x.com/luismbat/status/1850925670408544355

這個帖子吸引了眾多研究人員的關注,整個帖子的瀏覽量已經突破 100 萬。

圖片

還有人曬出了自己用 Grok 識別出的 18 世紀文件:  

圖片

在識別其他圖像方面,Grok 表現也非常不錯。比如網友上傳了一張手表的照片,Grok 根據表殼形狀和表帶設計猜出了表的品牌(對手表有研究的讀者可以看下猜得對不對)。

圖片

圖片

你還可以讓 Grok 點評圖片,它能從時尚、風格、表情等多個角度進行描述。比如針對下面這張圖,Grok 回答:「圖片中描述了一位動漫風格的人物,這位人物擁有中等長度的棕色頭發,戴著眼鏡,并且正在彈奏貝斯吉他。該角色展現了一種休閑、現代的造型,穿著一件格子衫外套和深色褲子,以及帶有紅色裝飾的白色運動鞋。這種裝扮表明這是一個年輕的、可能還在上學的角色,給人一種悠閑的藝術氛圍……」

圖片

圖源 https://x.com/ItsZeramy/status/1850810276784054313

馬斯克表示,Grok 其實也可以用來解釋笑話(梗圖)。

圖片

今年三月,Grok-1 正式亮相,在數學、推理等能力上取得了不錯的成績。之后,xAI 迅速推出 Grok 1.5,新一代模型實現了長上下文理解和高級推理能力。8 月,Grok 2 上線,在常識、數學競賽問題 (MATH)、研究生水平科學知識 (GPQA) 等領域與其他前沿模型相媲美。

如今,在 xAI 不斷完善下,大家終于可以體驗 Grok 的圖像理解能力了。為了驗證各路網友的說法,機器之心在第一時間進行了測試。

公式 OCR 能力實測

首先,機器之心測試了一下 Grok 對公式的處理能力。我們輸入經典論文《 Attention Is All You Need 》中的一張公式截圖,要求轉換成 LaTeX 代碼。

圖片

輸入的公式截圖,對應論文中的公式(1)。

圖片

然后,我們將 LaTeX 表達式輸入到在線 LaTeX 公式編輯器中進行轉換,比對之后發現結果完全正確。

圖片

公式來源:https://arxiv.org/pdf/1706.03762

之后,我們上了點難度,用手寫公式進行測試,輸入的公式截圖看起來不是很規范,但 Grok 還是給出了結果。

圖片

圖片

梗圖理解能力實測

接著,我們再看看 Grok 對圖片的理解能力。

不知大家是否 get 到小女孩吃蛋糕這張圖的笑點。如果沒有,當你看完 Grok 的解釋,有種恍然大悟的感覺。

圖片

不過,Grok 并不是總懂幽默。我們輸入如下圖片,圖片原來的意思應該是想表達打工人的一天似乎都很疲憊,但到了深夜卻格外精神。但 Grok 給出的結果并不是。

圖片

經過測試,我們還發現 Grok 對圖片中的中文理解的不是很好,比如錯把中文字符「我的精神狀態」轉換成「敵人的精神狀態」。

圖片

Grok vs. ChatGPT,誰的識圖能力更強?   

雖然識圖是 Grok 的新功能,效果也很驚艷,但在眾多 AI 模型中,這實在算不上一項新穎的功能。因此,有人在馬斯克的評論區發出靈魂拷問,「Grok 到底進展到什么程度了?感覺遠遠落后于 ChatGPT 啊」。對此,馬斯克耐心回復說,「我們只用了幾個月就完成了其他人花了幾年時間的工作。」言下之意似乎是不著急,慢慢打磨新功能。

圖片

還有網友上傳了一張飲料圖片,讓 Grok 和 ChatGPT 進行回答。從上傳的資料來看,圖片內容并不清晰,而且還不是中文,對于不懂外語的小伙伴可能有點難度。但是 Grok 和 ChatGPT 都給出了回答。

Grok 回答:圖片中的飲料是「???(Baekseju)」 ,這是一種傳統的韓國酒精飲料。它是一種用人參和其他草藥浸泡的米酒,以其假定的健康益處而聞名。瓶子上的標簽顯示了 D,這可能是 Baekseju 的某個特定品牌或變種。由于其濃烈的風味和藥用屬性,通常只消費少量。 

ChatGPT 回答:這款飲料是 Bacchus-D,一種在韓國流行的能量飲料。它通常包含咖啡因、牛磺酸和維生素 B2、B6、B12,這些成分被認為可以提升能量水平。在韓國,它常被用作快速提神的飲品。 

熟悉這款飲料的小伙伴,可以點評一下,這兩個模型,哪個回答的更好。

圖片


圖片

圖源:https://x.com/chrisfirsttt/status/1850745853843001418

對于 Grok 沒有理解的梗圖,我們在 ChatGPT 上也做了測試。ChatGPT 的回答明顯更勝一籌,中文識別能力也更強。

圖片


圖片

經過一番測試以及網友給出的示例來看,Grok 在輸出 LaTeX 表達式方面確實不錯,對圖片中出現的主體和場景解釋的非常到位,但對梗圖的解釋時好時壞,有時能完全解釋笑點,有時會解釋錯誤,此外,Grok 對中文字符的識別能力也不是很好。

最后提醒大家一下,Grok 并不是免費的,付費用戶才能體驗。可以使用的小伙伴,可以進行測試了。

圖片

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-07-17 07:05:43

ChatGPTOpenAI

2023-12-13 08:46:33

人工智能ChatGPT機器人

2017-02-22 15:04:52

2024-04-15 12:52:00

AI數據

2012-08-28 10:03:49

E行網

2018-04-03 12:06:02

2018-12-24 08:46:52

Kubernetes對象模型

2024-10-29 12:38:17

ChatGPTGrok圖像

2025-01-03 15:42:59

AI模型數據

2025-06-30 01:00:00

2023-11-10 15:37:32

2024-03-04 08:42:00

馬斯克微軟

2019-11-18 10:38:03

線程池Java框架

2020-02-15 17:16:05

Kubernetes容器

2013-08-26 14:29:12

App搜索指數AppStoreApp有效關鍵詞

2019-10-10 11:10:04

SpringBoot異步編程

2023-08-23 12:58:54

AI繪圖

2024-03-18 14:17:06

大模型開源人工智能

2024-11-01 05:10:00

2013-09-22 10:34:08

碼農機器學習算法
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 雨宫琴音一区二区在线 | 精品福利在线 | 天天av网| 美女视频. | 91av导航| 日日摸夜夜爽人人添av | 精品久久久久久久久久久久久久 | 日韩精品区 | 中文字幕1区| 日韩三级电影一区二区 | 国产一区二区久久 | 久久精品青青大伊人av | 黑人巨大精品欧美一区二区免费 | 99免费精品视频 | 台湾a级理论片在线观看 | 色秀网站| 很黄很污的网站 | 91久久精品国产91久久性色tv | 奇米超碰在线 | 日韩成人免费av | 国产在线a | 97成人免费 | 亚洲综合首页 | 国产自产c区 | www性色| 亚洲国产免费 | 久久曰视频 | 亚洲日本中文 | 福利av在线 | 久久久久亚洲精品 | 欧美一级片在线观看 | 精品一区二区三区四区 | 日韩91| 日韩欧美二区 | 欧美一区二区免费电影 | 欧美日韩国产精品一区二区 | 欧美lesbianxxxxhd视频社区 | 久久久精彩视频 | 九九热这里只有精品在线观看 | 精品免费国产 | 美女三区 |