成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代! 原創(chuàng)

發(fā)布于 2024-10-24 14:02
瀏覽
0收藏

又整新活了!Anthropic 家的大模型都能用電腦了!

在本周二的重磅更新里,我們看到了OpenAI勁敵——Anthropic大招不斷。

全新升級的 Claude 3.5 Sonnet 和新模型 Claude 3.5 Haiku,不僅性能強(qiáng)悍。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude 3.5 Sonnet更是達(dá)到了在編程界橫著走的水平,不僅各項(xiàng)指標(biāo)都干翻了GPT-4o,連o1都不放過!

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Sonnet在SWE基準(zhǔn)驗(yàn)證中的得分高于所有可用模型,竟然包括了OpenAI o1-preview等推理模型和專門的代理系統(tǒng)。 

難怪Claude直接表示,編程這一塊就是我們的統(tǒng)治區(qū)了。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

不過,最神奇的功能還是 Claude 操作電腦的能力了。

Claude 不僅會填寫表格、編寫程序、遇到問題知道查查谷歌,還會很搞笑地偷個懶——關(guān)掉了錄屏按鈕,偷偷瀏覽黃石公園照片放空大腦!這是在演誰上班?

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)

一、AI用電腦,都能做些啥事?

AI Chatbot的對話能力越來越難以滿足我們對AI的期待。

對于行動能力的提升逐漸變成了一個主攻方向。

無論是o1開發(fā)者日演示的AI訂茶歇甜點(diǎn),還是各家AI手機(jī)都在卷的AI助手預(yù)定餐廳、幫買咖啡等等,都體現(xiàn)了這個勢頭。

但 Claude 還能通過用電腦狠狠驚艷我們一把,就是因?yàn)檫@個 Agent 似乎更通用,留下的想象空間也更大。

因?yàn)樗降祝覀冊谵k公室的大多數(shù)工作時間,都是用電腦完成各種不同的任務(wù)而已。因此,Claude的新功能不是簡單的生活助手,而是有著AGI雛形的強(qiáng)大。

雖然 Claude 和計算機(jī)交互的能力才剛剛起步,但我們還是能從一個個小示例里感嘆一句:未來可期!

1.自動填寫表格

填寫表格真的是高頻的工作任務(wù)。

在這個范例里,Claude需要填寫來自Ant Equipment Co.的供應(yīng)商請求表,方法是參考已有的表格或者自行搜索。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

左側(cè)更新了AI的思維鏈情況,Claude發(fā)現(xiàn)在給定的表格中沒有相應(yīng)信息,于是開始調(diào)用搜索。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

在切換到CRM系統(tǒng)中進(jìn)行了搜索之后,Claude順利填好了表格。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)

2.做個日程攻略

在這個示例里,我們的朋友要來舊金山了,我們想讓AI幫我們做一個到金門大橋看日出的攻略,Claude是否能完成細(xì)節(jié)的要求嗎?

我的朋友要來舊金山,我想明天早上和他一起在金門大橋看日出。我們將從太平洋高地出發(fā)。你能幫我們找到一個絕佳的觀賞地點(diǎn),查看一下開車時間和日出時間,然后安排一個日歷活動,讓我們有足夠的時間到達(dá)那里嗎?

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude二話沒說,立即開始通過谷歌搜索,嘗試先找個看日出的最佳地點(diǎn)。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

Claude在旅游攻略里成功找到了方案,然后開始著手時間方面的安排。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

既然要考慮開車能否趕得及,Claude立馬開始調(diào)用地圖應(yīng)用,來判斷需要為交通預(yù)留的時間。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

還很聰明地查看了當(dāng)日的日出時間,并且把出發(fā)時間安排在我們的日程表里,真的是執(zhí)行力拉滿。

3.Claude 學(xué)習(xí)電腦之路才剛剛起步

不過,雖然示例看起來很美好,但目前還是留有很多的bug。

首先,Claude執(zhí)行任務(wù)的準(zhǔn)確率不夠,例如編程到一半去看圖了等等,千奇百怪的開小差行為。

其次,Claude學(xué)習(xí)電腦使用的道路還有很長,目前也就掌握了點(diǎn)擊,連滾動、縮放、拖拽這樣小學(xué)計算機(jī)第一課的內(nèi)容,AI還存在一些操作障礙。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

最后,Claude的速度還比較慢,而且AI用著電腦的時候,你就得停下來手頭的任務(wù)等著,沒法和它并行工作。

也因此,小紅書AI博主@AI Dance評價說,Anthropic變得雞賊了……也開始和OpenAI一樣給大家發(fā)期貨了。

Claude 3.5超預(yù)期炸場!編程能力超o1,像人類一樣操作電腦,開啟Agent新時代!-AI.x社區(qū)圖片

不過,Claude將其功能在API上提前上線了。

畢竟,作為AI用戶,大家嘗鮮的時候都不會太苛刻。抓到Claude在編程時偷偷摸魚,和AI花費(fèi)幾個小時填完一份表格都同樣有趣。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
主站蜘蛛池模板: 亚洲精品久久久久久宅男 | 精品视频在线播放 | 337p日本欧洲亚洲大胆 | 国产农村一级片 | 一级黄色毛片 | 欧美视频中文字幕 | 亚洲二区视频 | 黄网免费看 | 爱高潮www亚洲精品 中文字幕免费视频 | 亚洲欧美在线视频 | 人人精品| 久久a久久 | 中文字幕亚洲免费 | 噜久寡妇噜噜久久寡妇 | 色噜噜狠狠色综合中国 | 久久视频精品 | 欧美日本一区二区 | 日本精品视频在线观看 | 国产美女在线精品免费 | 免费在线观看av的网站 | 国产精品久久久久久亚洲调教 | 国产一级免费视频 | 国产精品久久久久久一区二区三区 | 亚洲小视频在线播放 | 久久久久久成人 | 国产精品嫩草影院精东 | 热99在线 | 亚洲字幕在线观看 | 欧美日韩国产高清视频 | 国产欧美日韩一区 | 暖暖日本在线视频 | 日韩在线免费视频 | 天天综合成人网 | 日韩一区精品 | 精品成人av| 精品久久久网站 | 日韩一区二区在线视频 | 粉嫩国产精品一区二区在线观看 | 91精品国产91久久久久久 | 亚洲码欧美码一区二区三区 | 黄色免费在线观看网站 |