成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

OpenAI詐騙?GPT-4.1正式上線ChatGPT,網友實測卻大呼失望

人工智能
GPT-4.1,在ChatGPT中可用了!現在,它不僅在API中開放,Plus、Pro和Team用戶都可以使用。網友們興奮地展開實測后,紛紛吐槽:OpenAI這是詐騙吧,說好的一百萬超長上下文呢?

就在剛剛,OpenAI官宣:GPT-4.1,今天起直接在ChatGPT中可用。

這個模型擅長編碼任務和遵循指令,是o3和o4-mini的絕佳替代品。

圖片圖片

一個月前,GPT-4.1剛推出的時候,僅通過API向開發者開放。而現在,它在ChatGPT中就直接可用了。

其中,Plus、Pro和Team用戶可以通過模型選擇器中的「更多模型」下拉菜單訪問GPT-4.1。企業版和教育版用戶將在未來幾周內獲得訪問權限。

OpenAI表示,他們還將在ChatGPT中為所有用戶引入GPT-4.1 mini來取代GPT-4o mini。

圖片圖片

由于超長的上下文能力,現在你可以將整段代碼放到GPT-4.1中進行分析。

圖片圖片

GPT-4.1和GPT-4.1 mini都已經通過了OpenAI的最新標準安全評估。

在以下兩項評估中,GPT-4.1均排名前列。

  • not_unsafe:根據OpenAI政策和模型規范,檢查模型是否未產生不安全的輸出。
  • not_overrefuse:檢查模型是否遵循良性請求。

幻覺評估以及指令遵循方面,GPT-4.1也均表現優秀;但在越獄評估方面表現不佳。

圖片圖片

圖片圖片

GPT-4.1,比GPT-4.5還好?

這次放出GPT-4.1,也算響應群眾的呼聲。

早在4月底,就有用戶抱怨說:GPT-4.1簡直是自己最喜歡的OpenAI模型,可惜在ChatGPT中并不能使用。

圖片圖片

他確定地說:使用體驗比GPT-4.5還要好!

圖片圖片

不斷有開發者現身說法,表示:除了GPT-4.1的早期版本Quasar Alpha之外,它也是自己測試過的最好的編碼模型!

不斷有人表示,GPT-4.1,絕對是一個被低估的模型。

圖片圖片

就在上個月,OpenAI專為開發者推出了GPT-4.1系列新模型:GPT-4.1、GPT-4.1 mini和GPT-4.1 nano。

它們均擁有最高100萬Token的超大上下文窗口,在代碼、指令跟隨等核心能力上全面超越GPT-4o及GPT-4o mini,并且知識截止日期也已更新至2024年6月。

圖片圖片

實測:龐大代碼任務順利完成

既然很多ChatGPT用戶都能用上GPT-4.1了,現在全網已經涌出了不少實測。

比如沃頓商學院教授Ethan Mollick,就用一道考遍了各大模型的景點難題來考驗GPT-4.1。

「請創建一段我可以直接粘貼到p5.js中的代碼,它要以驚人的巧思震撼我,仿佛是未來某艘星艦控制面板的呈現。」

GPT-4.1的表現,可是相當優秀。

圖片圖片

另一位開發者實測后發現,GPT-4.1實在令人驚喜!

當時,他正在處理一個代碼量非常龐大的任務,系統自動選擇的模型根本無法處理,完全沒有生成任何內容。

結果讓GPT-4.1上場后,它不僅比默認模型更快,還準確地完成了任務。

甚至,它還給了一個額外的驚喜:竟然還把整個文件中沒用到的代碼都清理掉了。

圖片圖片

通過實測發現,GPT-4.1在代碼生成速度方面達到了新的高度。

比如讓GPT-4.1生成一個博客首頁,在幾秒鐘之內就完成了輸出。

圖片圖片

再比如,讓他用python寫一個地球飛往火星的動畫,幾乎就是在一瞬間,GPT-4.1就完成了任務的輸出。

圖片圖片

結果看起來還行,這只是第一輪交互的結果,能夠感受到GPT-4.1的速度是得到根本性的提升。

圖片圖片

再挑戰一下,讓給GPT-4.1用動畫來解釋一下量子糾纏。

圖片圖片

初步來看,GPT-4.1還是「領會」到了什么是量子糾纏

對于推理問題,GPT-4.1表現的也非常優秀。比如多步驟的年齡計算問題,GPT-4.1的求解邏輯非常嚴謹。

圖片圖片

面對一些逆向思考、腦筋急轉彎之類的問題,GPT-4.1也能快速完成推理,當然面對這個問題得出的答案倒是非常有趣。

圖片圖片

網友吐槽:沒有1M上下文版本,令人失望!

但試用GPT-4.1后,許多網友表示:太失望了!

雖然OpenAI發布了GPT-4.1,卻沒有包含100萬上下文窗口的API版本。

圖片圖片

圖片圖片

本來大家最希望在ChatGPT中使用GPT-4.1,就是因為想要超長的上下文窗口。

現在,只能期望GPT-5能提供一個超長的上下文窗口了。

圖片圖片

圖片圖片

的確,不斷有人發現,ChatGPT(Pro)中的GPT-4.1,最大上下文長度似乎僅為128k token,跟API中的100萬token相差甚遠。

也就是說,OpenAI并沒有在GPT-4.1中提高限制。

圖片圖片

總之,真的讓人很失望。看來還是得用Gemini。

也有網友發現了「華點」:自己嘗試運行他們在直播演示中用來展示 ChatGPT 4.1的提示詞,但網頁版無法運行成功,不過在API Playground中嘗試后卻運行成功了。

圖片圖片

也有人說,自己剛剛氛圍編程了一個使用GPT-4.1的AI助手,因為這個模型僅通過API提供,今天,ChatGPT中就能用了。

圖片圖片

不過,他還是會用自己的助手,因為用戶界面比ChatGPT更好。

圖片圖片

圖片圖片

其實,OpenAI此前已經放出GPT-4.1的prompt指南,總結了一系列內部測試中得出的重要prompt技巧。

想實測的小伙伴,可以參考這篇用起來了。

圖片

參考資料:

  https://x.com/gdb/status/1922727473164227001

  https://x.com/OpenAIDevs/status/1922709921772036164

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-05-15 09:34:39

2025-04-14 09:00:00

模型AI數據

2023-04-28 09:07:28

2025-04-16 09:30:16

2024-01-11 07:28:42

2023-03-02 12:32:36

2025-04-24 08:29:59

OpenAIGPT-4.1人工智能

2025-05-06 00:22:00

2025-05-15 10:50:46

2025-04-15 08:51:05

2025-04-15 07:41:18

2023-11-07 09:34:36

自定義GPTOpenAI

2023-11-01 13:37:26

2023-03-03 07:34:05

2024-04-23 13:10:41

數據訓練

2025-05-15 09:16:00

2023-10-19 11:29:30

OpenAI

2024-01-11 13:00:08

OpenAIGPT功能

2023-07-13 15:10:06

2023-08-06 08:06:30

OpenAIChatGPTGPT-4
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 不卡一区二区三区四区 | 本道综合精品 | 日韩综合| 成人免费视频网站在线看 | 亚洲国产激情 | 91tv在线观看 | 国产精品久久久久一区二区三区 | 天天综合网天天综合色 | 成人国产在线视频 | 九九亚洲| 精品91久久久 | 亚洲国产一区视频 | 久久国产精99精产国高潮 | 国产日产精品一区二区三区四区 | 久久久久久久久久毛片 | 亚洲一区二区三区视频 | 成人特级毛片 | 日本一区二区三区四区 | 欧美一区二区三区久久精品 | 中文字幕 在线观看 | 国产美女久久久 | 一区视频在线免费观看 | 成人福利网 | 在线免费观看a级片 | 国产在线不卡 | 欧美一区二区三区在线免费观看 | 精品福利一区二区三区 | 美女黄视频网站 | 日韩精品在线看 | 亚洲精品视频在线 | 日韩在线 | 91九色在线观看 | 国产精品久久久久久久久免费桃花 | 成人精品久久日伦片大全免费 | 五月婷婷丁香婷婷 | 国产精品久久久久不卡 | 久久首页| 日韩欧美国产一区二区三区 | 亚洲精品 在线播放 | 国产高清一区二区 | 国产真实精品久久二三区 |