新版DeepSeek R1你得這樣用,太爽啦~
昨天下午下班后,DeepSeek R1更新了
然而他們就只是悄悄在微信群里面發(fā)布了這個消息。
說是一個小版本試升級
于是我?guī)е鴱娏业暮闷孀呱狭诉@條一波三折的測評之路。
心情真的是起起伏伏
我一開始測試了好幾個Case,有寫作的,有代碼的,有數(shù)學(xué)的。
初步覺得效果確實有提升,程度比官方說的高一點,但是離頂尖模型Claude4還是有明顯差距。
比如測試生成的城市智慧交通大數(shù)據(jù)可視化監(jiān)控平臺
上邊是新版DeepSeek R1,下邊是Claude4
圖片
又比如下面這個,全球氣候變化數(shù)據(jù)分析平臺
上邊是新版DeepSeek R1,下邊是Claude4
圖片
圖片
是不是看起來還是有明顯差距捏,而且Claude生成的網(wǎng)頁是真的有數(shù)據(jù)交互的,會變化。新版DeepSeek R1的幾乎沒有
當時看到其他幾位博主發(fā)的文章都是在吹DeepSeek的,瞬間感覺他們吹的有點過了?
測著測著,才發(fā)現(xiàn)不太對勁,DeepSeek R1是推理模型,我不應(yīng)該給跟Claude4一樣的復(fù)雜提示詞呀!
比如下面這樣:
臥槽!才想起來DeepSeek R1是不需要結(jié)構(gòu)化復(fù)雜提示詞的。
簡單一句話就能搞定
于是我立馬換一句話提示詞重跑了剛才的那些Case
果然,生成效果簡直是質(zhì)的飛躍~
比如下面這個天氣數(shù)據(jù)分析平臺,一句話搞定
我吶個豆,這提示詞搞復(fù)雜了是得多限制R1的發(fā)揮呀,改成一句話之后效果提升非常多。
為了防止是偶然現(xiàn)象,我又跑了城市智慧交通大數(shù)據(jù)可視化監(jiān)控平臺的Case,還是一句話
對比一下之前的生成效果,這檔次和審美是不是瞬間都上去了
而且生成一個這種大魚吃小魚的游戲,也是手拿把掐
提示詞同樣是一句話
請為我開發(fā)一個簡單但有趣的"大魚吃小魚"HTML5網(wǎng)頁游戲
最近都去用gemini2.5 Pro和Claude4去了,好久沒用DeepSeek R1,把R1的這個提示詞平權(quán)能力忘了。
一句話搞定,真滴太爽了,說多了反而限制它的發(fā)揮。
這對大部分普通人來說簡直是福音。
雖然是一句話,但也要盡量表達清楚需求哦
實測下來我的結(jié)論是代碼能力大幅提升,確實不輸Claude4了,可能還差那么一丟丟,但是已經(jīng)非常接近。
大概率是用3月新發(fā)布的DeepSeek-V3-0324升級的R1,V3的0324就是代碼能力大幅增強,所以這次的新版R1,代碼和審美上的增強非常明顯。
寫作能力感覺有小幅提升,然后數(shù)學(xué)能力貌似提升不大,因為給了之前測過的一些比較難的奧數(shù)題,跑了半天還是沒有給出正確答案。
不過,說實話,拿一個推理模型跟人家的基座模型Claude4比,其實已經(jīng)輸了...
但是我相信DeepSeek不久之后還會再創(chuàng)輝煌,靜靜等待R2的到來吧~
本文轉(zhuǎn)載自??袋鼠帝 AI 客棧??,作者:袋鼠帝 AI 客棧
