成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

<center id="awkk6"><delect id="awkk6"></delect></center>

<option id="awkk6"><abbr id="awkk6"></abbr></option>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一

發(fā)布于 2024-5-7 13:32

瀏覽

0收藏

最新國產(chǎn)開源MoE大模型，剛剛亮相就火了。

DeepSeek-V2性能達GPT-4級別，但開源、可免費商用、API價格僅為GPT-4-Turbo的百分之一。

因此一經(jīng)發(fā)布，立馬引發(fā)不小討論。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

從公布的性能指標來看，DeepSeek-V2的中文綜合能力超越一眾開源模型，并和GPT-4-Turbo、文心4.0等閉源模型同處第一梯隊。

英文綜合能力也和LLaMA3-70B同處第一梯隊，并且超過了同是MoE的Mixtral 8x22B。

在知識、數(shù)學、推理、編程等方面也表現(xiàn)出不錯性能。并支持128K上下文。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

這些能力，普通用戶都能直接免費使用。現(xiàn)在內(nèi)測已開啟，注冊后立馬就能體驗。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

API更是是骨折價：每百萬tokens輸入1元、輸出2元（32K上下文）。價格僅為GPT-4-Turbo的近百分之一。

同時在模型架構(gòu)也進行創(chuàng)新，采用了自研的MLA（Multi-head Latent Attention）和Sparse結(jié)構(gòu)，可大幅減少模型計算量、推理顯存。

網(wǎng)友感嘆：DeepSeek總是給人帶來驚喜！

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

具體效果如何，我們已搶先體驗！

實測一下

目前V2內(nèi)測版可以體驗通用對話和代碼助手。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

在通用對話中可以測試大模型的邏輯、知識、生成、數(shù)學等能力。

比如可以要求它模仿《甄嬛傳》的文風寫口紅種草文案。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

還可以通俗解釋什么是量子糾纏。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

數(shù)學方面，能回答高數(shù)微積分問題，比如：

使用微積分證明自然對數(shù)的底e 的無窮級數(shù)表示。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

也能規(guī)避掉一些語言邏輯陷阱。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

測試顯示，DeepSeek-V2的知識內(nèi)容更新到2023年。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

代碼方面，內(nèi)測頁面顯示是使用DeepSeek-Coder-33B回答問題。

在生成較簡單代碼上，實測幾次都沒有出錯。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

也能針對給出的代碼做出解釋和分析。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

不過測試中也有回答錯誤的情況。

如下邏輯題目，DeepSeek-V2在計算過程中，錯誤將一支蠟燭從兩端同時點燃、燃燒完的時間，計算成了從一端點燃燒完的四分之一。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

帶來哪些升級？

據(jù)官方介紹，DeepSeek-V2以236B總參數(shù)、21B激活，大致達到70B~110B Dense的模型能力。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

和此前的DeepSeek 67B相比，它的性能更強，同時訓練成本更低，可節(jié)省42.5%訓練成本，減少93.3%的KV緩存，最大吞吐量提高到5.76倍。

官方表示這意味著DeepSeek-V2消耗的顯存（KV Cache）只有同級別Dense模型的1/5~1/100，每token成本大幅降低。

專門針對H800規(guī)格做了大量通訊優(yōu)化，實際部署在8卡H800機器上，輸入吞吐量超過每秒10萬tokens，輸出超過每秒5萬tokens。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

在一些基礎(chǔ)Benchmark上，DeepSeek-V2基礎(chǔ)模型表現(xiàn)如下：

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

DeepSeek-V2 采用了創(chuàng)新的架構(gòu)。

提出MLA（Multi-head Latent Attention）架構(gòu)，大幅減少計算量和推理顯存。

同時自研了Sparse結(jié)構(gòu)，使其計算量進一步降低。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

有人就表示，這些升級對于數(shù)據(jù)中心大型計算可能非常有幫助。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

而且在API定價上，DeepSeek-V2幾乎低于市面上所有明星大模型。

國產(chǎn)開源MoE指標炸裂：GPT-4級別能力，API價格僅百分之一-AI.x社區(qū)

團隊表示，DeepSeek-V2模型和論文也將完全開源。模型權(quán)重、技術(shù)報告都給出。

現(xiàn)在登錄DeepSeek API開放平臺，注冊即贈送1000萬輸入/500萬輸出Tokens。普通試玩則完全免費。

感興趣的童鞋，可以來薅羊毛了~

體驗地址：??https://chat.deepseek.com???
API平臺：
platform.deepseek.com

GitHub：???https://github.com/deepseek-ai/DeepSeek-V2?tab=readme-ov-file??

本文轉(zhuǎn)自量子位，作者：量子位

原文鏈接:??https://mp.weixin.qq.com/s/UIZEjY908gP7B4osWoOLgw??

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

港中文深圳提出ALLaVA-4V：百萬級別的開源多模態(tài)GPT-4V數(shù)據(jù)集

kcoufee ? 2749瀏覽 ? 0回復
開源版AI程序員來了：GPT-4加持，能力比肩Devin，一天1.4k Star

輕薄滴假象 ? 4150瀏覽 ? 0回復
首個開源世界模型！百萬級上下文，長視頻理解吊打GPT-4，UC伯克利華人一作

duhorse ? 3384瀏覽 ? 0回復
GPT-4 Turbo更新：視覺能力+無限制使用

echo_ning ? 4320瀏覽 ? 0回復
開源社區(qū)再次沸騰：GPT-4級別模型可以自由訪問的時代到來

Crystalcxt ? 3312瀏覽 ? 0回復
Meta 發(fā)布Llama 3，能力直逼GPT-4,一己之力拉高開源大模型水位

51CTO技術(shù)棧 ? 4468瀏覽 ? 0回復
6成企業(yè)擬采用AI，投入生產(chǎn)的僅占其中三分之一；OpenAI穩(wěn)坐王位；

51CTO技術(shù)棧 ? 2547瀏覽 ? 0回復
GPT-4o熱潮來襲：探索圖生文本的奧秘（多模態(tài)大模型系列之一）

魚蟲子 ? 7965瀏覽 ? 0回復
GPT-4（o）免費試用體驗，看看它的設(shè)計方案能力—關(guān)于ROCE網(wǎng)卡方案

parson2000 ? 3249瀏覽 ? 0回復
OpenAI開源GPT-4 SAE，提供1600萬個解釋模式

Aceryt ? 4343瀏覽 ? 0回復
誰是OpenAI API最佳“平替”？國產(chǎn)大模型八仙過海，拼價格拼速度拼服務，誰能贏得用戶選擇？

51CTO技術(shù)棧 ? 3809瀏覽 ? 0回復
8B尺寸達到GPT-4級性能！北大等提出醫(yī)療專家模型訓練方法

duhorse ? 2403瀏覽 ? 0回復
OpenAI正式打響海外價格戰(zhàn)，GPT-4o mini成地表最強小模型，百萬tokens僅需60美分

InfonityAI智推星 ? 3515瀏覽 ? 0回復
長上下文能力只是吹牛？最強GPT-4o正確率僅55.8%，開源模型不如瞎蒙

duhorse ? 3318瀏覽 ? 0回復
TOT(Tree of Thought) | 讓GPT-4像人類一樣思考

arnoldzhw ? 3036瀏覽 ? 0回復
清華大學最新發(fā)布：統(tǒng)一時序預測模型，上下文長度首次擴展至千級別，適用各類數(shù)據(jù)集

海因斯DK ? 4384瀏覽 ? 0回復
GPT-4和GPT-4V能否像人類一樣進行抽象推理

lintoms ? 2216瀏覽 ? 0回復
關(guān)于大模型的幻覺問題，大模型有可能做到百分之百的準確率嗎？

AI探索時代 ? 3252瀏覽 ? 0回復
不用魔法，直接訪問微軟 Copilot GPT-4

丟翅膀的魚 ? 1612瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

何愷明開辟分形圖像生成新范式！計算效率提高4000倍，首次實現(xiàn)高分辨率逐像素生成 2025-02-26 11:59:41發(fā)布
達摩院開源VideoLLaMA3：僅7B大小，視頻理解拿下SOTA | 在線可玩 2025-02-14 13:02:21發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預算就干翻Gemini，實測：真·超DS！ 1回復

AI Agents開源工具棧全解析~ 0回復

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復

上一篇：全新神經(jīng)網(wǎng)絡(luò)架構(gòu)KAN一夜爆火！200參數(shù)頂30萬，MIT華人一作，輕松復現(xiàn)Nature封面AI數(shù)學研究

下一篇： OpenAI神秘gpt2正在A/B測試，奧特曼搶先劇透，網(wǎng)友已玩嗨

社區(qū)精華內(nèi)容

目錄

主站蜘蛛池模板：日本字幕在线观看 | 狠狠操天天干 | 天天操网| 97精品超碰一区二区三区 | 成人影院一区二区三区 | 欧美综合一区二区 | 日韩激情一区 | 日日夜夜操天天干 | 午夜精品久久久久久久星辰影院 | 欧美性另类| 国产一级毛片精品完整视频版 | 亚洲一区二区不卡在线观看 | 欧美日韩国产精品一区 | 久久国产精品视频 | 欧美在线国产精品 | 国内精品一区二区三区 | 国产成人影院 | 亚洲毛片在线观看 | 国产精品视频综合 | 一级特黄a大片 | 一区二区影院 | 青娱乐一区二区 | 久草.com| 日韩久久综合 | 青青草视频网站 | a级网站| 三区在线观看 | 久久久久国产 | 久久毛片 | 三级视频在线观看电影 | 亚洲精品综合 | 五月天婷婷综合 | 欧美日韩在线一区二区 | 欧美日韩中文国产一区发布 | 天天操天天干天天爽 | 欧美影院| 国产日韩精品在线 | 一级做a爰片性色毛片 | 欧美jizzhd精品欧美巨大免费 | 亚洲精品成人av久久 | 中文字幕av亚洲精品一部二部 |

<option id="42ss2"></option>

<pre id="42ss2"></pre><option id="42ss2"></option>

<button id="42ss2"><acronym id="42ss2"></acronym></button>

<samp id="42ss2"><acronym id="42ss2"></acronym></samp>