成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Nature認證DeepSeek成科研工具全能者,國內(nèi)高校如何借力大模型?

人工智能 新聞
Nature更是幾度發(fā)文,因為DeepSeek開源低成本易部署等優(yōu)勢,科學(xué)家們紛紛涌向DeepSeek,這種模型已經(jīng)是科研AI工具中的全能者。

DeepSeek的風(fēng),也是飄到了科研領(lǐng)域——

最新消息,同濟大學(xué)通過百度智能云千帆大模型平臺接入并調(diào)用DeepSeek-R1/V3系列模型;

包括浙大、北大清華等知名高校也是紛紛出動,要么接入模型推出智能體,又或者出品干貨課程、使用手冊《從入門到精通》等等,幾度都登上熱搜。

Nature更是幾度發(fā)文,因為DeepSeek開源低成本易部署等優(yōu)勢,科學(xué)家們紛紛涌向DeepSeek,這種模型已經(jīng)是科研AI工具中的全能者

感知到的是,大模型在科研探索中發(fā)揮的價值遠比以往任何時候都深入

DeepSeek R1自推出以來,Hugging Face上相關(guān)版本的下載量已經(jīng)接近四百萬次,高居榜首。

但高的使用量,隨之而來的就是算力需求井噴。除了帶來模型本身的穩(wěn)定性、易用性等挑戰(zhàn),傳統(tǒng)的科研機構(gòu)還面臨算力資源碎片化、人才培育滯后等問題。

春節(jié)期間,我們看到,整個AI產(chǎn)業(yè)鏈都被積極調(diào)動起來,來支持模型穩(wěn)定運行。

但因為科研環(huán)境中,對數(shù)據(jù)的準(zhǔn)確性、隱私安全方面的要求以及模型可靠性、穩(wěn)定性、易用性要求更高,像DeepSeek這樣的大模型能真正應(yīng)用到科研探索,其實難度不小。

像模型的易用性問題,科研人員并非都具備深厚的AI技術(shù)背景,也沒有那么多時間成本來學(xué)習(xí)大模型如何配置。他們可能需要花費大量時間學(xué)習(xí)如何操作模型,而無法將精力集中在核心的科研問題上,嚴(yán)重影響科研效率。

而且這還只是模型本身的挑戰(zhàn),還存在一些系統(tǒng)性難題,其中以算力與人才最為突出。

算力「饑餓與浪費并存」。科研機構(gòu)無法像企業(yè)那樣投入大量資源來建設(shè)AI基礎(chǔ)設(shè)施。同時算力資源分散,不同機構(gòu)不同設(shè)備難以實現(xiàn)有效整合和協(xié)同使用,從而影響整個科研項目的進程。所以我們經(jīng)常就會看到有科學(xué)家在線求算力,即便李飛飛也曾透露過斯坦福團隊算力不夠的情況。

人才培養(yǎng)的滯后性。技術(shù)發(fā)展過快,產(chǎn)業(yè)界的AI人才稀缺甚至是靠高薪來搶人,而在科研這端,這種既懂科研專業(yè)知識又掌握大模型技術(shù)的復(fù)合型人才可能更是少之又少。

基礎(chǔ)設(shè)施是技術(shù)研究的基石,缺乏足夠的科研基礎(chǔ)設(shè)施,也就很難吸引到人才,同時也限制了技術(shù)的發(fā)展空間;而沒有足夠的人才來操作設(shè)備,基礎(chǔ)設(shè)施也無法發(fā)揮出它應(yīng)用的作用,還會影響到上層模型本身的發(fā)展。

如此循環(huán)往復(fù),那么大模型在科研環(huán)境中的應(yīng)用進程也就更顯道阻且長了。

今時今日如何破局,也就顯得更為緊迫和艱巨。

AI科研新基建:算力為核心,全生命周期支持

這段時間,在一眾鋪天蓋地的新聞中,有這么一則AI算力產(chǎn)業(yè)界的進展備受關(guān)注——

昆侖芯P800萬卡集群成功點亮,這是國內(nèi)首個正式點亮的自研萬卡集群,并且還計劃將這一數(shù)字?jǐn)U大到三萬。

大家一邊感嘆于它性能方面的顯著,其規(guī)格其顯存規(guī)格比同類主流GPU高出20%-50%。它對MoE架構(gòu)更友好,并且支持8bit推理,單機8卡就能運行671B滿血版模型。

正因如此,昆侖芯相較同類產(chǎn)品更加易于部署,同時可顯著降低運行成本,輕松完成DeepSeek-V3/R1全版本推理任務(wù)。同時,昆侖芯P800在DeepSeek系列MoE模型大規(guī)模訓(xùn)練任務(wù)中也表現(xiàn)出色,全面支持MLA、多專家并行等特性,僅需32臺即可支持模型全參訓(xùn)練,高效助力模型的持續(xù)訓(xùn)練和微調(diào)。

而在另一邊,科研團隊還關(guān)注的是,它在能效比上面的優(yōu)勢——

對比通用GPU,它單位算力功耗可以降低40%,幫助科研團隊突破傳統(tǒng)GPU集群的電力瓶頸。

經(jīng)過清華智能產(chǎn)業(yè)研究院驗證,他們搭載昆侖芯P800的算力集群成功將千億參數(shù)模型的訓(xùn)練周期從28天縮短至19天,電力成本節(jié)省超300萬元

而且因為該芯片擁有完全自主知識產(chǎn)權(quán)體系,從指令集架構(gòu)到編譯器工具鏈全棧可控,能夠保證科研應(yīng)用過程中的數(shù)據(jù)安全。

像北京前沿計算研究中心基于昆侖芯構(gòu)建的聯(lián)邦學(xué)習(xí)平臺已在醫(yī)療影像分析領(lǐng)域?qū)崿F(xiàn)多機構(gòu)數(shù)據(jù)協(xié)同訓(xùn)練,模型精度提升12%的同時,完全滿足隱私合規(guī)要求

能夠看到,自研芯片構(gòu)建算力集群也許是破局關(guān)鍵,它能解決訓(xùn)練成本、數(shù)據(jù)安全等方面的難題。

不過能夠吸引這么多高校Pick合作,不僅僅是因為百度智能云部署了昆侖芯,而是一整套AI For Science解決方案。

它憑借多年全棧技術(shù)布局,以及與多家頂尖高校生態(tài)合作,沉淀出這么一套方案——

包括昆侖芯P800芯片、百舸異構(gòu)算力平臺、飛槳深度學(xué)習(xí)框架以及千帆大模型平臺等。

在此之前,還不曾系統(tǒng)性梳理過,今天不妨就來一一拆解,看看背后有哪些值得學(xué)習(xí)與借鑒。

首先,昆侖芯P800集成的萬卡集群,它是AI基礎(chǔ)設(shè)施當(dāng)中的定海神針。只有自主可控的堅實底座,才能推動大模型技術(shù)持續(xù)迭代與生態(tài)繁榮。

其次,百舸異構(gòu)算力平臺,可以理解為算力中樞,或者是統(tǒng)籌師,面對科研環(huán)境中復(fù)雜多樣的算力需求,這個中樞就顯得格外重要,通過預(yù)測調(diào)度等操作實現(xiàn)算力資源的高效統(tǒng)籌,它在提升算力利用效率、降低成本、加速科研進程等方面成效顯著——

上海交通大學(xué)AI研究院部署百舸平臺后,GPU利用率從35%提升至72%,任務(wù)排隊時間減少60%,模型訓(xùn)練效率得以顯著提高。

如此解決科研中算力資源碎片化的痛點,源于他在架構(gòu)算法以及服務(wù)模式化上面的創(chuàng)新。

架構(gòu)方面,它建立了一個靈活彈性的算力供給網(wǎng)絡(luò)。物理層兼容昆侖芯、英偉達、AMD等多元算力芯片,資源層提供容器化算力單元,服務(wù)層則支持Kubernetes、Slurm等多種調(diào)度系統(tǒng)。

算法層面,它的智能調(diào)度算法有三個方面的創(chuàng)新,比如基于強化學(xué)習(xí)的動態(tài)資源預(yù)測模型可提前24小時預(yù)判算力需求波動;跨集群任務(wù)遷移技術(shù)實現(xiàn)全局負載均衡;異構(gòu)資源感知調(diào)度器可將不同類型計算任務(wù)精準(zhǔn)分配到最優(yōu)硬件組合。

還有服務(wù)模式上,它創(chuàng)造了「科研算力銀行」這種范式。能讓機構(gòu)按需取用、彈性供給。像浙江大學(xué)某重點實驗室,就通過這種方式提前3個月完成了氣象大模型的迭代。

并且隨著技術(shù)發(fā)展,百舸也在持續(xù)的更新與迭代,比如配合DeepSeek推理能力推出了一些功能,包括在線推理服務(wù)的全生命周期管理、彈性擴縮容能力、自研框架推理加速技術(shù)以及完善的運維監(jiān)控體系。

再者是飛槳深度學(xué)習(xí)框架,國內(nèi)首個開源開放的產(chǎn)業(yè)級深度學(xué)習(xí)平臺,工具鏈與社區(qū)屬性兼?zhèn)?/strong>。

它通過構(gòu)建起基礎(chǔ)模型、工具組件、應(yīng)用案例的三層資源體系,提高了諸多高校與開發(fā)者的科研效率。中國科學(xué)技術(shù)大學(xué)量子計算團隊基于飛槳量子機器學(xué)習(xí)套件,成功實現(xiàn)量子化學(xué)模擬加速,計算效率超越傳統(tǒng)方法2個數(shù)量級。

不過能推出如此海量的資源套件,也與百度持續(xù)深耕積累Know-how有關(guān)。

百度飛槳持續(xù)深耕力學(xué)與數(shù)學(xué)、材料化學(xué)、氣象預(yù)測、生物醫(yī)藥等前沿領(lǐng)域,尤其是在生物計算領(lǐng)域尤為顯著。

截至目前,百度已打造完整的基于飛槳的生物計算平臺-螺旋槳PaddleHelix,涵蓋文心大模型-生物計算大模型,探索AI技術(shù)在小分子、蛋白/多肽、RNA等場景的應(yīng)用。

2023年5月2日,國際頂級學(xué)術(shù)期刊《Nature》正刊發(fā)表了百度與合作單位在生物計算領(lǐng)域的研究成果——《Algorithm for Optimized mRNA Design Improves Stability and Immunogenicity》,提出mRNA序列優(yōu)化算法LinearDesign。這是中國科技企業(yè)首次以第一完成單位的身份在《Nature》雜志發(fā)表論文。

而隨著DeepSeek、文心越來越多的模型選擇開源,飛槳的價值其實也就愈加凸顯。

開源的方式保證了研究結(jié)果的可靠性,促進了科研成果的廣泛傳播和共享。其他研究人員通過復(fù)現(xiàn)在已有基礎(chǔ)上改進和拓展,技術(shù)創(chuàng)新與迭代也就在這個過程中加速流動。

像某高校基于飛槳框架研發(fā)的遙感圖像解譯系統(tǒng),結(jié)果通過社區(qū)協(xié)作持續(xù)優(yōu)化,在農(nóng)作物分類任務(wù)中的準(zhǔn)確率從89%提升至96%。

還有就是千帆大模型平臺,一站式AI服務(wù)平臺。它是資深的模型專家,從模型開發(fā)、訓(xùn)練、部署、監(jiān)控等的全流程管理系統(tǒng)。

此前我們比較熟悉的ModelBuilder就是在這一平臺體系下,按照自身需求來完成大模型的開發(fā)和部署。這其實是一個包含數(shù)據(jù)處理、模型精調(diào)、模型評估、量化等環(huán)節(jié)的系統(tǒng)性工程,對于企業(yè)而言就難度不小,對于缺乏產(chǎn)業(yè)實戰(zhàn)經(jīng)驗的科研高校來說更是如此。

ModelBuilder提供了一整套完善的工具鏈,院校根據(jù)自身科研需求深度優(yōu)化模型性能。現(xiàn)在該平臺的大模型矩陣已經(jīng)覆蓋了DeepSeek-R1、DeepSeek-V3、文心大模型等,同時支持vLLM、LMDeploy、TensorRT-LLM、SGLang等主流推理框架實現(xiàn)高性能模型托管,幫助高校可以靈活開發(fā)與部署。

而在開發(fā)與部署之前,它還能幫助科研團隊選出適合自己的大模型。

它的智能評估板塊,集成了50多種量化指標(biāo)。在南京大學(xué)某分子動力學(xué)研究中,研究人員通過平臺的AB測試功能,快速篩選出最優(yōu)的力場預(yù)測模型,研發(fā)周期縮短40%。

可以這樣總結(jié),百度技術(shù)層面的部署:以算力為核心,整個全周期提供全棧技術(shù)支持。另外,在人才培養(yǎng)和科研創(chuàng)新上,百度也在發(fā)揮著自己在產(chǎn)業(yè)實踐方面的優(yōu)勢。

比如通過「松果計劃」培養(yǎng)出5000余名AI工程化人才,參與學(xué)生發(fā)表頂會論文300余篇,孵化出智能天文數(shù)據(jù)處理、古生物數(shù)字復(fù)原等20余個創(chuàng)新項目。

還有與多所高校包括清華北大、復(fù)旦、上海交大、蘭州大學(xué)等合作,開設(shè)了《飛槳Al for Science前沿系列講座課程》和《飛槳Alfor Science代碼入門與實操》兩門課程;

與清華共建「東方」智算中心,部署2000+卡規(guī)模昆侖芯集群;與上海交大建設(shè)國內(nèi)首個AI for Science科學(xué)數(shù)據(jù)開源開放平臺;與北大開發(fā)「小北學(xué)長」智能體等等。

……

可以看到,百度在AI For Science上面的賦能是全方面的,是從全棧技術(shù)到人才培養(yǎng),也是從底座、模型到應(yīng)用覆蓋整個模型全周期的。

放在整個行業(yè)中,百度這一案例代表著AI科研的一種新基建,其核心邏輯在于將算力從孤立資源升級為智能化生產(chǎn)力中樞,通過全棧技術(shù)鏈重構(gòu)科研工作流。

在這一過程中,企業(yè)與高校之間的合作展現(xiàn)出了一種新型的合作模式。

這種合作并非簡單的點對點式對接,即在某個具體項目上的短暫合作,而是呈現(xiàn)出立體的、動態(tài)的和多樣的特點。

他們發(fā)揮各自的優(yōu)勢,比如學(xué)校的人才積累和專業(yè)數(shù)據(jù),企業(yè)的算力底座和產(chǎn)業(yè)級別算法,來共同應(yīng)對大模型創(chuàng)新與應(yīng)用的各種挑戰(zhàn)。

就像同濟大學(xué)與百度智能云合作,就格外具有代表性。

同濟大學(xué)作為國家重點大學(xué),肩負了一系列重大的國家專項科研任務(wù)和工程科研攻關(guān)使命。

為了滿足同濟大學(xué)在多模態(tài)大模型、機器自主感知、多智能體和具身智能方向等前沿領(lǐng)域的深度探索需求,百度智能云提供了全面的技術(shù)支持。

以百昆侖芯P800、百度百舸AI異構(gòu)計算平臺、百度智能云千帆大模型平臺、百度智能云一見視覺大模型平臺為基礎(chǔ),打造全國產(chǎn)底座的具身智能大模型開發(fā)平臺,服務(wù)于同濟大學(xué)圍繞特色化示范性軟件學(xué)院建設(shè)、智慧城市感知與規(guī)劃重大工程軟件技術(shù)教育部工程研究中心建設(shè)。

百舸一體機搭載昆侖芯P800,可在單機環(huán)境下部署滿血版DeepSeek R1/V3全系列模型,滿足輕量化與極致效價比需求。這一方案支持8bit推理,并全面兼容DeepSeek全系列模型,提供一鍵部署、開箱即用的便捷體驗。

合作對學(xué)校多智能體系統(tǒng)技術(shù)的突破具有重要作用,有效提升校方多智能體強化學(xué)習(xí)算法、領(lǐng)域定制大模型、協(xié)同學(xué)習(xí)算法、智能代理算法的訓(xùn)練效率,并將賦能給不同場景機器人、無人機、多智能體設(shè)備等智能終端。

AI科研新基建的構(gòu)建,本質(zhì)上是一場面向科研范式的底層革命。

AI For Science:從AlphaFold到DeepSeek

DeepSeek R1模型,憑借其低成本高表現(xiàn)的顯著優(yōu)勢,在全球科研領(lǐng)域迅速走紅,受到了科學(xué)家們的熱烈追捧。

比如用來探索新研究方向、日常數(shù)據(jù)處理、篩選整理科學(xué)文獻等等。

回顧AI For Science的發(fā)展歷程,上一次引發(fā)如此廣泛關(guān)注和熱議的是AlphaFold。

不過AlphaFold聚焦在提煉生物數(shù)據(jù)的價值,其核心貢獻在于極大地提高了蛋白質(zhì)以及大分子結(jié)構(gòu)預(yù)測的效率,對于藥物研發(fā)、基因編輯等諸多前沿方向帶來深刻的影響。

而現(xiàn)在是以模型通用能力的極大提升、低成本零門檻部署的特點,帶來是整個全面科研范式的賦能。

它不再局限于某一特定領(lǐng)域的數(shù)據(jù)處理和研究,而是廣泛適用于多個學(xué)科領(lǐng)域。無論是物理學(xué)中的復(fù)雜模擬計算、化學(xué)中的分子反應(yīng)預(yù)測,還是社會科學(xué)中的數(shù)據(jù)分析和預(yù)測,大模型都能發(fā)揮其獨特的優(yōu)勢。

這種通用性使得不同學(xué)科的科研人員都能夠輕松借助其能力開展研究工作,打破了學(xué)科之間的技術(shù)壁壘,促進了跨學(xué)科研究的發(fā)展。

同時,低成本零門檻的特點讓更多科研團隊,尤其是資源相對有限的科研機構(gòu)和小型實驗室,也能夠享受到先進AI技術(shù)帶來的便利。

此次DeepSeek在AI For Science上的賦能,標(biāo)志著該領(lǐng)域來到了一個新的階段。這對模型能力乃至整個科研周期的服務(wù)都提出了新的挑戰(zhàn)。

比如穩(wěn)定的算力、比如高質(zhì)量專業(yè)數(shù)據(jù)。面對不同學(xué)科領(lǐng)域的海量數(shù)據(jù)和復(fù)雜問題,模型要能夠快速學(xué)習(xí)和適應(yīng),提供精準(zhǔn)有效的解決方案。在科研全周期中,從數(shù)據(jù)采集、處理、分析,到模型訓(xùn)練、驗證和應(yīng)用,每個環(huán)節(jié)都需要更高的效率和質(zhì)量保障。

應(yīng)對這些挑戰(zhàn)方面,百度給出了一個參考答案。憑借其全棧的技術(shù)能力,為解決這些難題和關(guān)鍵瓶頸提供了有力支持,推動科研創(chuàng)新不斷向前。

從AlphaFold到DeepSeek,人工智能技術(shù)發(fā)展重塑科研的未來。AI For Science的競速才剛剛開始,需要更多國產(chǎn)玩家,呼喚更大的生態(tài),實現(xiàn)AI在前沿科技的全新里程碑。

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-02-24 10:01:23

2025-02-28 12:32:42

2015-06-30 17:41:31

戰(zhàn)旗TV

2025-05-08 08:10:25

大模型DeepSeekAPI

2013-08-30 13:54:34

云平臺

2025-03-06 07:28:31

DeepSeek大模型人工智能

2025-02-17 09:50:00

DeepSeekAI模型

2025-02-13 08:30:11

2022-11-06 11:42:29

語言模型Nature

2023-08-10 15:35:33

論文指數(shù)

2025-06-11 09:06:00

AI架構(gòu)算力

2025-02-20 09:27:46

2013-05-20 09:51:10

QuickOffice谷歌微軟

2013-10-21 10:24:38

SDN實踐科研
點贊
收藏

51CTO技術(shù)棧公眾號

主站蜘蛛池模板: 国产a区| 精品网站999www | 91麻豆精品国产91久久久久久久久 | 欧美日韩高清一区二区三区 | 欧美成人精品激情在线观看 | 黄色网址在线免费观看 | 草草视频在线观看 | 日韩中文字幕在线观看 | 中文字幕一区在线 | 欧美在线视频a | 久久99精品久久久 | 自拍在线| av小说在线 | 一级黄色片免费在线观看 | 97色在线视频 | 国产精品久久久久久久久久久新郎 | 麻豆精品一区二区三区在线观看 | 日韩免费一区二区 | 欧美一区二区三区视频在线观看 | 日韩成人一区二区 | 狠狠综合网 | 久久久久一区 | 欧美亚洲视频在线观看 | 国产精品一区二区久久 | 拍真实国产伦偷精品 | 亚洲精品久久久久久久久久久 | 亚洲精品无人区 | 亚洲成av人片在线观看无码 | 日韩欧美国产精品一区二区 | 一级做a爰片性色毛片16 | 男人的天堂中文字幕 | 在线免费看黄 | 久久精品国产清自在天天线 | 久久伊人精品 | 成人免费视频网 | 久色| 97超在线视频 | 国产乱精品一区二区三区 | 日韩成人在线播放 | 亚洲品质自拍视频 | 亚洲第一色av |