從2024年12月份DeepSeek發(fā)布了DeepSeekV3開(kāi)始,整個(gè)AI圈內(nèi)就掀起了一波技術(shù)創(chuàng)新式浪潮,核心的因素在于一家在2023年剛注冊(cè)成立的初創(chuàng)企業(yè)所發(fā)布的第一個(gè)正式版本模型就直接對(duì)標(biāo)了OpenAI閉源的GPT4o以及Claude3.5Sonnet,更重要的是其訓(xùn)練階段的成本只有不到600萬(wàn)美元,是什么概念?在這之前,普遍的訓(xùn)練成本都在千萬(wàn)甚至于上億美元的成本支出,突然出現(xiàn)預(yù)訓(xùn)練大模型在性能上比肩目前最強(qiáng)的GPT4o,成本上比GPT4o要節(jié)約十幾倍,關(guān)...
2025-05-29 06:12:20 637瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
本來(lái)想寫(xiě)在AI大模型中對(duì)于數(shù)據(jù)方面的挑戰(zhàn),但是發(fā)現(xiàn)還是要找一個(gè)場(chǎng)景來(lái)鋪墊一下,正好去年做過(guò)一些大模型知識(shí)庫(kù)的內(nèi)容,對(duì)于RAG方面還算了解一些,所以先來(lái)說(shuō)一下關(guān)于大模型應(yīng)用方面的東西吧,下一篇再來(lái)聊聊AI大模型場(chǎng)景中對(duì)于數(shù)據(jù)管理方面的機(jī)會(huì)。先解釋一下什么是檢索增強(qiáng)生成技術(shù)(下文簡(jiǎn)稱(chēng):RAG),對(duì)于日常我們所理解的大模型來(lái)說(shuō),他們具備的是模型本身能力(億級(jí)別參數(shù)+通用數(shù)據(jù)),但是在特定領(lǐng)域內(nèi)的數(shù)據(jù)可能是無(wú)法獲...
2025-05-15 00:25:29 1151瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
在數(shù)據(jù)應(yīng)用場(chǎng)景中,數(shù)據(jù)源屬于數(shù)據(jù)管理是非常的一個(gè)環(huán)節(jié),包括數(shù)據(jù)源、數(shù)據(jù)集成、生命周期、數(shù)據(jù)地圖、數(shù)據(jù)標(biāo)注、數(shù)據(jù)安全、主數(shù)據(jù)等等等,數(shù)據(jù)管理也是整個(gè)數(shù)據(jù)治理體系中最核心的部分之一,面向智算領(lǐng)域的數(shù)據(jù)能力,對(duì)于AI數(shù)據(jù)治理會(huì)有一些新的挑戰(zhàn)。在過(guò)去數(shù)十年的大數(shù)據(jù)領(lǐng)域發(fā)展過(guò)程中,結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)處理都是其中絕對(duì)的主角,結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)由業(yè)務(wù)流程產(chǎn)生,與商業(yè)價(jià)值高度相關(guān),這些數(shù)據(jù)與企業(yè)的流程業(yè)...
2025-04-28 23:52:39 1356瀏覽 0點(diǎn)贊 0回復(fù) 0收藏
最近一直在做數(shù)據(jù)+AI方向的工作,前兩天無(wú)意中看到一個(gè)MCP的技術(shù),經(jīng)過(guò)詳細(xì)的學(xué)習(xí)之后,了解到這個(gè)可能不僅僅應(yīng)用在大模型,而更多是數(shù)據(jù)和模型之間的橋梁,最近就一直在考慮對(duì)于多模態(tài)數(shù)據(jù)如何才能實(shí)打?qū)嵉暮蛻?yīng)用模型結(jié)合起來(lái)的事情,MCP無(wú)疑是提供了某種思路,下面是關(guān)于MCP的一些介紹,部分內(nèi)容是參考的社區(qū)文檔。MCP(ModelContextProtocol)是一種開(kāi)放協(xié)議,它標(biāo)準(zhǔn)化了應(yīng)用向設(shè)備提供上下文的方式。可以將MCP想象成AI應(yīng)用...
2025-04-18 06:53:54 1141瀏覽 0點(diǎn)贊 0回復(fù) 0收藏