在近日51CTO主辦的MetaCon元宇宙技術(shù)大會(huì)上,歐科云鏈區(qū)塊鏈資深研究員許乾帶來了主題演講《區(qū)塊鏈大數(shù)據(jù)的探索與應(yīng)用》,分享了他對(duì)行業(yè)的最新觀點(diǎn)和思考。
許乾認(rèn)為,區(qū)塊鏈大數(shù)據(jù)的發(fā)展進(jìn)入到需求迸發(fā)的階段,區(qū)塊鏈與元宇宙的結(jié)合,促使區(qū)塊鏈大數(shù)據(jù)公司需要接納更多的交互內(nèi)容。此外,許乾還介紹了區(qū)塊鏈大數(shù)據(jù)具體的落地應(yīng)用情況。
本文對(duì)許乾演講的精彩內(nèi)容進(jìn)行了整理,希望能夠?qū)Υ蠹矣兴鶐椭?/p>
歐科云鏈?zhǔn)侨蝾I(lǐng)先的區(qū)塊鏈企業(yè),成立于2013年,也是中國本土成立時(shí)間最早的區(qū)塊鏈企業(yè)之一。公司致力于區(qū)塊鏈技術(shù)的研發(fā)與商用,現(xiàn)已發(fā)展成全球化的大型區(qū)塊鏈技術(shù)與服務(wù)提供商,旗下產(chǎn)品OKLink提供精準(zhǔn)的鏈上數(shù)據(jù)分析解決方案。今天我們重點(diǎn)講解一下區(qū)塊鏈大數(shù)據(jù)的發(fā)展歷程。
區(qū)塊鏈大數(shù)據(jù)的發(fā)展:數(shù)據(jù)激增、需求迸發(fā)
從公司層面來看,區(qū)塊鏈大數(shù)據(jù)業(yè)務(wù)的發(fā)展有四個(gè)重要的時(shí)間節(jié)點(diǎn)。2019年8月,歐科云鏈開始布局公有鏈的區(qū)塊鏈瀏覽器的相關(guān)業(yè)務(wù),包括區(qū)塊解析、交易解析、地址詳情;2020年4月,開始開展多維度鏈上數(shù)據(jù)統(tǒng)計(jì)業(yè)務(wù),包括富豪地址、算力分析、實(shí)體標(biāo)簽;2020年9月,推出了鏈上天眼與鏈上大師的產(chǎn)品雛形,包括鏈上監(jiān)控、圖譜分析、智能合約解析;2021年7月,歐科云鏈從整鏈數(shù)據(jù)轉(zhuǎn)到業(yè)務(wù)層數(shù)據(jù),由區(qū)塊鏈基礎(chǔ)設(shè)施服務(wù)逐步轉(zhuǎn)向區(qū)塊鏈鏈上數(shù)據(jù)治理。
從數(shù)據(jù)量級(jí)來看,目前歐科云鏈已經(jīng)支持10條以上公鏈的全節(jié)點(diǎn)解析,而且是全量解析;ES、Hbase、圖庫、數(shù)倉等數(shù)據(jù)庫共有超過100TB數(shù)據(jù);純粹鏈上的交易數(shù)據(jù)167億條;地址維度15億條;地址標(biāo)簽數(shù)據(jù)超過1億條。
需要指出的是,區(qū)塊鏈大數(shù)據(jù)主要有以下四大特點(diǎn):
1、巨大的數(shù)據(jù)量
從上述的數(shù)據(jù)中可以看出,該業(yè)務(wù)的數(shù)據(jù)量非常龐大。集中儲(chǔ)存、集中計(jì)算已經(jīng)無法處理巨大的數(shù)據(jù)量。
2、多結(jié)構(gòu)化數(shù)據(jù)
自從元宇宙火爆之后,區(qū)塊鏈與元宇宙的結(jié)合,促使區(qū)塊鏈大數(shù)據(jù)公司需要接納關(guān)于圖片、視頻和各類文檔的交互,超出了傳統(tǒng)的數(shù)據(jù)認(rèn)知范圍。
3、增長(zhǎng)速度很快
目前以以太坊為首的EVM公鏈擴(kuò)充之后,新的公鏈的速度都非常快,存儲(chǔ)的數(shù)據(jù)量也會(huì)非常大。海量數(shù)據(jù)需要及時(shí)有效分析,用戶基數(shù)龐大,設(shè)備數(shù)量眾多,實(shí)時(shí)海量,數(shù)據(jù)指數(shù)級(jí)別增長(zhǎng),這需要我們進(jìn)行整體的重構(gòu)。
4、價(jià)值密度低
單條數(shù)據(jù)其實(shí)并無太多價(jià)值,但龐大的數(shù)據(jù)量卻蘊(yùn)含著巨大財(cái)富。如果現(xiàn)在想把元宇宙的業(yè)務(wù)信息對(duì)外展示,就需要擁有更深入的數(shù)據(jù)解析、挖掘和分析能力。此時(shí)區(qū)塊鏈數(shù)據(jù)的開采難度和成本還是非常高的。
上圖是行業(yè)中的一些頭部公司的融資情況。在去年鏈上數(shù)據(jù)迸發(fā)時(shí),都已經(jīng)完成千萬級(jí)別美元的融資,整體估值已經(jīng)上億。這表明整個(gè)賽道去年被VC所關(guān)注,進(jìn)入到需求迸發(fā)的階段。
下面舉一個(gè)例子,以標(biāo)簽業(yè)務(wù)的發(fā)展和思考,以點(diǎn)帶面地講述大數(shù)據(jù)行業(yè)的發(fā)展。
我們對(duì)標(biāo)簽進(jìn)行了分級(jí):一級(jí)標(biāo)簽是行業(yè)、領(lǐng)域的分類;二級(jí)標(biāo)簽是單位、機(jī)構(gòu)組織等具體名稱;三級(jí)標(biāo)簽是具體地址類別。
自2020年末伊始,基于智能合約體系的業(yè)務(wù)發(fā)展,呈現(xiàn)出爆發(fā)的態(tài)勢(shì)。大量的金融創(chuàng)新都在區(qū)塊鏈的體系之上進(jìn)行運(yùn)轉(zhuǎn),包括銀行類、交易類的業(yè)務(wù),以及金融衍生品的業(yè)務(wù)。這些業(yè)務(wù)的發(fā)展也具備了分析的價(jià)值。
比如現(xiàn)在有一個(gè)地址,能夠通過跟蹤它去發(fā)現(xiàn)能夠盈利的信息,這個(gè)地址的最終分析哪怕關(guān)注不到某一個(gè)人,也是非常有價(jià)值的。因?yàn)橹灰M(jìn)行操作,你就可以賺到錢,至于這個(gè)人到底是誰,你已經(jīng)不關(guān)注了。
這類標(biāo)簽就是比較著名Smart Money。Smart Money翻譯過來稱作聰錢。跟著聰明的錢,你去投資相同的東西,關(guān)注它的進(jìn)出,大概率你也可以獲得不錯(cuò)的收益。在傳統(tǒng)市場(chǎng)里面,針對(duì)聰錢的分析,都是非常稀有的信息,需要有自己的分析師、甚至是一套系統(tǒng)才能進(jìn)行分析。但是得益于區(qū)塊鏈鏈上公開信息的設(shè)計(jì),只要你有數(shù)據(jù)的存儲(chǔ)、分析能力,就可以用更低廉的成本去挖掘。
另一個(gè)備受關(guān)注的標(biāo)簽是消息靈通者。比如某個(gè)地址在幾天前購入了某項(xiàng)資產(chǎn),此后該資產(chǎn)受事件影響出現(xiàn)非常大的漲幅。類似這樣的事件偶然發(fā)生幾次之后,我們就可以給這個(gè)地址打上“消息靈通者”的標(biāo)簽,證明其可能會(huì)先于市場(chǎng)知道會(huì)漲的消息。雖然不知道它是誰,但是從鏈上的行為來看,它都做出了盈利的結(jié)果。這類標(biāo)簽被定義為行為標(biāo)簽,而不是實(shí)體標(biāo)簽的概念。
還有一類標(biāo)簽叫做屬性標(biāo)簽,基于地址的鏈上屬性(智能合約代碼,創(chuàng)建時(shí)間,創(chuàng)建者等)分析生產(chǎn)的標(biāo)簽,用于描述地址本身的特性,比如黑客攻擊事件。如何防范,提前預(yù)知攻擊也是我們需要思考的領(lǐng)域,此時(shí)我們就必然會(huì)關(guān)注到智能合約源碼。我們發(fā)現(xiàn)一些頭部的項(xiàng)目都會(huì)公開他們自己的合約代碼,當(dāng)然也有很多反編譯的手段,讓一些代碼有反編譯的效果。然后我們會(huì)順著代碼去做分析,比如找出一些高危的函數(shù),或者是高危的編碼特征,運(yùn)用智能合約標(biāo)上它是特權(quán)函數(shù)或是特權(quán)地址的屬性。擁有特權(quán)函數(shù)地址的屬性,可能就會(huì)產(chǎn)生高危的風(fēng)險(xiǎn)。這些本質(zhì)上是針對(duì)鏈上的智能合約源碼,針對(duì)鏈上屬性去做補(bǔ)充的。這類是屬性標(biāo)簽。
目前打標(biāo)簽主要有三種方式。一是人工收錄,比如針對(duì)暗網(wǎng)地址的收錄,會(huì)有人工收集的過程;二是模型擴(kuò)展,根據(jù)鏈上的行為特征去歸納總結(jié)出擴(kuò)展方式,并把擴(kuò)展方式交給指定的輸入員,再根據(jù)鏈上數(shù)據(jù)的解析,他可以完成動(dòng)態(tài)擴(kuò)充;三是人工智能,利用機(jī)器學(xué)習(xí)去動(dòng)態(tài)創(chuàng)建特征工程,然后按照算法自動(dòng)尋找潛在的標(biāo)簽。
歐科云鏈的探索:洞悉鏈上數(shù)據(jù) 守護(hù)鏈上安全
針對(duì)大數(shù)據(jù)的應(yīng)用,我們也進(jìn)行了許多探索。
首先是鏈上天眼。地圖上的數(shù)字就是真實(shí)發(fā)生在國內(nèi)的數(shù)字貨幣案件的數(shù)量,顏色越深的地方,安全等級(jí)越高。從圖中可以看出案件的分布情況和涉案金額。
目前,全球區(qū)塊鏈資產(chǎn)犯罪非常嚴(yán)重,詐騙是主要的犯罪形式,其次盜竊、傳銷和洗錢。具體來看,2021年全球區(qū)塊鏈資產(chǎn)犯罪的涉案金額高達(dá)140億美元,同比增長(zhǎng)79%;區(qū)塊鏈資產(chǎn)詐騙案件造成損失78億美元,同比增長(zhǎng)82%;黑客盜竊案件造成損失32億美元,同比增長(zhǎng)516%;DeFi犯罪損失超120億美元,同比增長(zhǎng)6倍。相關(guān)的涉案金額其實(shí)是非常驚人的。
與此同時(shí),我國的執(zhí)法部門在區(qū)塊鏈資產(chǎn)犯罪案件的取證分析過程中也遇到了技術(shù)瓶頸:一是區(qū)塊鏈資產(chǎn)種類多、交易量大,24小時(shí)不間斷交易,抓取和分析的工作量大;二是區(qū)塊鏈資產(chǎn)交易 APP、PC 應(yīng)用種類多,取證和調(diào)證凍結(jié)難;三是轉(zhuǎn)賬鏈路復(fù)雜,鏈上身份與現(xiàn)實(shí)身份無法對(duì)應(yīng);四是區(qū)塊鏈項(xiàng)目代碼質(zhì)量參差不齊,漏洞較多,常被黑客和具有惡意的內(nèi)部人員輕易利用;五是扣押的區(qū)塊鏈資產(chǎn)無法合規(guī)托管、處置。
因此,基于前述的關(guān)于標(biāo)簽的建設(shè),以及全量數(shù)據(jù)的統(tǒng)計(jì)、搜集和計(jì)算能力,我們推出了一款針對(duì)鏈上資產(chǎn)追蹤的產(chǎn)品——鏈上天眼。
通過鏈上天眼,可以全方位展示某一鏈上地址的生命周期行為及其特點(diǎn),通過地址研判,自主查詢資產(chǎn)的走向和鏈路,確定資產(chǎn)的來源流向;通過數(shù)據(jù)挖掘?qū)Ρ龋瑢?duì)非標(biāo)簽化數(shù)據(jù)進(jìn)行二次碰撞,找到涉案地址與潛在特定關(guān)聯(lián)人員地址,以點(diǎn)帶面;通過大數(shù)據(jù)可視化形式,實(shí)時(shí)展現(xiàn)全國各地?cái)?shù)字資產(chǎn)案件的總覽情況。
對(duì)于像博彩平臺(tái)、虛假交易所、釣魚網(wǎng)站等常見類型的案件,結(jié)合在上百起案件中所積累的分析研判經(jīng)驗(yàn),通過對(duì)技戰(zhàn)法的專業(yè)建模,實(shí)現(xiàn)了對(duì)平臺(tái)地址結(jié)構(gòu)的自動(dòng)化挖掘,以點(diǎn)帶面,進(jìn)而找到平臺(tái)資產(chǎn)的流轉(zhuǎn)情況、沉淀資產(chǎn)的藏匿之處。同時(shí),根據(jù)所挖掘出來的充提幣地址以及平臺(tái)的大地址,快速掌握對(duì)應(yīng)平臺(tái)的涉案人數(shù)以及案件金額等情況。
接下來再簡(jiǎn)單介紹一下鏈上大師的業(yè)務(wù)。結(jié)合OKLink蜂巢架構(gòu)的核心底層技術(shù),基于插拔式架構(gòu)的擴(kuò)展,利用OLAP數(shù)據(jù)庫進(jìn)行離線+實(shí)時(shí)分析,使用預(yù)計(jì)算方案,滿足鏈上數(shù)據(jù)全方位的多維度指標(biāo)輸出。鏈上大師能提供以下功能:一是數(shù)據(jù)監(jiān)控,第一時(shí)間獲悉數(shù)據(jù)異動(dòng),及時(shí)掌握市場(chǎng)變化;二是借助組合式工具包,用戶可進(jìn)行多組數(shù)據(jù)復(fù)合對(duì)比分析,DIY指標(biāo)和數(shù)據(jù)看板;三是導(dǎo)航+搜索+篩選,方便快捷查找所需數(shù)據(jù)指標(biāo)、精準(zhǔn)定位時(shí)間周期;四是自定義看板,將個(gè)人常用指標(biāo)添加收藏、方便查看,滿足用戶的差異化需求。
以上就是我對(duì)區(qū)塊鏈大數(shù)據(jù)的思考和探索,希望能對(duì)大家有所幫助!謝謝!
在本次MetaCon元宇宙技術(shù)大會(huì)上,還有很多專家學(xué)者也做了相關(guān)主題演講,點(diǎn)擊進(jìn)入??官網(wǎng)??,了解更多元宇宙技術(shù)精彩內(nèi)容!