成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

第2期:非結(jié)構(gòu)化數(shù)據(jù)分析技術(shù)是忽悠

企業(yè)動(dòng)態(tài)
大數(shù)據(jù)概念興起的同時(shí)也帶熱了非結(jié)構(gòu)化數(shù)據(jù)分析。傳說(shuō)一個(gè)企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),如果按占據(jù)空間來(lái)算,這個(gè)比例大體不假,畢竟音視頻這類(lèi)數(shù)據(jù)真地很大。有這么大的數(shù)據(jù)量,需要進(jìn)行分析是很自然的事了,而要分析當(dāng)然就要有相應(yīng)的技術(shù)手段了。

大數(shù)據(jù)概念興起的同時(shí)也帶熱了非結(jié)構(gòu)化數(shù)據(jù)分析。傳說(shuō)一個(gè)企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),如果按占據(jù)空間來(lái)算,這個(gè)比例大體不假,畢竟音視頻這類(lèi)數(shù)據(jù)真地很大。有這么大的數(shù)據(jù)量,需要進(jìn)行分析是很自然的事了,而要分析當(dāng)然就要有相應(yīng)的技術(shù)手段了。

那為什么說(shuō)非結(jié)構(gòu)化數(shù)據(jù)分析技術(shù)是忽悠呢?

不存在通用的非結(jié)構(gòu)化數(shù)據(jù)計(jì)算技術(shù)

非結(jié)構(gòu)化數(shù)據(jù)五花八門(mén),有聲音圖像、文本網(wǎng)頁(yè)、辦公文檔、設(shè)備日志、….;每類(lèi)數(shù)據(jù)的都有各自的計(jì)算處理手段,比如語(yǔ)音識(shí)別、圖像比對(duì)、文本搜索、圖結(jié)構(gòu)計(jì)算等等,但是并不存在一種適用于所有非結(jié)構(gòu)化數(shù)據(jù)的通用計(jì)算技術(shù)。語(yǔ)音識(shí)別的方法不能用于圖像比對(duì)、文本搜索和圖結(jié)構(gòu)計(jì)算也扯不上關(guān)系。

一個(gè)廠商如果擅長(zhǎng)某種技術(shù),那一定會(huì)直接宣稱(chēng)自己專(zhuān)業(yè)于該領(lǐng)域,而不會(huì)泛泛地說(shuō)自己精于非結(jié)構(gòu)化數(shù)據(jù)分析。比如人臉識(shí)別做得非常精準(zhǔn)、或是文本敏感詞挖掘的專(zhuān)業(yè)公司,顯然這樣更容易定位用戶(hù)和應(yīng)用場(chǎng)景。如果一家公司只說(shuō)自己擅長(zhǎng)非結(jié)構(gòu)化數(shù)據(jù)分析而不指明具體的領(lǐng)域,那就不知道到底能做些什么了。

面向非結(jié)構(gòu)化數(shù)據(jù)的通用技術(shù)只是存儲(chǔ)

雖然許多專(zhuān)業(yè)技術(shù)領(lǐng)域都可以歸類(lèi)為對(duì)非結(jié)構(gòu)化數(shù)據(jù)的處理,但總體應(yīng)用范圍并不廣泛,大多數(shù)用戶(hù)還用不上這些專(zhuān)門(mén)技術(shù),而只是需要把這些數(shù)據(jù)存儲(chǔ)下來(lái)。非結(jié)構(gòu)化數(shù)據(jù)沒(méi)有通用的分析計(jì)算技術(shù),但存儲(chǔ)和相應(yīng)的管理(增刪檢索等)是可以通用化的。非結(jié)構(gòu)化數(shù)據(jù)占據(jù)的空間較大,經(jīng)常需要不同于結(jié)構(gòu)化數(shù)據(jù)的特殊存儲(chǔ)手段。

不過(guò),如果不是數(shù)據(jù)量特別大,或者有高并發(fā)的檢索需求,大多數(shù)的網(wǎng)絡(luò)文件系統(tǒng)(如HDFS)已經(jīng)能夠勝任存儲(chǔ)和訪問(wèn)需求。廠家如果只喊能做非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和基本管理,那會(huì)顯得沒(méi)什么技術(shù)含量。所以這些廠商會(huì)不遺余力地往分析上靠,但沒(méi)有實(shí)質(zhì)東西。而能提供大容量高性能的訪問(wèn)的專(zhuān)業(yè)存儲(chǔ)廠商卻只會(huì)喊存儲(chǔ),而不會(huì)刻意提及分析。

通用分析技術(shù)在于相伴產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)

采集非結(jié)構(gòu)化數(shù)據(jù)的同時(shí),常常會(huì)伴隨著采集許多相關(guān)的結(jié)構(gòu)化數(shù)據(jù),比如音視頻的制作人、制作時(shí)間、所屬類(lèi)別、時(shí)長(zhǎng)、…;有些非結(jié)構(gòu)化數(shù)據(jù)經(jīng)過(guò)處理后也會(huì)轉(zhuǎn)變成結(jié)構(gòu)化數(shù)據(jù),比如網(wǎng)頁(yè)日志中拆解出訪問(wèn)人IP、訪問(wèn)時(shí)刻、關(guān)鍵搜索詞等。所謂的非結(jié)構(gòu)化數(shù)據(jù)分析,經(jīng)常實(shí)際上是針對(duì)這些伴生而出的結(jié)構(gòu)化數(shù)據(jù),這個(gè)領(lǐng)域有不少較為成熟的通用計(jì)算技術(shù)(比如關(guān)系代數(shù)和關(guān)系數(shù)據(jù)庫(kù))。

但現(xiàn)在只喊結(jié)構(gòu)化數(shù)據(jù)顯得不夠時(shí)髦,為了吸引用戶(hù),就要把本質(zhì)上的結(jié)構(gòu)化數(shù)據(jù)分析說(shuō)成是非結(jié)構(gòu)化數(shù)據(jù)分析了。

作為需求方的用戶(hù),這時(shí)候需要清楚地知道到底要對(duì)這些數(shù)據(jù)做什么處理。如果只是簡(jiǎn)單存儲(chǔ),那上個(gè)HDFS這類(lèi)開(kāi)源網(wǎng)絡(luò)文件系統(tǒng)就夠了;如果有高性能訪問(wèn)需求,那要找專(zhuān)業(yè)的存儲(chǔ)廠商;如果其實(shí)要分析的是伴生出來(lái)的結(jié)構(gòu)化數(shù)據(jù),那就是已經(jīng)熟悉的數(shù)據(jù)庫(kù)類(lèi)業(yè)務(wù)了;如果真有特定的處理需求,那也是找專(zhuān)門(mén)領(lǐng)域的廠商和技術(shù)。總之,不要泛泛地只說(shuō)需要非結(jié)構(gòu)化數(shù)據(jù)分析。

責(zé)任編輯:杜寧 來(lái)源: 51CTO專(zhuān)欄
相關(guān)推薦

2018-04-03 14:00:03

結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)庫(kù)

2021-12-12 08:37:18

結(jié)構(gòu)化數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)

2024-05-27 00:32:45

2015-09-21 09:33:47

大數(shù)據(jù)數(shù)據(jù)分析

2017-11-16 05:22:34

非結(jié)構(gòu)化數(shù)據(jù)分析數(shù)據(jù)

2023-05-11 13:39:39

EDA數(shù)據(jù)分析

2014-02-09 09:53:05

2014-07-14 13:54:57

IT技術(shù)周刊

2019-07-13 15:00:17

結(jié)構(gòu)化SQLNOSQL數(shù)據(jù)庫(kù)

2009-02-16 15:41:04

非結(jié)構(gòu)化數(shù)據(jù)SQL Server SQL Server

2019-10-18 13:07:14

PB數(shù)據(jù)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)集

2018-05-14 12:30:49

數(shù)據(jù)備份非結(jié)構(gòu)

2025-06-05 01:22:00

2009-11-13 19:57:25

IBM業(yè)務(wù)分析非結(jié)構(gòu)化

2020-05-21 11:11:58

存儲(chǔ)數(shù)據(jù)技術(shù)

2023-12-25 15:00:18

結(jié)構(gòu)化布線光纖

2024-05-10 12:52:01

2009-10-21 15:20:28

結(jié)構(gòu)化布線技術(shù)

2022-01-14 12:56:38

非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)管理IT領(lǐng)導(dǎo)者
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 欧美综合国产精品久久丁香 | 久久精品亚洲欧美日韩久久 | 成人av观看 | 在线视频 欧美日韩 | 国产精品一区网站 | 久久久久久免费免费 | 国产不卡一 | 国产精品久久久久久久岛一牛影视 | 久草视频在线播放 | 欧美一级黄色免费看 | 国产精品v | 九九免费视频 | 国产精品美女久久久久久久久久久 | 免费av手机在线观看 | 羞羞在线观看视频 | 久久99视频这里只有精品 | 国产性网 | 欧美成人精品一区二区三区 | 一区二区免费在线 | 精品欧美一区二区三区久久久 | 亚洲精品乱码久久久久久按摩观 | 97精品超碰一区二区三区 | 国产一区二区三区 | 国产不卡一区在线观看 | 成人激情视频在线播放 | 91精品国产91久久综合桃花 | 性高湖久久久久久久久 | 国产高清视频一区二区 | 97超碰在线播放 | 色婷婷av久久久久久久 | 91亚洲国产成人久久精品网站 | 日韩精品久久一区二区三区 | 99精品一区二区三区 | 久久国产精99精产国高潮 | 一区二区三区视频在线 | 99色在线视频 | 草草网 | 欧美视频精品 | 综合二区 | 欧美综合一区 | 欧美日韩亚洲系列 |