成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

常用大數據術語一覽表

譯文
大數據
大數據有許多新術語,有時不好理解。因此,我們列出了一份大數據術語表,以便大家深入了解。

[[170734]]

 大數據有許多新術語,有時不好理解。因此,我們列出了一份大數據術語表,以便大家深入了解。當然,這份大數據術語表并不是百分之分全面,要是你認為遺漏了什么術語,請告知我們。

A

聚合-搜索、收集和顯示數據的過程。

算法-可以對數據執行某種分析的數學公式。

分析―發現數據蘊含的洞察力。

異常檢測-搜索數據集中與預測模式或預期行為不匹配的數據項。異常又叫outlier、exception、surprise或 contaminant,它們常常提供了關鍵的、可付諸行動的信息。

匿名化-使數據匿名,即移除可能表明個人身份的所有數據點。

應用程序-讓計算機能夠執行某項任務的計算機軟件。

人工智能-研發智能機器和軟件,它們能夠感知周圍環境,并且在需要時采取相應的動作,甚至從那些動作中學習。

B

行為分析-這種分析可以表明如何、為何和什么,而不是僅僅表明是誰和何時。它可分析數據中的人性化模式。

大數據科學家-能夠開發解讀大數據的算法的人。

大數據初創公司―開發新穎大數據技術的新興公司。

生物特征識別-根據人的生物特征來識別人的身份。

波字節(BB)-約等于1000堯字節,相當于未來數字化宇宙的大小。1波字節有27個0!

商業智能-讓數據易于理解的一套理論、方法和過程。

C

分類分析-從數據獲取重要相關信息的系統化過程,又叫元數據,即描述數據的數據。

云計算-網絡上用于異地存儲數據的分布式計算系統。

聚類分析-識別彼此相似的對象并聚集成類的過程,以便了解數據里面的相似之處和不同之處。

冷數據存儲-將很少使用的舊數據存儲在低功耗服務器上。檢索數據耗時較長。

對比分析-它確保采用逐步的比較和計算過程,以便發現非常大的數據集里面的模式。

復雜的結構化數據-由兩個或多個復雜的關聯部分組成的數據,它們不容易被結構化查詢語言和工具來解析。

計算機生成的數據-計算機生成的數據,比如日志文件。

并發-同時運行或執行多個任務或進程。

關聯分析-分析數據,以便確定變量之間的關系,確定這種關系是負關系(-1.00)還是正關系(+1.00)。

客戶關系管理(CRM)-管理銷售和業務流程,大數據會影響CRM策略。

D

儀表板-使用圖形化顯示算法執行的分析的工具。

數據聚合工具-將分散于眾多數據源的數據轉化成單一新數據源的過程。

數據分析員-分析、建模、清理或處理數據的人員。

數據庫-數據通過某種技術存儲起來的數字化集合。

數據庫即服務-托管在云端的數據庫,按使用量付費,比如亞馬遜網絡服務(AWS)。

數據庫管理系統(DBMS)-收集和存儲數據,并提供數據訪問。

數據中心-放置用來存儲數據的服務器的實際場地。

數據清洗-審查和修訂數據的過程,以便刪除重復數據、糾正錯誤,并提供一致性。

數據管理員-負責數據存儲所需技術環境的人員。

數據道德準則-幫助企業組織在數據方面做到透明的準則,確保簡潔性、安全性和隱私性。

數據源-一種數據流,比如推特數據源或RSS。

數據市場-進行數據集買賣的在線環境。

數據挖掘-從數據集中找到某些模式或信息的過程。

數據建模-使用數據建模技術來分析數據對象,從數據獲得洞察力。

數據集-數據集合。

數據虛擬化-數據整合過程,以便獲得更多的洞察力。它通常涉及數據庫、應用程序、文件系統、網站和大數據技術等等。

去身份識別-跟匿名化一樣;確保無法通過數據來識別人員身份。

判別分析-對數據分類;將數據分成不同的群組或類別。數據中的某些群組或聚類事先已知的情況下使用統計分析,利用該信息生成分類規則。

分布式文件系統-提供一種簡化的、高可用的方法來存儲、分析和處理數據的系統。

文件存儲數據庫-一種為了存儲、管理和檢索文檔而專門設計的一種面向文檔的數據庫,又叫半結構化數據。

E

探索性分析-不用標準的程序或方法,找到數據里面的模式。這是發現數據、找到數據集主要特點的一種方法。

艾字節(EB)-約等于1000拍字節或10億吉字節。如今全球每天生成的新信息量約為1艾字節。

提取、轉換和加載(ETL)-這是數據庫和數據倉庫的一種方法,從各個數據源提取數據,轉換數據,以適合業務運營要求,最后加載到數據庫。

F

故障切換-萬一某個服務器或節點發生故障,自動切換到另一個不同的服務器或節點。

容錯設計-即便某些部件發生故障,也能繼續正常運行的特別設計的系統。

G

游戲化-在非游戲環境下使用游戲元素;它對于生成數據非常有用,因而被稱為是友好地搜索大數據。

圖形數據庫-使用圖形結構(比如一組有限的有序對或某些實體),使用邊緣、屬性和節點用于數據存儲。它提供了無索引的相鄰性,這意味著每個元素與相鄰元素直接聯系起來。

網格計算-常常通過云,將諸多地方的不同計算機系統連接起來,以實現某個共同的目標。

H

Hadoop-為了能夠跨分布式文件系統處理和存儲大數據而構建的一種開源框架。

HBase-這是與Hadoop一起運行的開源非關系型分布式數據庫。

HDFS-Hadoop分布式文件系統,這是一種旨在可以在商用硬件上運行的分布式文件系統。

高性能計算-使用超級計算機解決極其復雜的高級計算問題。

I

內存中-數據庫管理系統將數據存儲在主內存上,而不是存儲在磁盤上,因而處理、存儲和加載數據的速度很快。

物聯網-隨時隨地通過傳感器連接到互聯網的普通設備。

J

數據法規遵從-如果你使用云計算解決方案,如果數據存儲在不同的國家或不同的大陸,這個概念就很重要。要注意,存儲在不同國家的數據必須遵守該國法律。

K

鍵值數據庫-這種數據庫用主鍵來存儲數據,這種使用獨特識別方式的記錄讓數據查找起來方便又快捷。鍵值數據庫中存儲的數據通常是編程語言的某種基本數據。

L

延遲-衡量系統的延遲時間。

遺留系統―不再得到支持的舊的應用程序、技術或計算機系統。

負載均衡-將工作負載分配到多臺計算機或服務器上,以便獲得最優結果、系統利用率最大化。

位置數據-描述地理位置的GPS數據。

日志文件-計算機自動生成的文件,記錄系統運行過程中發生的事件。

M

機器對機器(M2M)-彼此通信的兩個或多個機器。

機器數據-機器通過傳感器或算法生成的數據。

機器學習-人工智能的一部分,機器從當前執行的任務中進行學習,不斷變得更完善。

MapReduce-處理大量數據的一種軟件框架。

大規模并行處理(MPP)-使用許多不同的處理器(或計算機),同時執行某些計算任務。

元數據-描述數據的數據;提供了數據關于什么方面的信息。

MongoDB-一種開源NoSQL數據庫。

多維數據庫-針對數據聯機分析處理(OLAP)應用和數據倉庫而進行優化的一種數據庫。

多值數據庫-這是一種NoSQL和多維數據庫,可直接理解3個維度的數據。它們主要是龐大字符串,最適合直接處理HTML和XML字符串。

N

自然語言處理-計算機科學的一個分支領域,研究計算機與人類語言之間的交互。

網絡分析-從網絡或圖論方面分析節點之間的關系,意味著分析網絡中節點之間的關系和層次強度。

NewSQL-一種優雅的、明確定義的數據庫系統,比SQL更容易學習、更出色。它還NoSQL還要新穎。

NoSQL-有時候被稱為“Not only SQL”,因為這種數據庫并不遵守傳統的關系數據庫結構。它具有更強的一致性,能實現更高的可用性和和橫向擴展。

O

對象數據庫-它們以對象的形式來存儲數據,被面向對象的編程所使用。它們不同于關系數據庫和圖形數據庫,大多數對象數據庫提供一種查詢語言,允許使用聲明式編程方法來發現對象。

基于對象的圖像分析-可結合來自單個像素的數據來分析數字化圖像,而基于對象的圖像分析使用來自一組相關像素(名為對象或圖像對象)的數據。

操作型數據庫-這類數據庫可以執行企業組織的常規操作,對業務來說通常非常重要。它們一般使用聯機事務處理方法,因而可以輸入、收集和檢索關于公司的特定信息。

優化分析-產品設計周期過程中算法進行的優化過程。它讓公司可以設計某個產品的許多不同版本,并且對照預設變量來測試該產品。

本體-本體將知識作為某個領域里面的一組概念和那些概念之間的關系來表示。

異常值檢測-異常值是嚴重偏離某個數據集或數據組合里面的普通平均值的對象。其數值與其他數據相差甚遠,因而異常值表明出現了某種異常情況,因而通常需要另外的分析。

P

模式識別-通過算法來識別數據中的模式,從而預測來自同一數據源的新數據。

拍字節(PB)-約等于1000太字節或100萬吉字節。歐洲核子研究中心(CERN)大型強子對撞機每秒生成約1拍字節的數據。

平臺即服務(PaaS)-為云計算解決方案提供所有必要基礎設施的一種服務。

預測分析-最有價值的大數據分析方法,因為這種方法有助于預測某人可能會購買什么商品、訪問什么網站、做什么事情,或者某人在近期有怎樣的行為。它使用眾多不同的數據集,比如歷史數據、事務數據、社交數據或者客戶概況數據,以識別風險和機遇。

隱私-將關于個人的某些私密數據/信息隔離起來。

公共數據-由公共基金創建的公共信息或數據集。

Q

量化自我―使用應用程序跟蹤用戶在一天當中的舉動,以便更好地了解某人的行為。

查詢-請求回答某個問題的信息。

R

再識別-合并幾個數據集,從匿名化數據當中找到某個人。

回歸分析-確定兩個變量之間的依賴關系。它假設一個變量到另一個變量的響應之間存在單向的因果關系。

射頻識別(RFID)--使用無線非接觸式射頻電磁場來傳輸數據的一種傳感器。

實時數據-在幾毫秒內被創建、處理、存儲、分析并顯示的數據。

推薦引擎-根據之前的購買行為或其他人的購買行為推薦某些產品的一種算法。

路徑分析-針對某種傳輸途徑,使用許多不同的變量,找到經過優化的路徑,以便降低燃料成本,提高效率。

S

半結構化數據-不像結構化數據那樣擁有正規結構的一種結構化數據。然而,它確實有標簽或其他標記來保證數據的層次結構。

情感分析-使用算法來了解人們對某些話題有怎樣的看法。

信號分析-它是指分析時間變化或空間變化的物理量的度量,從而分析產品的性能。尤其與傳感器數據結合使用。

相似性搜索-查找與數據庫中的查詢對象最相似的對象,這里的數據對象可以是任何類型的數據。

模擬分析-模擬是指模仿現實世界流程或系統的操作。模擬分析可以考慮許多不同的變量,有助于產品性能達到最優。

智能網格-指使用能源網絡里面的傳感器實時監控運行狀況,有助于提高效率。

軟件即服務(SaaS)-通過瀏覽器來使用的一種應用軟件。

空間分析-指分析地理數據或拓撲數據之類的空間數據,從而識別并了解分布在地理空間的數據當中的模式和規律。

SQL--從關系型數據庫檢索數據的一種編程語言。

結構化數據-用行列結構加以組織即可識別的數據。數據駐留在記錄或文件里面的固定字段,或者數據在正確標記后,可以準確地識別出來。

T

太字節(TB)-約等于1000吉字節。1太字節可以存儲多達300個小時的高清視頻。

時間序列分析-分析通過重復的時間測量獲得的明確定義的數據。數據必須加以明確定義,并按同樣時間間隔的連續時間點來加以測量。

拓撲數據分析-專注于復雜數據的形狀,并識別聚類和數據里面存在的任何統計意義。

事務型數據-隨時間變化的動態數據。

透明性-消費者想要知道數據出現了什么情況,企業組織一定要在這方面做到透明。

U

非結構化數據-非結構化數據被認為是含有大量普通文本的數據,但也可能包含日期、數字和事實。

V

價值-所有的可用數據將為企業、社會和消費者創造巨大價值。大數據意味著大商機,各行各業將從大數據獲益。

可變性-它是指數據含義會(迅速)變化。比如在幾乎一樣的推特消息中,某個詞可能有著完全不同的意思。

種類-如今的數據有許多不同格式:結構化數據、半結構化數據、非結構化數據,甚至復雜的結構化數據。

速度-創建、存儲、分析和顯示數據的速度。

真實性-企業組織需要確保數據正確,還要確保針對數據執行的分析正確。真實性指數據的正確性。

可視化-只有正確的可視化,原始數據才可利用起來。當然,可視化并不是指普通的圖型或餅圖。它們指包括可能許多數據變量,同時仍保持容易理解和閱讀的復雜圖形。

體量-指數據量,從兆字節到波字節不等。

W

氣象數據-一種重要的開放公共數據源,如果與其他數據源結合起來,可以為企業組織提供豐富的洞察力。

X

XML數據庫-XML數據庫讓數據可以以XML格式存儲起來。XML數據庫常常與面向文檔的數據庫聯系起來。XML數據庫里面存儲的數據可加以查詢、導出并序列化成所需的任何格式。

Y

堯字節(YB)-約等于1000澤字節,相當于250萬億張DVD的數據量。現今,整個數字化世界的數據量為1堯字節,這個數據量每18個月將會翻番。

Z

澤字節(ZB)-約等于1000艾字節,或10太字節。預計2016年每天超過1澤字節的數據會在全球各地的網絡上傳輸。

責任編輯:趙立京 來源: 51CTO
相關推薦

2010-09-01 15:24:23

員工

2011-12-16 09:24:53

JavaSpring開源框架

2011-03-23 09:53:16

Firefox 4改進

2014-08-11 11:19:53

Java虛擬機Java

2018-09-12 22:18:06

2009-12-03 16:45:05

回收華為路由器

2010-04-07 11:44:40

Ubuntu 10.1

2011-04-27 14:23:48

PHPPython

2011-04-18 09:55:24

Windows Ser

2013-07-04 11:06:13

IBM亞馬遜甲骨文

2009-09-01 13:33:44

雪豹蘋果操作系統

2025-03-10 03:25:00

2012-08-31 10:09:14

Windows 8

2016-01-07 13:19:21

大數據分析生態圈

2021-12-08 13:20:39

Bean拷貝工具Java

2018-10-26 17:24:31

人工智能985高校學院

2010-10-14 16:55:00

MySQL聯結查詢

2017-03-06 16:34:12

虛擬個人助理

2009-03-03 20:44:06

桌面虛擬化Xendesktop虛擬化

2020-02-17 15:29:00

石墨文檔
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲精品视频在线看 | 国产精品久久久久久久久图文区 | 999久久久免费精品国产 | k8久久久一区二区三区 | 欧美激情区 | 国产一级特黄aaa大片评分 | 日韩精品视频在线 | 成人精品一区二区三区 | 在线国产小视频 | 天天操天天射综合网 | 黄色免费av| 谁有毛片 | 自拍视频在线观看 | 久久精品国产一区 | 中文字幕一区二区三区乱码在线 | av一区在线 | 中文字幕影院 | 国产九九九 | 羞羞免费网站 | 日本一区二区在线视频 | 91精品国产91久久久久久 | 91精品中文字幕一区二区三区 | 丁香六月激情 | 精品欧美一区二区精品久久久 | 国产成人精品久久二区二区91 | 久久精品99 | 亚洲一区三区在线观看 | 欧美a级网站| 国产精品国产精品国产专区不卡 | 精品一区二区三区四区五区 | 色综合色综合色综合 | 久久久久国产一区二区三区 | 国产精品国产精品国产专区不卡 | 精品电影| 99视频入口 | 精品一区二区三区在线视频 | 成人一区二区视频 | 欧美午夜精品理论片a级按摩 | 久久噜噜噜精品国产亚洲综合 | 国产激情在线 | 欧美激情一区二区 |