成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

入門級大數據分析:Google BigQuery

云計算
BigQuery減少了分析大型數據集面臨的一些實現挑戰。價格模型促進了統計分析技能的發掘,因此可以從數據樣品中導出有用的信息,而不是針對全部數據集進行蠻力分析。

大數據項目挺嚇人的,尤其是如果包含了設置和管理Hadoop集群。如果你更習慣于SQL,而不是MapReduce,但是發現關系型數據庫不符合分析需求,Google BigQuery值得一看。Google BigQuery提供了大數據分析入門級方法。

BigQuery減少了分析大型數據集面臨的一些實現挑戰。價格模型促進了統計分析技能的發掘,因此可以從數據樣品中導出有用的信息,而不是針對全部數據集進行蠻力分析。

有時,要用大數據工作意味著處理速度的精確。比如,如果想要確定操作同一網站的兩個不同的客戶群組是否不同,應該分析網站上與所有這些客戶活動相關每一個登錄日志。或者,可以取出一部分客戶子集樣例,分析這些樣例之間的不同。基礎統計提供了工具,可以幫助理解這種類型分析的錯誤率,只要錯誤在可接受范圍內,結果對于決策制定就是有效的。

在TOP功能中可以看到這種交換,通過grouping和sorting操作返回頂行發現。可能返回近似的結果,但是這個函數通常比使用“group by”、“order by”和“"limit”的組合語句更快速。

Google BigQuery操作特性

BigQuery旨在分析數十億行近似的數據,使用類SQL語法。它并不是完全符合SQL數據庫的替代,并不適用于交易處理應用。BigQuery支持分析交互風格。使用SELECT命令構建查詢,對于任何SQL開發者都應該很熟悉。

查詢語言包括支持標準操作,比如joining、sorting和grouping,以及內嵌數據結構。正如我們所期望的大數據分析服務,可以支持統計函數,比如count、sum、average、variance和standard deviation(標準偏差)。Grouping函數和描述性統計的結合相當直接的在兩個總體中比較平均數和變異數。

 

[[72025]]

 

入門級大數據分析:Google BigQuery

聯接是標準化數據模型必要的操作,但是計算昂貴。BigQuery函數中的JOIN運算符類似于SQL join,但是在聯接兩個表時,其中一個表必須是8MB或者壓縮到更小。這種類型的限制可以進行更加有效的聯接操作,因為更小的表可以有效高速緩存,聯接到更大的表。如果必須聯接兩個大型表,可以使用JOIN EACH操作,但是性能就會更慢。

可以使用簡單的瀏覽器界面同BigQuery進行交互操作。瀏覽器工具保留查詢歷史,提供了構造查詢的工作局域。這是一種基本的工具;并不具備SQL開發者工具中全面的功能,比如MySQL Workbench和DBVisualizer。也可以通過命令行界面工作。

Google BigQuery的價格模型

通過訪問Google的云資源,你可能想知道為什么你要為查詢樣例或者近似結果操心,畢竟,你可以在這個問題上投入更多的硬件不是嗎?對,你可以,但是BigQuery基于你分析了多少數據來收費。

Google的價格模型基于存儲和分析的數據總量。存儲費用是每月0.12GB美元。交互查詢為每處理1GB 0.035美元,包查詢費用為0.02美元/GB。為了限制處理的數據量,可以限制分析的行數,包括你實際需要結果的列。BigQuery使用柱狀數據存儲,因此并不是所有的行數據,在一個或者更多列查詢時回復。

數據存入BigQuery,使用負載工作,可以同Google Cloud Storage的數據工作,或者使用POST請求本地文件系統中的數據。文件可以格式化成為CSV或者JSON格式。壓縮文件限制到1GB,但是非壓縮文件能到1TB。負載工作包括多達一萬個文件,但是所有文件的大小總和不能超過1TB。由于每天每個表可以擁有多達1000個負載工作,這些定額對于大多數項目不見得有實際的影響。

關于作者

Dan Sullivan,理科碩士、作者、系統架構師兼咨詢師,用20多年IT經驗。他在高級分析、系統架構、數據庫設計、企業安全和商務智能方面很有威望。他熟悉很多產業,包括金融服務、制造業、制藥、軟件開發、政府、零售和教育。Dan撰寫文章涉及的范圍廣泛,包括數據倉庫、云計算和高級分析、安全管理、協作以及文本挖掘。

責任編輯:王程程 來源: TechTarget中國
相關推薦

2021-06-15 14:07:42

Google BigQ大數據大數據分析

2012-07-10 09:29:44

BigQuery

2012-05-03 10:48:43

Google大數據云計算

2015-11-13 10:06:27

數據科學大數據入門

2015-08-24 13:56:10

數據分析

2011-03-25 09:09:29

算法數據庫

2011-03-25 09:29:03

算法數據庫

2011-03-25 11:01:33

算法數據庫

2015-08-14 10:28:09

大數據

2010-06-23 10:55:10

FreeBSD入門級命

2010-09-13 13:58:17

HTML DOM

2010-09-08 12:45:16

2021-02-08 12:59:12

Git 控制系統

2015-08-11 15:52:52

大數據數據分析

2013-09-02 17:42:28

大數據分析FusionInsig華為

2021-10-12 15:25:08

大數據數據分析

2022-03-29 14:49:14

大數據數據分析

2015-07-23 09:34:57

大數據數據分析

2013-04-09 09:28:20

大數據大數據全球技術峰會

2021-11-11 11:27:55

大數據分析系統
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 中文区中文字幕免费看 | 国产乱码精品1区2区3区 | 国产亚洲精品精品国产亚洲综合 | 男女又爽又黄视频 | 日本韩国欧美在线观看 | 日韩国产在线 | 欧美日韩第一页 | 欧美一级视频免费看 | 超碰成人免费 | 一区二区成人 | 欧美一a一片一级一片 | 欧美一级特黄aaa大片在线观看 | 精品99久久久久久 | 黄色av网站在线观看 | 精品一区二区电影 | 日本精品久久 | 免费观看av | 在线视频一区二区三区 | 午夜影院污 | 五月激情婷婷在线 | av免费网址| 夜夜干夜夜操 | 久久久久国产一区二区三区 | 国产精品久久影院 | 国产成人艳妇aa视频在线 | 欧美日韩在线免费 | 日韩精品在线播放 | 日日噜 | 亚洲精品免费观看 | 中文字幕亚洲视频 | 久草热播 | 亚洲精品久久久久久久久久久 | 亚洲精品久 | 久草新视频 | 久久噜| 九九热精品在线视频 | 日韩视频精品在线 | 欧美一级在线观看 | 美女中文字幕视频 | 中文字幕av在线 | 欧美日韩黄色一级片 |