成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

實時分析需要SQL和復雜查詢

數據庫 SQL Server
今天的數據驅動型企業不僅需要針對實時數據作出快速響應要,而且還必須執行復雜的查詢以解決復雜的業務問題。

?今天的數據驅動型企業不僅需要針對實時數據作出快速響應要,而且還必須執行復雜的查詢以解決復雜的業務問題。

例如,客戶個性化系統需要將歷史數據集與實時數據流結合起來,以便立即向客戶提供最相關的產品建議。提供關鍵任務的實時業務觀察能力的運營分析系統也必須如此,例如,在線支付供應商需要監測其全球范圍內的交易,以發現可能預示金融欺詐的異常情況。

或者想象一個網上學習平臺需要為學區客戶和內部客戶團隊提供關于學生和教師使用情況的最新洞察力?;蛘呤且粋€市場新聞供應商,需要監測并確保其金融客戶在狹窄的窗口內獲得準確的、相關的更新,以實現盈利的交易。

NoSQL的局限性

SQL支持復雜的查詢,因為它是一種非常具有表現力的。 是成熟的語言。復雜的SQL查詢在商業智能(BI)中早已司空見慣。而當Hadoop和Hive這樣的系統出現時,它首次將復雜的查詢與大數據結合起來。Hive在Hadoop的本地MapReduce編程范式上實現了一個SQL層。這些第一代基于SQL的大數據系統的代價是,它們以更高的查詢延遲為代價,提高了數據處理的吞吐量。因此,這些使用案例仍然是運行在批處理模式中。

當NoSQL數據庫(如鍵值和文檔存儲)出現時,情況發生了變化。設計目標是低延遲和規?!,F在,公司可以把一個龐大的數據集,組織成簡單的鍵值或文檔對,并立即執行查找和其他簡單的查詢。這些大規模、可擴展的鍵值存儲或文檔數據庫的設計者決定,只有當查詢性質簡單時,規模和速度才有可能。在鍵值存儲中查找一個值,可以做到快如閃電。相比之下,SQL查詢,由于過濾器、排序和聚合的固有復雜性,在技術上太有挑戰性,無法在大量數據上快速執行。

不要注意那個幕后的人

不幸的是,由于上述原因,當查詢復雜、嵌套且必須返回精確答案時,NoSQL數據庫往往會遇到問題。這故意不是他們的強項。他們的查詢語言,無論是類似SQL的變體,如 CQL (Cassandra)和Druid SQL等類似SQL的變體,還是MQL(MongoDB)等完全自定義的語言,都不支持連接和其他復雜的查詢命令。

NoSQL數據庫的供應商就像綠野仙蹤一樣,用煙霧和鏡子分散你的注意力,高談闊論狹義的速度定義,這樣你就不會注意到NoSQL數據庫在實時分析方面的實際弱點。使用NoSQL數據庫的開發人員最終被迫將Join和其他數據邏輯嵌入到他們自己的應用程序代碼中--從單獨的表中獲取數據到進行連接優化和其他分析工作的一切。

雖然走NoSQL的道路是可能的,但它是繁瑣和緩慢的。以一個申請抵押貸款的人為例。為了分析他們的信用度,你會創建一個數據應用來計算數據,比如這個人的信用歷史、未償貸款和還款歷史。要做到這一點,你需要結合幾個數據表格,其中一些可能是歸一化的,哪些數據是真實的,哪些是不真實的。你還可能分析當前和歷史上的抵押貸款利率,以確定提供什么利率。

使用SQL,你可以簡單地將信用記錄和貸款支付表連接在一起,并聚合大規模的歷史數據集,如每日抵押貸款利率。然而,使用像Python或Java這樣的東西來手動重新創建連接和聚合,與SQL相比,你的應用程序中的代碼行數會增加幾十甚至一百。

更多的應用程序代碼不僅需要更多的時間來創建,而且幾乎總是導致更慢的查詢。如果不能使用基于SQL的查詢優化器,加速查詢是很困難和費時的,因為應用程序中的業務邏輯和應用程序使用的基于查詢的數據訪問路徑之間沒有分界。像一個普通的東西 join table一樣的東西,SQL可以有效而優雅地處理,但在其他語言中卻可能成為一個臃腫的內存占用者。

最后,用應用程序代碼編寫的查詢也是比較脆弱的,需要不斷的維護和測試,如果數據量發生變化,還可能需要重寫。而大多數開發人員缺乏時間和專業知識來進行這種持續的維護。

只有一個NoSQL系統我認為可以合理地勝任復雜的查詢。GraphQL。GraphQL系統可以將數據類型與特定的數據字段聯系起來,并提供函數來檢索文檔的選定字段。它的查詢API支持復雜的操作,例如根據一組匹配字段過濾文檔,并有選擇地從匹配的文檔中返回字段的子集。GraphQL的主要分析缺陷是它缺乏表達能力,無法根據兩個不同的數據集中特定字段的值來連接這兩個數據集。大多數分析性查詢需要這種能力,以便在查詢時連接多個數據源。

為工作選擇最佳工具--SQL

在技術和生活中,每項工作都有一個為其設計的最佳工具。對于復雜的分析查詢,SQL無疑是最好的工具。SQL擁有半個世紀以來開發的豐富的強大命令集。創建查詢很容易,調整和優化查詢更容易,以加快結果,縮小中間表,降低查詢成本。

有一些關于SQL數據庫的神話,但它們是基于1990年代的傳統關系型系統。事實是,現代云原生SQL數據庫支持實時分析所有必要的關鍵功能,包括。

  • 可變數據,以實現令人難以置信的快速數據攝取和對晚到事件的順利處理。
  • 靈活的模式Schema,可以根據傳入的流媒體數據的結構自動調整。
  • 即時擴大數據寫入或查詢的規模,以處理突發的數據。

SQL仍然非常流行,在所有編程語言中排名最靠前。正如我們所看到的,它支持復雜的查詢,這是現代實時數據分析的一個要求。相比之下,NoSQL數據庫在執行連接和其他復雜的查詢命令方面比較弱。此外,尋找一個不太知名的自定義查詢語言的專家可能會很費時和昂貴。

底線是,你將沒有問題找到熟練的數據工程師和數據運營人員,他們知道SQL及其復雜查詢的能力。他們將能夠利用這些知識和能力,推動你的組織從批量分析到實時分析的飛躍。?

責任編輯:華軒 來源: 今日頭條
相關推薦

2024-06-03 08:26:35

2016-08-31 14:41:31

大數據實時分析算法分類

2022-07-14 08:20:34

數據庫NoSQL

2019-08-19 14:24:39

數據分析Spark操作

2016-06-13 14:38:46

開源Skydive

2016-09-17 00:12:46

2016-10-31 19:19:20

實時分析

2016-11-29 09:27:22

Apache SparDashboard構建

2020-05-15 10:28:04

實時分析客戶需求CIO

2018-09-19 10:01:39

MSSQL列存儲實時分析

2023-10-31 15:40:12

2021-06-07 10:20:26

實時分析IT領導者CIO

2012-02-21 10:25:35

SAPHANA實時分析

2014-01-22 11:22:44

華為HANA一體機FusionCube大數據分析

2020-04-08 12:03:16

PyFlinkCDN日志

2013-10-12 16:49:04

SAP

2016-11-09 15:23:44

2024-06-06 08:58:08

大數據SQLAPI

2024-06-04 14:10:00

FlinkSQL窗口大數據

2014-08-05 09:27:10

Oracle數據庫Oracle Data
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 久久精品综合 | 久久精品国产99国产 | 精品www | 又爽又黄axxx片免费观看 | 拍真实国产伦偷精品 | 九九热精品在线视频 | 欧美三区| 国产成人99久久亚洲综合精品 | 亚洲精品在线免费看 | 日韩精品免费一区二区在线观看 | 日韩一区中文字幕 | 免费一级淫片aaa片毛片a级 | 伊人狠狠干 | 一区二区三区四区在线视频 | 精品久久久999 | 久久国产精品视频 | 精品伊人久久 | 最新国产精品视频 | 一区二区在线不卡 | 91一区二区三区 | 日韩超碰| 国产精品永久免费观看 | 五月激情综合 | 亚洲国产一区视频 | 欧美激情国产精品 | 久久久蜜桃一区二区人 | 999久久久久久久久6666 | 午夜av在线 | 国产目拍亚洲精品99久久精品 | 国产精品久久久久久久久久 | 欧美网址在线观看 | 国产精品久久久久久久久久久久 | 欧美h版 | 亚洲视频免费在线观看 | 在线欧美视频 | 国产精品一区二区三区久久久 | 精品欧美一区二区三区久久久 | 精品视频999 | 国产区在线观看 | 黄色毛片视频 | 一区二区三区国产在线观看 |