成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

聊聊一種讀取億級Doris數據庫的方法

數據庫 其他數據庫
如果數據量比較大,超過千萬,甚至過億,單節點讀取會遇到超時以及時效過低的問題。可以使用spark.read.jdbc分布式多節點并發讀取。spark讀取支持兩種方式。
  1. 工作中,常常需要將線上doris同步至集市。讀取doris數據同讀取常規mysql基本相同。如果數據行小于千萬,比較簡單的方式直接單節點連接、讀取和存儲。Python示例如下:
def get_data(sql,host='',port=2000,user='',password='',db=''):
    # 支持doris
    import pymysql
    connect = pymysql.connect(host=host,port=port,user=user,password=password,db=db,charset='utf8')
    cursor = connect.cursor()
    cursor.execute('SET query_timeout = 216000;') #單位秒
    cursor.execute(sql)
    result = cursor.fetchall()
    for row in result:
        pass # 存儲格式可以自行控制 
    cursor.close()
    connect.close()
    return result
  1. 如果數據量比較大,超過千萬,甚至過億,單節點讀取會遇到超時以及時效過低的問題??梢允褂胹park.read.jdbc分布式多節點并發讀取。spark讀取支持兩種方式。

主要參數介紹:

read.jdbc(url=url,table=remote_table,column='item_sku_id',numPartitions=50,lowerBound=lowerBound, upperBound=upperBound,properties=prop)

url:格式如'jdbc:mysql://**.jd.com:2000/數據庫名?useUnicode=true&characterEncoding=UTF-8&autoReconnect=true&failOverReadOnly=false&zeroDateTimeBehavior=convertToNull&useSSL=false&serverTimezone=Asia/Shanghai'

table:可以是表名,也可以是查詢sql(也即支持條件查詢),如果是sql,格式如"(SELECT count(*) sku FROM rule_price_result where dt='2023-05-10') AS tmp"

numPartitions:控制并發節點個數

lowerBound+upperBound和properties二選一,控制每個節點讀取的數據范圍。

lowerBound+upperBound方式:指定讀取最低和最高值,spark會結合分區個數和最低最高邊界機械做分割。

如果數據分布有傾斜,可以通過predicates列表自行控制范圍。

作者:京東零售 趙奇猛

來源:京東云開發者社區

責任編輯:武曉燕 來源: 今日頭條
相關推薦

2011-04-06 10:09:56

MySQL數據庫安裝

2018-09-27 16:15:10

區塊鏈數據庫

2012-03-14 11:46:30

ibmdw

2012-03-19 10:45:44

ibmdw

2021-06-11 00:11:23

GPS數據協議

2023-03-30 22:32:21

2018-12-14 14:30:12

安全檢測布式系測試

2011-07-04 17:53:48

快速測試

2023-01-06 08:31:53

數據庫基準測試

2023-01-26 00:18:53

云原生數據庫云資源

2021-10-28 19:28:04

數據庫開發Spring

2024-10-12 15:29:56

2022-09-23 07:44:48

時序數據庫物聯網

2020-05-19 17:07:09

Spark測試數據計算

2022-04-20 08:00:00

深度學習數據集Hub

2010-03-26 13:34:47

CentOS安裝

2019-12-31 14:21:00

數據挖掘關系網絡數據

2024-05-08 08:14:18

數據庫IO備份

2019-03-05 10:16:54

數據分區表SQLserver

2022-09-21 07:30:12

數據庫勒索病毒企業
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 日本一区二区三区四区 | 国产精品久久久久久久免费大片 | 国产97在线视频 | 四虎影院久久 | 亚洲精品电影网在线观看 | 成人在线视频观看 | 国产高清视频一区二区 | 亚洲嫩草| av影音资源 | 一本一道久久a久久精品综合蜜臀 | 一级片网址 | 亚洲视频中文字幕 | 久久三级av | 久久久亚洲成人 | 精品91久久 | 欧美日韩一区二区三区四区五区 | 色网站视频 | 久久久久久久久久久高潮一区二区 | 午夜久久久久 | 天堂va在线 | 国产精品一区二区三区久久久 | 欧美一区二区成人 | 欧美日韩亚洲一区 | 日本免费黄色一级片 | 欧美黄色免费网站 | 久久不卡 | 中文字幕加勒比 | 夜夜骑天天干 | 精品中文视频 | 黄色av网站在线免费观看 | a级毛片毛片免费观看久潮喷 | 久久精品小视频 | 欧美日韩久久精品 | 91久久久精品国产一区二区蜜臀 | 国产精品成人在线播放 | 亚洲一区二区三区四区五区午夜 | 91国语清晰打电话对白 | 日本精品裸体写真集在线观看 | 亚洲国产aⅴ精品一区二区 免费观看av | 人成精品| 国产美女在线观看 |