成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

性能提升 2000%!揭秘 MyBatis-Plus 批量插入的終極優化技巧

開發 前端
深入理解 rewriteBatchedStatements=true 參數的效用,再結合預先生成 ID、恰當的多線程實現方式以及數據庫參數調整等優化策略,我們成功地將 MyBatis-Plus 批量插入的性能大幅提升了 2000%。

1 前言

在當今互聯網高速發展的時代,高并發、大數據量的處理已成為各大企業應用的常態。作為 Java 開發者,我們常常面臨著如何提高數據庫操作效率的挑戰。MyBatis-Plus 作為一款優秀的 ORM 框架,為我們提供了簡潔高效的數據庫操作方式。然而,當涉及到大規模數據的批量插入時,即使使用了 saveBatch 方法,性能提升仍然有限。

本文將揭秘如何通過配置 rewriteBatchedStatements=true 和預先生成 ID 等優化策略,將 MyBatis-Plus 批量插入的性能提升 2000%,助力您的應用突破性能瓶頸!

2 背景:批量插入的性能挑戰

2.1 場景描述

在實際開發中,如考試系統、訂單處理、日志存儲等場景,經常需要批量插入大量數據。例如,在一個在線考試系統中,創建一份試卷需要插入多張表的數據:

  • 試卷表(exam):存儲試卷的基本信息。
  • 題目表(question):存儲題目信息。
  • 選項表(option):存儲題目下所有選項信息。

在保存試卷時,需要關聯保存試卷、題目以及題目選項,此時對于保存的性能就有較高的要求了。

2.2 性能瓶頸

  • 逐條插入效率低:傳統的逐條插入模式效率欠佳,每次插入數據時都要與數據庫進行交互,從而產生較高的網絡開銷以及數據庫解析成本。
  • 外鍵關系處理復雜:題目與選項之間存在外鍵關聯,這就需要在插入數據后獲取主鍵 ID,無疑增加了操作的復雜程度。
  • 批量操作性能有限:使用默認的 saveBatch 方法,其性能提升并不顯著,難以滿足高并發、大數據量的實際需求。

3 初探 MyBatis-Plus 的 saveBatch 方法

3.1 saveBatch 方法簡介

在 MyBatis-Plus 中,saveBatch 方法是用于批量保存數據的方法。它能夠在單次操作中將多條數據同時插入數據庫,從而提高插入效率,減少數據庫連接次數,提升性能。

boolean saveBatch(Collection<T> entityList);
    boolean saveBatch(Collection<T> entityList, int batchSize);
  • entityList:要插入的實體類集合。可以是任何實現了 Collection 接口的集合類型,如 List、Set 等。
  • batchSize(可選):指定每次批量插入的大小。默認情況下,MyBatis-Plus 會一次性插入所有數據。如果設置了 batchSize,則會按指定大小分批插入,避免一次性插入大量數據時出現性能問題或內存溢出。

3.2 常用場景

  • 批量插入數據:當需要插入大量數據時,使用 saveBatch 可以顯著提高性能。
  • 提高數據庫寫入效率:減少數據庫連接和插入的次數,有效提升性能。
  • 處理大數據量時的內存優化:通過分批插入,避免一次性插入大量數據導致內存溢出。

3.3 默認實現的局限性

  • 不支持多條 SQL 合并:在默認情況下,即便使用 saveBatch,也有可能是逐條發送 SQL 語句。這會導致生成的 SQL 更冗長、性能較低,尤其是在數據量較大時,執行效率會明顯下降,無法充分利用數據庫批量插入的特性。
  • 性能提升有限:默認實現并未針對批量插入進行特殊優化。例如,它可能無法充分利用 JDBC 的批量操作特性,導致性能不如手動實現的批量插入邏輯。對于大批量插入,性能可能不理想。
  • 主鍵生成方式局限性:如果實體類中主鍵是由數據庫自動生成(如自增主鍵),默認實現會多次與數據庫交互獲取主鍵值。這會增加額外的數據庫開銷。尤其是當數據量較大時,主鍵生成的額外查詢操作會顯著降低性能。
  • 外鍵關系處理復雜:需要在插入數據后獲取主鍵 ID,這導致無法在批量插入時建立關聯關系,使得外鍵關系處理變得復雜。
  • 缺乏靈活性:默認實現只能進行簡單的插入操作,不能處理條件性插入(如:插入前判斷是否已存在相同記錄)或插入沖突處理(如主鍵沖突時自動更新數據)。對需要動態邏輯的場景不適用。

4 深度解析 rewriteBatchedStatements=true 的作用

4.1 JDBC 批處理機制

JDBC 批處理機制是一種優化數據庫操作性能的技術,允許將多條 SQL 語句作為一個批次發送到數據庫服務器執行,從而減少客戶端與數據庫之間的交互次數,顯著提高性能。通常用于 批量插入、批量更新 和 批量刪除 等場景。具體的流程如下:

//創建 PreparedStatement 對象,用于定義批處理的 SQL 模板。
    PreparedStatement pstmt = conn.prepareStatement(sql);
    for (Data data : dataList) {
      // 多次調用 addBatch() 方法,每次調用都會將一條 SQL 加入批處理隊列。
      pstmt.addBatch();
    }
      //執行批處理,調用 executeBatch() 方法,批量發送 SQL 并執行。
      pstmt.executeBatch();

4.2 MySQL JDBC 驅動的默認行為對批處理的影響

  • 未開啟重寫:在默認狀態下,MySQL JDBC 驅動會逐一條目地發送批處理中的 SQL 語句,未開啟重寫功能。
  • 性能瓶頸:頻繁的網絡交互以及數據庫解析操作,使得批量操作的性能提升效果有限,形成了性能瓶頸。

4.3 rewriteBatchedStatements=true 的魔力

  • 啟用批處理重寫:啟用批處理重寫功能后,驅動能夠將多條同類型的 SQL 語句進行合并,進而發送給數據庫執行。
  • 減少網絡交互:一次發送多條 SQL,可有效降低網絡延遲,減少網絡交互次數。
  • 提高執行效率:當所有數據都通過一條 SQL 插入時,MySQL 只需要解析一次 SQL,降低了解析和執行的開銷。
  • 減少內存消耗:雖然批量操作時將數據合并到一條 SQL 中,理論上會增加內存使用(因為需要構建更大的 SQL 字符串),但相比多次單條插入的網絡延遲和處理開銷,整體的資源消耗和執行效率是更優的。

未開啟參數時的批處理 SQL:

INSERT INTO question (exam_id, content) VALUES (?, ?);
INSERT INTO question (exam_id, content) VALUES (?, ?);
INSERT INTO question (exam_id, content) VALUES (?, ?);

開啟參數后的批處理 SQL:

INSERT INTO question (exam_id, content) VALUES (?, ?), (?, ?), (?, ?);

5 預先生成 ID:解決外鍵關系的關鍵

5.1 問題分析

在插入題目和選項時,選項需要引用對應題目的主鍵 ID。如果等待題目插入后再獲取 ID,會導致無法進行批量操作,影響性能。所以,預先生成ID就成了我們解決問題的關鍵。

5.2 預先生成 ID 的解決方案

使用 zzidc(自研的 ID 生成器):

  • 全局唯一:生成的 ID 在全局范圍內唯一,避免了主鍵沖突。
  • 本地生成:無需依賴數據庫生成,減少了數據庫交互。
  • 支持批量生成:提升獲取分布式唯一ID的效率

5.3 應用實踐

5.3.1 引入 zzidc

<!--id生成器-->
        <dependency>
            <groupId>com.bj58.zhuanzhuan.idc</groupId>
            <artifactId>contract</artifactId>
            <version>${com.bj58.zhuanzhuan.idc.version}</version>
        </dependency>

5.3.2 具體的代碼業務執行邏輯

在構建題目和選項數據時,預先生成 ID,并在選項中引用對應的題目 ID:

public Boolean createExamPaper(HeroExamRequest<ExamPaperRequest> request) throws BusinessException{
          // 構建題目數據
          Question question = new Question();
          question.setId(questionId);
          question.setExamId(examId);
          // ...

          // 構建選項數據
          Option option = new Option();
          option.setQuestionId(questionId);
          // ...
    }

6 綜合優化實踐:性能提升 2000%

6.1 配置 rewriteBatchedStatements=true

6.1.1 修改數據庫連接配置

實現這個配置的方式很簡單,只需要在我們現有的數據庫連接后面直接加上就好。例如:jdbc:mysql://localhost:3306/db_name?rewriteBatchedStatements=true

6.1.2 注意事項

  • 驅動版本:確保使用的 MySQL JDBC 驅動版本支持該參數(5.1.13 及以上)。
  • 參數位置:如果有多個參數,用 & 符號連接。

6.2 完整代碼示例

@Service
public class ExamServiceImpl implements ExamService {

  @Autowired
  private ExamMapper examMapper;
  @Autowired
  private QuestionService questionService;
  @Autowired
  private OptionService optionService;

  private static final int BATCH_SIZE = 2000;

  @Override
  @Transactional(rollbackFor = Exception.class)
  public void createExam(Exam exam, int questionCount, int optionCountPerQuestion) {
        // 預先生成試卷 ID
        long examId = zzidc.nextId();
        exam.setId(examId);
        examMapper.insert(exam);

        List<Question> questionList = new ArrayList<>();
        List<Option> allOptionList = new ArrayList<>();

        for (int i = 0; i < questionCount; i++) {
          // 預先生成題目 ID
          long questionId = zzidc.nextId();
          Question question = new Question();
          question.setId(questionId);
          question.setExamId(examId);
          question.setContent("題目內容" + i);
          questionList.add(question);

          // 構建選項數據
          for (int j = 0; j < optionCountPerQuestion; j++) {
            Option option = new Option();
            option.setQuestionId(questionId);
            option.setContent("選項內容" + j);
            allOptionList.add(option);
          }
      }

      // 批量插入題目和選項
      questionService.saveBatch(questionList, BATCH_SIZE);
      optionService.saveBatch(allOptionList, BATCH_SIZE);
  }
}

注意:以上代碼為示例,需根據實際項目進行調整。

6.3 性能測試

6.3.1 測試數據

  • 數據量:總共插入 100 道題目,每道題目 3 個選項。

6.3.2 測試方案

  • 未優化方案:逐條插入試卷、題目和選項數據。
  • 使用 saveBatch:使用 saveBatch 批量插入,但未配置 rewriteBatchedStatements,且未預先生成 ID。
  • 綜合優化方案:配置 rewriteBatchedStatements=true,預先生成 ID,使用 saveBatch 批量插入。

6.3.3 測試結果


方案 耗時(毫秒)

性能提升

未優化方案

4023

-

僅使用 saveBatch

2744

↑ 30%

綜合優化方案

149

↑ 2700%

說明:以上數據為多次測試的平均值。

6.3.4 數據分析

  • 未優化方案:由于逐條插入,每次插入都需要與數據庫交互,導致耗時最長。
  • 使用 saveBatch:減少了與數據庫的交互次數,性能有所提升,但未充分利用 JDBC 驅動的批處理優化。
  • 綜合優化方案:通過配置 rewriteBatchedStatements=true,使 JDBC 驅動將多條 SQL 合并為一條,顯著減少網絡和數據庫開銷;同時預先生成 ID,解決了外鍵關系的問題,支持批量插入,最終實現了性能的大幅提升。

7 多線程并發插入的實現

7.1 問題分析

直接在多線程中調用 saveBatch 方法,可能導致以下問題:

  • 程安全性:在 MyBatis 中,SqlSession 在默認情況下并非線程安全的。若在多線程環境下共享同一個 SqlSession,極有可能導致數據錯誤或引發異常。
  • 事務管理:對于多線程操作而言,需要獨立的事務管理機制,以此來確保數據的一致性。
  • 資源競爭:過多的并發線程有可能致使數據庫連接池被耗盡,進而降低性能。

7.2 正確的多線程實現方式

7.2.1 使用 @Async 異步方法

利用 Spring 的 @Async 注解,實現異步方法調用,每個異步方法都有自己的事務和 SqlSession。

配置異步支持:

@Configuration
@EnableAsync
public class AsyncConfig {
@Bean(name = "taskExecutor")
public Executor taskExecutor() {
    ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor();
    executor.setCorePoolSize(4); // 核心線程數
    executor.setMaxPoolSize(8); // 最大線程數
    executor.setQueueCapacity(100); // 隊列容量
    executor.setThreadNamePrefix("AsyncExecutor-");
    executor.initialize();
    return executor;
  }
}

修改批量插入方法:

@Service
public class QuestionServiceImpl implements QuestionService {

  @Autowired
  private QuestionMapper questionMapper;

  @Override
  @Async("taskExecutor")
  @Transactional(rollbackFor = Exception.class)
  public CompletableFuture<Void> saveBatchAsync(List<Question> questionList) {
    saveBatch(questionList, BATCH_SIZE);
    return CompletableFuture.completedFuture(null);
  }
}

7.2.2 調用異步方法

public void createExam(Exam exam, int questionCount, int optionCountPerQuestion) {
  // ... 數據準備部分略 ...

  // 將題目列表拆分成多個批次
  List<List<Question>> questionBatches = Lists.partition(questionList, BATCH_SIZE);
  List<List<Option>> optionBatches = Lists.partition(allOptionList, BATCH_SIZE);

  List<CompletableFuture<Void>> futures = new ArrayList<>();

  // 異步批量插入題目
  for (List<Question> batch : questionBatches) {
    CompletableFuture<Void> future = questionService.saveBatchAsync(batch);
    futures.add(future);
  }

  // 異步批量插入選項
  for (List<Option> batch : optionBatches) {
    CompletableFuture<Void> future = optionService.saveBatchAsync(batch);
    futures.add(future);
  }

  // 等待所有異步任務完成
  CompletableFuture.allOf(futures.toArray(new CompletableFuture[0])).join();
}

7.2.3 注意事項

  • 線程安全:每個異步方法均擁有自身獨立的 SqlSession 和事務,從而有效地避免了線程安全方面的問題。
  • 事務管理:在異步方法上添加 @Transactional 注解,能夠確保事務的獨立性。
  • 異步結果處理:通過使用 CompletableFuture 來等待異步任務的完成,以此確保所有數據均已成功插入。

8 數據庫層面的優化

8.1 調整數據庫連接池

  • 增加連接池大小:在多線程并發的情形下,務必確保數據庫連接池具備足夠數量的連接可供使用。
  • 合理配置:應根據實際情況對連接池的最小連接數和最大連接數進行適當調整,以避免出現連接不足或者資源浪費的情況。

8.2 配置 MyBatis 的執行器類型

修改執行器類型為 BATCH:在 MyBatis 配置中,設置執行器類型,可以提高批量操作的性能。

<configuration>
  <settings>
    <setting name="defaultExecutorType" value="BATCH"/>
  </settings>
</configuration>

注意:使用 BATCH 執行器時,需要手動調用 sqlSession.flushStatements(),并處理返回的 BatchResult,復雜度較高,建議謹慎使用。

9 監控與調優

9.1 監控異步任務的執行情況

  • 使用 CompletableFuture:在調用異步方法時,返回 CompletableFuture,可以方便地等待所有任務完成。
  • 日志記錄:在異步方法中添加日志,記錄開始和結束時間,監控執行情況。
@Async("taskExecutor")
@Transactional(rollbackFor = Exception.class)
public CompletableFuture<Void> saveBatchAsync(List<Question> questionList) {
  long startTime = System.currentTimeMillis();
  saveBatch(questionList, BATCH_SIZE);
  long endTime = System.currentTimeMillis();
  logger.info("Inserted batch of {} questions in {} ms", questionList.size(), (endTime - startTime));
  return CompletableFuture.completedFuture(null);
}

9.2 調整線程池參數

  • 線程池大小:依據服務器的 CPU 核心數以及數據庫的承載能力,對線程池的 corePoolSize 和 maxPoolSize 進行合理設置。
  • 隊列容量:設置線程池的 queueCapacity,以防止因任務過多而導致內存溢出的情況發生。

10 最佳實踐總結

10.1 綜合優化策略

  • 將 rewriteBatchedStatements 配置為 true:以此啟用 JDBC 驅動的批處理重寫功能,可顯著提高批量插入的性能表現。
  • 預先生成 ID:采用 zzidc 等方式預先生成主鍵 ID,有效解決外鍵關系問題,進而支持批量插入操作。
  • 使用異步方法進行多線程批量插入:運用異步方法來進行多線程批量插入,確保線程安全與事務獨立,避免出現資源競爭的情況。
  • 調整數據庫連接池和線程池參數:對數據庫連接池和線程池的參數進行調整,以滿足多線程并發操作的實際需求。
  • 監控異步任務和數據庫性能:對異步任務和數據庫性能進行實時監控,以便能夠及時發現并解決性能瓶頸問題。

10.2 注意事項

  • 線程安全性:在多線程的環境之中,務必確保所有資源要么是線程安全的,要么是線程獨立的。
  • 事務一致性:每個異步任務均擁有自身的事務,以此確保數據的一致性。
  • 資源合理利用:避免因過多的并發線程而致使系統資源被耗盡,進而影響整體性能表現。

結語

深入理解 rewriteBatchedStatements=true 參數的效用,再結合預先生成 ID、恰當的多線程實現方式以及數據庫參數調整等優化策略,我們成功地將 MyBatis-Plus 批量插入的性能大幅提升了 2000%。這些優化技巧不但在考試系統中適用,在其他需要批量處理大量數據的場景下同樣具有重要的參考價值。

性能優化乃是一項系統性工程,需從應用層、數據庫層、硬件層等多個層面著手。期望本文的分享能夠在實際項目中為您提供切實可行的指導,助力您的應用成功突破性能瓶頸。

關于作者

張守法 俠客匯Java開發工程師

責任編輯:武曉燕 來源: 轉轉技術
相關推薦

2023-06-07 08:00:00

MySQL批量插入

2024-07-31 09:56:20

2021-09-27 07:56:41

MyBatis Plu數據庫批量插入

2024-12-20 16:49:15

MyBatis開發代碼

2022-09-29 10:06:56

SQLMySQL服務端

2013-09-22 10:25:23

MySQLSQL性能優化

2020-11-23 10:50:27

MySQLSQL數據庫

2024-10-14 12:38:59

2025-02-27 09:45:47

2024-05-23 10:58:49

2023-09-26 12:02:34

C++循環

2023-06-07 08:08:37

MybatisSpringBoot

2024-04-12 08:28:38

優化查詢語句PostgreSQL索引

2023-12-30 20:04:51

MyBatis框架數據

2023-07-29 22:02:06

MyBatis數據庫配置

2023-09-25 13:15:50

SQL數據庫

2023-06-14 08:34:18

Mybatis死鎖框架

2023-10-31 08:01:48

Mybatis參數jdbcurl?

2019-08-21 10:53:29

.NET性能優化

2024-06-04 07:46:05

點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 国产成人网 | 在线看片国产 | 日韩欧美1区2区 | 青草青草久热精品视频在线观看 | 91精品国产91久久久久久吃药 | av一级一片 | 日韩中文电影 | 国产精品久久久久久久久久 | 免费观看成人av | 精品欧美一区二区三区久久久 | 四虎影院久久 | 一区二区三区国产精品 | 成人欧美一区二区三区在线播放 | 亚洲不卡在线观看 | 亚洲欧美精品一区 | 自拍偷拍中文字幕 | 国产精品久久久久久久久久 | 欧美电影一区 | av在线一区二区三区 | 午夜无码国产理论在线 | 国产精品一区二区三区在线 | 91大神在线资源观看无广告 | 91久久精品国产91久久性色tv | 久久久久久看片 | 国产一区二区日韩 | 国产黄色大片在线观看 | 国产在线观看不卡一区二区三区 | 日本在线视 | 日日干日日操 | 欧美日韩一区二区三区不卡视频 | 日本三级黄视频 | 久久久91 | 成人国产精品久久 | 精品一区视频 | 91精品国产综合久久久久久首页 | 午夜视频免费在线 | 精品国产乱码久久久久久88av | 成人区精品一区二区婷婷 | 成人av一区二区在线观看 | 激情欧美日韩一区二区 | 亚洲 欧美 日韩在线 |