DDD診所——聚合過大綜合癥
作者 | 付施威
一、DDD診所 —— 聚合過大綜合癥
“DDD診所”是Thoughtworks DDD社區的一項活動,通過對同事們在實施DDD過程中遇到的問題進行分析和解答,共同提高開發水平。我們將其中一些典型案例整理成文供大家參考。之后也會考慮在適當的時候將這一形式對外部開放。
就診日期:2022年6月8日
患者:某DevOps平臺持續集成模塊
診金:0元(免費義診)
二、【患者主訴】
疑似問題設計
某DevOps平臺需提供持續交付流水線設計功能,使用戶可在界面上規劃完整流程。因此,流水線設計頁面功能繁雜,涵蓋階段規劃、前置觸發條件設置、質量門禁控制等。隨著功能擴展,頁面復雜度逐漸提升。此類功能旨在協助用戶優化持續交付流水線管理,提升交付效能與質量。
圖片
持續交付流水線界面原
功能介紹:
- 設計不同的階段:用戶可以根據需要設置不同的階段,例如開發階段、測試階段等。對于每個階段,用戶可以設置不同的步驟,例如Checkout、編譯、構建鏡像和部署等。
- 設計前置觸發條件:用戶可以選擇兩種觸發方式,一種是某個代碼倉庫提交觸發,另一種是定時任務。用戶可以設置多個前置觸發條件。
- 設置質量門禁:用戶可以選擇給階段設置質量門禁,例如單元測試覆蓋率大于80%等。這些門禁指標可以在質量門禁管理功能中設置。在流水線執行時,如果不滿足門禁指標,會阻止流水線進入下一個階段。
項目架構師在接到需求后,根據需求設計了一個名為“持續交付流水線領域模型”。該模型的目的是方便用戶在界面上完成一系列操作,如代碼質量檢查、編譯代碼、構建鏡像和部署等。這些操作被看作是一個整體,并被組織在一個叫做“流水線”的聚合中。這個聚合包括質量門禁、不同的階段和觸發規則等。這種設計旨在保證流水線中各個組成部分的一致性。
請注意,圖中的“<>”是一種自定義的衍生關系,意味著該對象映射自其他上下文。
圖片
持續交付流水線領域模型
團隊按照這個模型落地了代碼,隨著交付的深入,這個模型的缺點也浮現出來。
引發問題
1. 認知負載上升
這個聚合包含了7個實體(不包括抽象類),每個實體都有自己相關的業務,因此這個聚合的認知負載相對較大。此外,該部分業務需要集成不同的外部依賴系統,如Sonar(用于實現質量門禁)、定時任務組件(用于定時任務觸發器)、GitLab或GitHub(用于代碼提交觸發器)等。盡管可以通過使用Repository模式和依賴倒置原則來分離功能和實現,但開發人員或維護人員仍需要掌握相關知識。如果某個人接手了這個功能(例如修改質量門禁相關功能),他/她基本上需要了解整個系統的工作方式。
2. 部分可用性難以實現
這個功能集成了多個第三方系統,并被設計為一個聚合。由于這些功能中的任何一部分不可用時,整個功能都將受到影響,因此難以實現部分可用性。例如,當Sonar服務暫時不可用時,代碼觸發和階段維護的部分也無法為用戶提供服務。如果后續用戶提出了部分可用性需求,要求Sonar不可用的情況下,要提示質量門禁設置失敗,但同時,其他部分仍需為用戶提供服務,那么根據這個設計就很難實現了,只能推倒重建,成本非常高。
不幸的是,在設計過程中我們不知不覺地構建了一個分布式單體。分布式單體架構是對一種設計糟糕的微服務架構的戲稱。一般指那種由于架構師沒有充分考慮和掌握分布式的優勢和代價,憑感覺設計出的微服務架構。這種架構導致設計出的系統既不能享受分布式的彈性優勢,又丟失了單體服務易于實現ACID事務強一致性方面的便利。通常出現在未經良好設計的微服務風格的分布式軟件中。
3. 犧牲了性能和并發性
當前的交互設計是用戶在設計界面對流水線的各部分進行設計,設計完成后按提交按鈕提交所有部分。實際上,用戶在每次修改時,不一定需要同時修改質量門禁、階段、觸發規則等所有的部分。然而由于聚合模式的特點,我們每次都需要對整個聚合的所有實體進行整存整取。即使用戶只想修改其中一部分(如“觸發規則”),我們仍需要更新名為“流水線”的聚合的整個7個模型,這將導致巨大的性能浪費。此外,如果兩個用戶同時操作業務上互不影響的兩部分如“觸發規則”和“質量門禁”時,會相互沖突,有一個用戶要被提示“設計已變更,修改失敗”,降低了系統的吞吐量。
三、【診斷】
初步診斷,患者的病情主要是聚合過大綜合癥,即聚合設計不合理,導致聚合過大。在DDD實踐中,合理劃分聚合是個比較有挑戰的問題。
聚合過大綜合癥的病理分析
在DDD的落地實踐過程中,聚合的大小經常被描述為一個不可言說的知識。很多時候,憑經驗和感覺會導致比較差的設計。然而,在實踐中,識別大聚合仍有跡可循,一般來說,出現了這三種情況時,就需要警惕聚合過大綜合癥:
1. 寬聚合
一個聚合聚合了多個同級實體,一個“父親”多個 “兒子”。如圖所示:一旦超過三就有大聚合的風險。
2. 深聚合
聚合的深度過深,例如聚合根有兒子實體,也有孫子實體,也有重孫實體。當層級達到三層時,就存在大聚合的風險。
3. 胖聚合
盡管結構簡單,但實體對象實例多。例如訂單和訂單行作為了一個聚合,而實際業務經常出現有幾千個訂單行的訂單。這種也存在大聚合的風險。
圖片
聚合過大的三個征兆
正如該案例所表現的那樣,這是一個具有寬聚合和深聚合的聚合過大綜合癥癥狀。聚合過大綜合癥會導致一系列問題,例如認知負荷增加、部分可用性下降以及性能問題。而在該案例中,這些問題正是由聚合過大綜合癥所導致的。
四、【治療建議】
出現聚合過大綜合癥,大多數情況是由于聚合劃分不合理所導致的。為了解決這個問題,我們可以回顧《領域驅動設計》一書中有關聚合模式的定義,以了解如何合理地劃分聚合。
識別聚合的方法
在《領域驅動設計:軟件核心復雜性應對之道》一書中,聚合的定義如下:
在具有復雜關聯的模型中,要想保證對象更改的一致性是很困難的。需要維護適用于密切相關的對象組的Invariant,而不僅僅是離散的對象。然而,過于謹慎的鎖定機制又會導致多個用戶之間毫無意義地互相干擾,從而使系統不可用。 我們應該將 Entity和 Value Object分門別類地聚集到Aggregate中并定義每Aggregate的邊界。在每Aggregate中,選擇一個Entity作為根,并通過根來控制對邊界內其他對象的所有訪問。只允許外部對象保持對根的引用。對內部成員的臨時引用可以被傳遞出去,但僅在一次操作中有效。由于根控制訪問,因此不能繞過它來修改內部對象。這種設計有利于確保Aggregate中的對象滿足所有固定規則,也可以確保在任何狀態變化時Aggregate作為一個整體滿足固定規則。
根據聚合模式的定義,我們可以得出判斷兩個實體(Entity)是否屬于一個聚合的依據,需要把握兩個條件:
1. 存在整體部分關系
當某個Entity是另一個Entity的部分時,稱為整體部分關系。例如:
- 汽車輪胎是汽車的一部分
- 學生是班級的一部分
- 訂單行是訂單的一部分
2. 實體之間存在變更時需要遵守的固定規則(Invariants)
固定規則或稱為不變量不變式,來自契約式設計。
在計算機科學中,不變量是指在計算機程序執行的某一階段始終為真的邏輯論斷。例如,循環不變量是一個條件,在一個循環的每個迭代開始和結束時都是真的。--- wiki <https://en.wikipedia.org/wiki/Invariant_(mathematics)>
在劃分聚合時,我們關注的是一些由業務原因所約束的固定規則。這些規則通常是通過與業務人員溝通,了解“A更新的時候,會不會引起B的某個屬性的更新”,“如果兩個實體暫時不一致,是否會導致難以承受的業務后果”等問題來得出的。
例如,在訂單系統中,假設需求是整個訂單的總價等于訂單行的總價之和,且總價必須小于3000(左圖)。在這種情況下,訂單與訂單行之間就存在固定規則。因此,可以把它們放在同一個聚合中,并通過整存整取來維護這個固定規則。然而,如果業務場景是訂單僅作為訂單行的分組,用戶需要按照訂單行逐一結賬(右圖)那么訂單和訂單行就無需劃分成一個聚合。
圖片
固定規則是劃分聚合的重要條件
需要注意的是,固定規則中的一部分是由技術實現所約束的固定規則,例如數據庫ID不重復、訂單編號唯一等。這些規則通常是全局性的固定規則,需要在整個系統范圍內遵循。然而,由于這些全局性的固定規則通常與特定的業務邏輯無關,因此在劃分聚合時,它們通常不是參考因素。
大聚合都必須拆小么?
盡管利用業務固定規則通常能夠確定較小的業務一致性邊界,從而得出比較合適的聚合規模,但并不是所有業務都適用這一原則。在有些業務場景中,大聚合可能是不可避免的。在這種情況下,如果想維護固定規則,是否采用聚合模式,需要權衡使用大聚合帶來的成本是否可以接受。聚合模式是一種設計模式,而非萬能的解決方案,在不適用的場景下強行應用聚合可能會導致收益不成正比。
聚合模式是為了解決復雜業務中的一致性問題,將具備固定規則的一組對象整存整取的一種方案。采用聚合模式的優點在于比較簡單地就能實現固定規則約束,代價就是整存整取帶來的性能損失等問題。
五、【治療方案】
在案例中,盡管流水線各部分之間存在整體部分關系,通過對業務進行分析,我們確定了以下固定規則:
- 階段內的步驟之間存在嚴格的順序依賴,因為下一個步驟通常依賴上一個步驟的產出物。因此,存在一個固定規則:某個步驟的執行順序必須按照階段的步驟列表中的順序關系。
- 階段質量門禁和門禁項之間存在固定規則,即當在門禁項發生變更時,門禁版本也必須隨之更新門禁的版本有一定的業務含義(例如,門禁版本更新需要在界面上進行明確提示)。
圖片
整改后的聚合
因此,根據上述整改方案,原本的一個大聚合被拆分成了四個小聚合,每個聚合只包含少量實體。這種改動可以有效地降低聚合的規模,從而更好地平衡性能和業務一致性之間的關系。
六、【總結】
在領域驅動設計實踐中,聚合的劃分確實是一個難以把握的問題。聚合本身是一種有代價的模式,不合理的聚合劃分可能導致嚴重的問題,從而引發一系列疑問,例如“為什么使用DDD后仍然遇到各種問題?”聚合過大綜合癥是聚合劃分中的一種常見問題,當模型中出現寬聚合、深聚合或胖聚合時,我們需要警惕聚合過大綜合癥及其帶來的難以維護、犧牲可用性和性能損失等問題。
要解決這個問題,我們需要回顧聚合解決的核心問題:如何維護對象之間的固定規則。再次考慮聚合的劃分時,需要滿足兩個條件:整體-部分關系和實體間需要遵循的固定規則。當使用聚合模式的代價過大時,可以考慮其他方法來實現,例如通過鎖機制鎖定需要維護一致性的對象方法。
總之,在實踐DDD時,我們應該關注聚合的劃分和優化,以確保在保持業務一致性和完整性的同時,避免因聚合過大導致的性能和可用性問題。在面臨聚合模式代價過大的情況時,可以靈活選擇其他方法來實現業務一致性和完整性。