自動化測試的未來趨勢

原創(chuàng) 精選

作者： Thoughtworks洞見 2022-06-08 14:22:55

開發(fā) 測試

在本文中，我們介紹了兩種應(yīng)用比較廣泛的自動化測試新技術(shù)，目的是幫助大家了解自動化測試未來的發(fā)展趨勢，從而更好地利用新技術(shù)來提高我們的測試效率。

作者 | 汪陽

背景

自動化測試從最早期的錄制回放技術(shù)開始，逐步發(fā)展成DOM對象識別與分層自動化，以及基于POM(Page Object

Model)來提高用例復(fù)用，到當(dāng)前火熱的基于AI技術(shù)的自動化，體現(xiàn)了自動化測試的發(fā)展趨勢是更加智能，更加精準(zhǔn)，更加高效。

在這里我們給大家介紹兩種在業(yè)界已經(jīng)有廣泛使用的智能自動化測試技術(shù)：

自愈（Self-Healing）技術(shù)?
機(jī)器學(xué)習(xí)（Machine Learning）技術(shù)?

自愈技術(shù)

1. 什么是自愈技術(shù)

自愈（Self-Healing）技術(shù)在計(jì)算機(jī)術(shù)語中是指：一種自我修復(fù)的管理機(jī)制。

類比生命體，當(dāng)生命體遭受到一些小的傷害時，它們的身體往往能夠通過自身的修復(fù)機(jī)制來實(shí)現(xiàn)自愈，而不需要外界加以干預(yù)。如壁虎的斷尾再生，或者蟹類的軀體再生能力那樣。

回到計(jì)算機(jī)領(lǐng)域，自愈技術(shù)也在廣泛地使用，比如芯片的信息通道自愈，軟件系統(tǒng)的故障自愈等。那么我們這里要介紹的是在自動化測試方向上的一種自愈技術(shù)：

可以發(fā)現(xiàn)其測試腳本執(zhí)行中的非預(yù)期錯誤，并在無需人工干預(yù)的情況下自行更改，從而將自身恢復(fù)到更好的運(yùn)行狀態(tài)。

2. 原理介紹

問題域：在自動化測試中使用自愈技術(shù)主要解決的是對象識別（object identification）問題。

傳統(tǒng)的自動化測試框架和工具，使用應(yīng)用程序模型來定義應(yīng)用程序的組件和對象及其屬性。然后使用這些定義來識別和操作應(yīng)用程序組件。但是應(yīng)用程序在更新時會經(jīng)常更改。可能是有意的開發(fā)人員變更或者是即時（由應(yīng)用程序系統(tǒng)或構(gòu)建過程）發(fā)生的。這些變化破壞了我們基于靜態(tài)定義的傳統(tǒng)自動化方式。

自然語言處理（NLP）和機(jī)器學(xué)習(xí) (ML) 等智能技術(shù)已經(jīng)發(fā)展到測試腳本現(xiàn)在可以“學(xué)習(xí)”和“適應(yīng)”的地步；自愈式自動化測試工具使用 AI 和機(jī)器學(xué)習(xí)技術(shù)，根據(jù)用戶界面 (UI) 或應(yīng)用程序環(huán)境的變化，可以自動更新和調(diào)整測試過程。

在運(yùn)行測試時，它們會掃描應(yīng)用程序的用戶界面以查看是否存在任何對象。然后它們將這些對象與之前為自動化測試生成的應(yīng)用程序模型進(jìn)行比較。如果應(yīng)用程序有任何更改，則有一種技術(shù)可以讓測試適應(yīng)并自動更新。這種能力被稱為“自我修復(fù)”。屬性更改是自動感知的，內(nèi)部腳本在運(yùn)行時通過自我修復(fù)進(jìn)行自我修復(fù)。

自愈功能具有以下兩個顯著特點(diǎn)：

在執(zhí)行過程中，如果某個測試步驟定位器無法被其默認(rèn)定位器值檢測到，則列表中的其他定位器策略將自動應(yīng)用，無需測試人員的任何手動干預(yù)。執(zhí)行將繼續(xù)，就好像沒有發(fā)生任何故障一樣。?
在執(zhí)行過程中，如果測試步驟定位器失敗，并且無法使用任何其他定位器策略自動檢測到，測試將暫停執(zhí)行，允許用戶選擇相關(guān)元素并繼續(xù)執(zhí)行。新的定位器策略將在下次執(zhí)行時自動更新。?

下圖介紹了自愈技術(shù)的主要步驟：

(圖片來源：https://www.impactqa.com/blog/5-great-ways-to-achieve-complete-automation-with-ai-and-ml/)

自動化測試自愈技術(shù)的優(yōu)勢主要有：

(1) 減少測試失敗率

測試執(zhí)行失敗很正常，但是有時候失敗的根本原因僅僅是由于用戶界面發(fā)生了變化而測試腳本沒有同步變化。使用自愈技術(shù)后，由于無法正確識別的對象位置而影響腳本執(zhí)行失敗的情況就不太可能發(fā)生。而傳統(tǒng)的自動化方式無法識別這些變化并自動更新。

(2) 提升測試穩(wěn)定性

如果我們測試過程中有flaky tests存在的話，我們很難確定我們的測試是否是穩(wěn)定的。”NoSuchElementException“ 錯誤是導(dǎo)致測試設(shè)計(jì)不穩(wěn)定的幾個錯誤之一，測試團(tuán)隊(duì)很難完全控制這樣的現(xiàn)象發(fā)生。而當(dāng)我們的測試設(shè)計(jì)和應(yīng)用程序保持一致時，測試在執(zhí)行期間失敗的可能性較小，并且執(zhí)行過程也更加順暢。

(3) 提高腳本維護(hù)性

測試代碼中的更改與開發(fā)人員在應(yīng)用程序中所做的更改成正相關(guān)。由于測試失敗的原因可能會發(fā)生變化，并且不能反映 AUT 的真實(shí)狀態(tài)；因此失敗的測試結(jié)果會限制測試人員獲得有關(guān)其測試的有意義的見解。通過識別和更新用戶界面中的任何更改的測試用例，自愈技術(shù)節(jié)省了敏捷測試和開發(fā)團(tuán)隊(duì)的時間和精力。除了時間和精力之外，測試自動化中的自我修復(fù)也顯著降低了測試腳本維護(hù)成本。

3. 業(yè)內(nèi)實(shí)踐

我們可以看到，業(yè)內(nèi)已經(jīng)有一些比較好的實(shí)踐了，比如Healenium項(xiàng)目。

以Healenium項(xiàng)目為例，看看自動化測試自愈技術(shù)是怎么工作的：

假設(shè)我們通過id 的方式來定位應(yīng)用程序界面上的一個按鈕，定位器應(yīng)該是：#button

從上圖可以看到，元素可以被正確定位到。Healnium會將正確的定位器保存下來，作為下一次測試執(zhí)行的基準(zhǔn)值。現(xiàn)在，我們假設(shè)開發(fā)人員變更了應(yīng)用程序的UI界面，改變了這個按鈕的id屬性，從#button變更為#green_button。但是由于某種原因，測試團(tuán)隊(duì)沒有被通知到有這個變更，所以測試腳本也沒有更新。那么當(dāng)我們再次執(zhí)行腳本的時候，在嘗試使用#button的舊定位器去定位按鈕的時候，腳本就會報(bào)錯，提示 “NoSuchElement”的錯誤異常。

在這種情況下，使用標(biāo)準(zhǔn)的 Selenium 實(shí)現(xiàn)測試將失敗，但使用 Healenium 則不會。Healenium 捕獲 NoSuchElement 異常，觸發(fā)機(jī)器學(xué)習(xí)算法，傳遞當(dāng)前頁面狀態(tài)，獲取之前成功的定位器路徑，比較它們，并生成修復(fù)的定位器列表。它采用得分最高的定位器并使用該定位器執(zhí)行操作。正如我們看到的元素被成功找到并通過了測試。

測試運(yùn)行后，Healenium 生成報(bào)告，其中包含有關(guān)修復(fù)定位器、屏幕截圖和修復(fù)成功反饋按鈕的所有詳細(xì)信息。

如果修復(fù)成功，我們可以使用 Healenium Idea 插件更新我們的自動化測試代碼：插件使用修復(fù)定位器尋找修復(fù)和更新測試代碼。

Healenium 使用一種機(jī)器學(xué)習(xí)算法來分析當(dāng)前網(wǎng)頁的變化：基于權(quán)重的最長公共子序列算法.

更多關(guān)于這個項(xiàng)目的詳情，可以訪問這個項(xiàng)目官網(wǎng)：https://healenium.io/

通過這個案例，我們來對比一下傳統(tǒng)自動化測試方式和基于自愈技術(shù)的自動化測試方式中對象維護(hù)的差異（如下圖所示）：

二、機(jī)器學(xué)習(xí)

在上一部分，我們介紹了通過自愈技術(shù)解決自動化測試過程中對象識別問題。但是在自動化測試過程中，我們?nèi)匀贿€會面臨其他問題：

仍然需要人工獲取定位方式；?
如果是通過Canvas繪制出來的對象，如何識別元素 (如Flutter Web)。?

等等。

雖然自愈技術(shù)在傳統(tǒng)的自動化測試中增加了一些容錯能力。但是本質(zhì)上還是基于元素定位的對象識別技術(shù)，用到的還是傳統(tǒng)的DOM定位技術(shù)，如XPath或者是CSS定位器。

而我們知道，移動端和Web端的運(yùn)行環(huán)境復(fù)雜，外部干擾因素很容易破壞自動化腳本運(yùn)行的穩(wěn)定性，這是元素定位器脆性本質(zhì)導(dǎo)致的。

所以業(yè)界也一直在持續(xù)探索更穩(wěn)定的對象識別技術(shù)。在早期我們使用到了CV（Computer Vision）計(jì)算機(jī)視覺 +OCR（Optical Character Recognition）光學(xué)字符設(shè)別技術(shù)。

而CV和OCR是基于圖像處理和統(tǒng)計(jì)機(jī)器學(xué)習(xí)方法。

比如業(yè)內(nèi)比較流行的自動化測試框架airtest，就是基于CV技術(shù)來進(jìn)行智能控件識別的。

通過OCR及圖像識別能力，實(shí)現(xiàn)相同流程下，一套自動化腳本可以在多平臺上執(zhí)行的能力，大大降低了腳本編寫及后期維護(hù)成本。

目前業(yè)界也在實(shí)踐與探索基于機(jī)器學(xué)習(xí)技術(shù)的CV和OCR來解決自動化測試學(xué)習(xí)成本高、維護(hù)成本高、Hybird識別差、跨應(yīng)用能力差，以及不支持跨平臺等方面的問題。

1. 智能識別

在UI頁面中，我們的信息主要由圖像和文字構(gòu)成。如何高效地識別基于圖像和文字的控件對象，是當(dāng)前自動化測試不得不面臨的問題。為了解決之前基于DOM技術(shù)的元素定位不穩(wěn)定，以及后期的維護(hù)成本。目前在UI控件識別上有兩種方式：一個是基于CV技術(shù)的圖像識別，一個是基于OCR技術(shù)的文字識別。

(1) 基于CV的圖像識別

a. 傳統(tǒng)的CV

在傳統(tǒng)方式下，我們主要是基于圖像特征識別技術(shù)：

提到圖像識別算法一定繞不開OpenCV，常用的是SIFT算法，核心就是提取出圖片當(dāng)中的一些關(guān)鍵特征，這些特征在不同的機(jī)型，在不同的分辨率下面有很好的適應(yīng)性。基于傳統(tǒng)特征識別技術(shù)的處理過程如下圖所示：

b. 基于深度學(xué)習(xí)的CV

這種方法比現(xiàn)行的定位策略（ image ）更靈活，因?yàn)槲覀兛梢杂肅NN，或者其他深度學(xué)習(xí)框架來訓(xùn)練 AI 模型去識別控件圖標(biāo)，并不需要知道上下文，也不需要精確匹配控件圖標(biāo)。也就是說我們可以能跨應(yīng)用和平臺去找一個如 “購物車” 的圖標(biāo)這樣的控件，不需要在意一些細(xì)微的差別。基于深度學(xué)習(xí)的處理流程如下圖所示：

盡管基于深度學(xué)習(xí)的CV具有更強(qiáng)的能力，但是傳統(tǒng)的方式依然有不可替代的優(yōu)勢，值得我們繼續(xù)學(xué)習(xí)。如從目前來看深度學(xué)習(xí)仍然需要大量的數(shù)據(jù)，而傳統(tǒng)的方式在這方面就會節(jié)省很大的成本。對于一些比較簡單的識別任務(wù)，我們更推薦傳統(tǒng)的CV方式。

(2) 基于OCR文字識別

OCR可識別屏幕上的預(yù)定義字符。使用OCR的軟件將采用“最佳猜測”的方式來確定圖像是否與字符匹配，以便將該圖像轉(zhuǎn)換為計(jì)算機(jī)可以處理的文本。傳統(tǒng)的OCR基于圖像處理（二值化、連通域分析、投影分析等）和統(tǒng)計(jì)機(jī)器學(xué)習(xí)（Adaboost、SVM）。

傳統(tǒng)的OCR只能處理相對簡單的場景，如：簡單的頁面布局、前景和背景信息便于區(qū)分及每個文本字符容易分割。隨著我們的測試對象月來越復(fù)雜，頁面布局，樣式等多樣化的場景下，傳統(tǒng)OCR的精準(zhǔn)度也受到了挑戰(zhàn)。

隨著深度學(xué)習(xí)的發(fā)展，我們可以通過新的算法技術(shù)來解決傳統(tǒng)OCR的局限性。

2. 案例實(shí)踐

在業(yè)內(nèi)，大部分基于AI的自動化測試平臺均采用了CV+OCR結(jié)合的智能識別技術(shù)，來降低自動化測試腳本編寫成本以及后期的維護(hù)成本。我們分別以基于OpenCV的airtest 平臺為例：基于OpenCV的UI自動化 - AirtestAirtest主要用到了兩種傳統(tǒng)的OpenCV匹配算法：模版匹配和特征匹配。

模板匹配：

無法跨分辨率識別
一定有相對最佳的匹配結(jié)果
方法名："tpl", "mstpl"

特征點(diǎn)匹配：

跨分辨率識別
不一定有匹配結(jié)果
方法名列表：["kaze", "brisk", "akaze", "orb", "sift", "surf", "brief"]

在Airtest中可以自己配置選擇使用的匹配算法。由于兩種匹配算法各有利弊，因此一般默認(rèn)是選擇這幾種匹配算法組合，算法依次進(jìn)行圖像識別，找到結(jié)果將停止識別，未找到結(jié)果將會一直按照這個算法的識別順序一直循環(huán)識別直到超時。

如何判斷圖像識別成功或者失敗呢？Airtest里面有兩個重要的名詞：閥值和可信度，閥值是可以配置的，一般默認(rèn)為0.7，可信度是算法執(zhí)行結(jié)束后計(jì)算出來的可能性概率，當(dāng) 可信度＞闕值的時候，程序會認(rèn)為找到了最佳的匹配結(jié)果；而當(dāng) 可信度＜闕值的時候，程序則會認(rèn)為沒有找到最佳的匹配結(jié)果。

如下這個例子：在Airtest中操作網(wǎng)易云音樂APP ：

Touch(“圖片”) 的原理如下：

Airtest本身并沒有直接提供OCR方式識別，不過我們可以通過集成開源的Tesseract-OCR庫來支持OCR識別能力。

面臨的挑戰(zhàn)：

基于傳統(tǒng)的OpenCV的圖像識別，主要的問題是圖像的特征識別不夠準(zhǔn)確，特別是在圖像本身的特征比較少，如有一大片白色背景等，或者是動態(tài)元素等。同時傳統(tǒng)的識別成功率平均也就80%左右，還達(dá)不到人工的95%的準(zhǔn)確率，因此在傳統(tǒng)方式下，我們只能通過添加更多特征信息來優(yōu)化識別率，但是想要匹配人工的準(zhǔn)確率，傳統(tǒng)的統(tǒng)計(jì)機(jī)器學(xué)習(xí)方式很難達(dá)到。

解決這個問題就需要更強(qiáng)的泛化能力，目前更多的是基于CNN等深度學(xué)習(xí)技術(shù)來解決此類問題。我們這里就不過多展開，大家可以參考Appium with AI項(xiàng)目。

詳情：https://appiumpro.com/editions/39-early-stage-ai-for-appium-test-automation