成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

用 JS 實(shí)現(xiàn)了識(shí)別網(wǎng)頁(yè)驗(yàn)證碼的功能!

開發(fā) 前端
當(dāng)時(shí)我寫代碼的時(shí)候,沒(méi)有找到純 js 可以用的代碼和庫(kù),不能打包成 chrome 擴(kuò)展,用起來(lái)還是不太方便的。所以在驗(yàn)證了思路的可行性后,我就大致寫下來(lái),給他人以方便吧。

 很高興大家喜歡!Github:leonof/imgRecJs[1],剛剛上傳,代碼還需要完善~因?yàn)橛胁簧偻瑢W(xué)表示訓(xùn)練和識(shí)別有疑問(wèn),我做了個(gè)小接口放在最后,可以方便大家先把流程走通。

后續(xù)會(huì)更新:將 js 代碼等打包成 chrome 擴(kuò)展程序,這樣就可以讓瀏覽器自動(dòng)識(shí)別,完全傻瓜式使用啦~!(更新啦:利用 chrome 擴(kuò)展,讓瀏覽器執(zhí)行我們的腳本[2])

其實(shí)整篇文章難度不高,網(wǎng)上也有很多 java、c 等的代碼。只是當(dāng)時(shí)我寫代碼的時(shí)候,沒(méi)有找到純 js 可以用的代碼和庫(kù),不能打包成 chrome 擴(kuò)展,用起來(lái)還是不太方便的。所以在驗(yàn)證了思路的可行性后,我就大致寫下來(lái),給他人以方便吧。

目前有多種驗(yàn)證碼識(shí)別思路,限于能力有限,我只好采用了最簡(jiǎn)單的機(jī)器學(xué)習(xí)。目標(biāo)驗(yàn)證碼也比較簡(jiǎn)單,如:

(含字母也一樣)

識(shí)別控制速度在 0.1 秒以內(nèi)的話,正確率在 99.99999%(因?yàn)橐恢笔亲R(shí)別正確哈哈哈)。

在動(dòng)手之前,先梳理一下大致思路,方便比較獨(dú)立的同學(xué)自己嘗試完成代碼:

1、先分析網(wǎng)頁(yè) DOM 結(jié)構(gòu),載入驗(yàn)證碼圖片。

2、將圖片畫到 canvas 上,拿到圖片的像素?cái)?shù)據(jù)。

3、先后對(duì)圖片進(jìn)行二值化、腐蝕膨脹、切割、旋轉(zhuǎn)、縮放處理。

4、記錄處理后的單個(gè)數(shù)字的二值化數(shù)據(jù),并人工錄入真實(shí)數(shù)字。

5、重復(fù)訓(xùn)練。

6、識(shí)別時(shí),用處理后的圖像與庫(kù)中數(shù)據(jù)對(duì)比,取得最相近的數(shù)據(jù),得到真實(shí)數(shù)字。

(以下優(yōu)化)

7、數(shù)據(jù)量大時(shí),可以取前幾個(gè)相似數(shù)據(jù),并按權(quán)重從中選出最可能的數(shù)字,以提高準(zhǔn)確度。

8、也可查找到相似度足夠高時(shí)停止搜索,取其作為最后識(shí)別結(jié)果,以提升效率。

大神們可以直接去寫了,我這低級(jí)簡(jiǎn)單的代碼會(huì)遭你們嘲笑的。。。比較急于求成的同學(xué)也可以不用看了,回頭直接拿 demo 去修改吧!

好吧既然你看到這里了,我就盡量說(shuō)的清楚明白一點(diǎn)。

在動(dòng)手之前,我簡(jiǎn)單模擬一下需要輸入驗(yàn)證碼的網(wǎng)站,效果如下:

好吧,是真的簡(jiǎn)單…點(diǎn)擊圖片可以更換驗(yàn)證碼,輸入框用來(lái)輸入,按鈕模擬提交,如下:

我們就假裝他作為我們要自動(dòng)識(shí)別的目標(biāo)。

一、分析網(wǎng)頁(yè) DOM 結(jié)構(gòu),載入驗(yàn)證碼圖片。

我們可以看到,驗(yàn)證碼的 url 是:img/0.jpg。我這里的 url 會(huì)變化,是為了模擬更換驗(yàn)

  1. ctx1.drawImage(img,0,0,img.width,img.height); 

證碼的過(guò)程。但實(shí)際上,由于驗(yàn)證碼絕大多數(shù)為后臺(tái)生成的,所以地址是固定的。那么我們很容易就可以拿到圖片數(shù)據(jù):new 一個(gè) Image,賦值 url 即可(直接 get 到 img 元素也行)。參考代碼:

  1. var img = document.getElementById("img"); 

二、將圖片畫到 canvas 上,拿到圖片的像素?cái)?shù)據(jù)。

要將圖片畫到 canvas 上,首先要?jiǎng)?chuàng)建一個(gè) canvas 并初始化。參考代碼: 

  1. var canvas1 = document.createElement("canvas");  
  2. document.getElementsByTagName("body")[0].appendChild(canvas1);  
  3. canvas1.style.backgroundColor = "cornsilk"
  4.  var ctx1 = canvas1.getContext("2d"); 

隨后,將圖片繪制上去。參考代碼: 

  1. ctx1.drawImage(img,0,0,img.width,img.height); 

然后我們就可以利用 canvas,拿到圖片的像素?cái)?shù)據(jù)。參考代碼: 

  1. var imgData = ctx1.getImageData(0,0,WIDTH,HEIGHT); 

三、先后對(duì)圖片進(jìn)行二值化、腐蝕膨脹、切割、旋轉(zhuǎn)、縮放處理。

這部分是圖像識(shí)別的重點(diǎn),直接影響到識(shí)別準(zhǔn)確率和速度。復(fù)雜的驗(yàn)證碼還應(yīng)加上去躁等處理過(guò)程。比如可以檢測(cè)貫穿的橫線并消除,或者將顏色高度統(tǒng)一的背景去掉等等。我們的圖片幾乎沒(méi)有干擾,只有簡(jiǎn)單的旋轉(zhuǎn)和縮放,故直接進(jìn)行二值化操作(二值化也能去掉少量的干擾)。

1、二值化操作的思路是:計(jì)算圖片的平均灰度作為閾值,比閾值大的置為純黑,反之純白。參考代碼: 

  1. function toHex(fromImgData){//二值化圖像  
  2.     var fromPixelData = fromImgData.data;  
  3.     var greyAve = 0 
  4.     for(var j=0;j<WIDTH*HEIGHT;j++){  
  5.         var r = fromPixelData[4*j];  
  6.         var g = fromPixelData[4*j+1];  
  7.         var b = fromPixelData[4*j+2];  
  8.         greyAve += r*0.3 + g*0.59 + b*0.11;  
  9.     }  
  10.     greyAve /= WIDTH*HEIGHT;//計(jì)算平均灰度值。  
  11.     for(j=0;j<WIDTH*HEIGHT;j++){  
  12.         r = fromPixelData[4*j];  
  13.         g = fromPixelData[4*j+1];  
  14.         b = fromPixelData[4*j+2];  
  15.         var grey = r*0.333 + g*0.333 + b*0.333;//取平均值。  
  16.         greygrey = grey>greyAve?255:0;  
  17.         fromPixelData[4*j] = grey;  
  18.         fromPixelData[4*j+1] = grey;  
  19.         fromPixelData[4*j+2] = grey;  
  20.     }  
  21.     return fromImgData;  
  22. }//二值化圖像 

二值化后,效果如圖:

可以發(fā)現(xiàn),簡(jiǎn)單的背景色是可以去掉的。

二值化處理之后,就可以將圖片轉(zhuǎn)換成數(shù)組(存 0 或 1)來(lái)保存了。參考代碼如下: 

  1. function toXY(fromImgData){  
  2.     var result = new Array(HEIGHT);  
  3.     var fromPixelData = fromImgData.data;  
  4.     for(var j=0;j<HEIGHT;j++){  
  5.         result[j] = new Array(WIDTH);  
  6.         for(var k=0;k<WIDTH;k++){  
  7.             var r = fromPixelData[4*(j*WIDTH+k)];  
  8.             var g = fromPixelData[4*(j*WIDTH+k)+1];  
  9.             var b = fromPixelData[4*(j*WIDTH+k)+2];  
  10.             result[j][k] = (r+g+b)>500?0:1;//賦值0、1給內(nèi)部數(shù)組  
  11.         }  
  12.     }  
  13.     return result;  
  14. }//圖像轉(zhuǎn)數(shù)組 

2、接下來(lái)是腐蝕、膨脹。腐蝕的基本思路在于,將所有白色周圍的像素都置成白色,以此來(lái)消除游離的個(gè)別黑色像素點(diǎn)噪聲。膨脹正好相反,將黑色周圍置成黑色,消除數(shù)字內(nèi)部的個(gè)別白色。同時(shí),腐蝕、膨脹的操作可以讓圖片更加平滑。參考代碼: 

  1. function corrode(fromArray){  
  2.     for(var j=1;j<fromArray.length-1;j++){  
  3.         for(var k=1;k<fromArray[j].length-1;k++){  
  4.             if(fromArray[j][k]==1&&fromArray[j-1][k]+fromArray[j+1][k]+fromArray[j][k-1]+fromArray[j][k+1]==0){  
  5.                 fromArray[j][k] = 0;  
  6.             }  
  7.         }  
  8.     }  
  9.     return fromArray;  
  10. }//腐蝕(簡(jiǎn)單)  
  11. function expand(fromArray){  
  12.     for(var j=1;j<fromArray.length-1;j++){  
  13.         for(var k=1;k<fromArray[j].length-1;k++){  
  14.             if(fromArray[j][k]==0&&fromArray[j-1][k]+fromArray[j+1][k]+fromArray[j][k-1]+fromArray[j][k+1]==4){  
  15.                 fromArray[j][k] = 1;  
  16.             }  
  17.         }  
  18.     }  
  19.     return fromArray;  
  20. }//膨脹(簡(jiǎn)單) 

由于我們的圖片背景干擾不是很強(qiáng)烈,所以基本看不出差別。不過(guò)對(duì)于計(jì)算機(jī)來(lái)說(shuō),還是有不同的喲~尤其是背景復(fù)雜的圖片,這一步很好用。

3、切割。

由于我們的圖片內(nèi)各數(shù)字沒(méi)有粘連,所以切割時(shí)只需要從上至下,從左至右掃描圖片,發(fā)現(xiàn)圖片某一豎行均為白色,就切一刀。有粘連的驗(yàn)證碼比較困難,暫時(shí)不討論了。參考代碼: 

  1. function split(fromArray,count){  
  2.     var numNow = 0 
  3.     var status = false 
  4.     var w = fromArray[0].length;  
  5.     for(var k=0;k<w;k++) {//遍歷圖像  
  6.         var sumUp = 0 
  7.         for (var j=0;j<fromArray.length;j++) //檢測(cè)整列是否有圖像  
  8.             sumUp += fromArray[j][k];  
  9.         if(sumUp == 0){//切割  
  10.             for (j=0;j<fromArray.length-1;j++)  
  11.                 fromArray[j].remove(k);  
  12.             w --;  
  13.             k --;  
  14.             status = false 
  15.             continue;  
  16.         }  
  17.         else{//切換狀態(tài)  
  18.             if(!status)  
  19.                 numNow ++;  
  20.             status = true 
  21.         }  
  22.         if(numNow!=count){//不是想要的數(shù)字  
  23.             for (j=0;j<fromArray.length-1;j++)  
  24.                 fromArray[j].remove(k);  
  25.             w --;  
  26.             k --;  
  27.         }  
  28.     }  
  29.     return fromArray;  
  30. }//切割,獲取特定數(shù)字 

切割后,左右的空白因?yàn)槎急磺辛耍蜎](méi)有了。但是上下仍然存在空白,所以進(jìn)行處理。這里比較簡(jiǎn)單,就不放代碼了,思路和切割類似,但簡(jiǎn)單很多。

4、旋轉(zhuǎn)、縮放。

其實(shí)旋轉(zhuǎn)不是必要的。沒(méi)有旋轉(zhuǎn)的步驟,可以用更多的數(shù)據(jù)量訓(xùn)練來(lái)彌補(bǔ)。同理,縮放也不是必須的。先大致講一下思路:旋轉(zhuǎn)和縮放都再次利用了 canvas,將圖片畫上去之后,利用 canvas 的方法操作圖片旋轉(zhuǎn)或縮放,之后再把數(shù)據(jù)拿下來(lái),就像我們最開始讀圖片時(shí)做的一樣。旋轉(zhuǎn)時(shí),取順時(shí)針逆時(shí)針各 90 度,取左右寬度最窄的角度,當(dāng)作數(shù)字站立的旋轉(zhuǎn)角度。縮放時(shí),直接按預(yù)設(shè)長(zhǎng)寬畫圖即可。這里我就只寫了縮放。處理后再轉(zhuǎn)換回?cái)?shù)組形式。參考代碼: 

  1. function zoomToFit(fromArray){  
  2.     var imgD = fromXY(fromArray);  
  3.     var w = lastWidth 
  4.     var h = lastHeight 
  5.     var tempc1 = document.createElement("canvas");  
  6.     var tempc2 = document.createElement("canvas");  
  7.     tempc1.width = fromArray[0].length;  
  8.     tempc1.height = fromArray.length;  
  9.     tempc2.width = w;  
  10.     tempc2.height = h;  
  11.     var tempt1 = tempc1.getContext("2d");  
  12.     var tempt2 = tempc2.getContext("2d");  
  13.     tempt1.putImageData(imgD,0,0,0,0,tempc1.width,tempc1.height);  
  14.     tempt2.drawImage(tempc1,0,0,w,h);  
  15.     var returnImageD = tempt2.getImageData(0,0,WIDTH,HEIGHT);  
  16.     fromArray = toXY(returnImageD);  
  17.     fromArray.length = h;  
  18.     for(var i=0;i<h;i++)  
  19.         fromArray[i].length = w 
  20.     return fromArray;  
  21. }//尺寸歸一化 

處理后效果如圖:

四、記錄處理后的單個(gè)數(shù)字的二值化數(shù)據(jù),并人工錄入真實(shí)數(shù)字。

到這里,圖像處理就搞定了,后面的工作就比較簡(jiǎn)單了。我們把上一步得到的數(shù)組和真實(shí)的數(shù)字一起保存起來(lái)。這個(gè)過(guò)程可以有很多方法。我當(dāng)時(shí)采取了大家一起錄入的方式,所以搭建了 PHP+MySQL 的服務(wù)器,用數(shù)據(jù)庫(kù)存儲(chǔ)。這塊就不詳述了,大家各顯神威。

五、重復(fù)訓(xùn)練

為了方便訓(xùn)練,我直接在頁(yè)面里增加了手動(dòng)輸入的地方,提交后刷新驗(yàn)證碼,繼續(xù)提交。提交 20 個(gè)驗(yàn)證碼(20*4=80 個(gè)數(shù)字)后,便經(jīng)常可以正確識(shí)別出 4 位驗(yàn)證碼,在單個(gè)數(shù)字的數(shù)據(jù)量在 300 左右時(shí)(大約需要 300/4=75 個(gè)驗(yàn)證碼),識(shí)別效率已經(jīng)在 95%以上。在 500 左右時(shí)已經(jīng)基本見(jiàn)不到錯(cuò)誤識(shí)別的情況了,這時(shí)候已經(jīng)可以寫代碼實(shí)現(xiàn)自我訓(xùn)練了。此時(shí)識(shí)別一次大約需要 0.06 秒。

六、識(shí)別時(shí),用處理后的圖像與庫(kù)中數(shù)據(jù)對(duì)比,取得最相近的數(shù)據(jù),得到真實(shí)數(shù)字。

這塊也比較簡(jiǎn)單。訓(xùn)練完成后,我將數(shù)據(jù)庫(kù)數(shù)據(jù)導(dǎo)出,保存成了一個(gè)大的數(shù)組,直接用 js 就可以讀了。識(shí)別時(shí)遍歷所有的數(shù)據(jù),按像素點(diǎn)逐一比較。由于尺寸做了歸一化,所以直接數(shù)有多少像素匹配即可。匹配數(shù)量最多的即為識(shí)別出的結(jié)果。我只找到了最開始寫的 PHP 代碼,先放一下吧,有點(diǎn)懶得再寫 js 了…: 

  1. function check($str)  
  2.  
  3.     $str = str_split($str,1);  
  4.     $length = count($str);  
  5.     $tempNum = 0 
  6.     $tempSimmiar = 0 
  7.     $query = "SELECT * FROM numkeys" 
  8.     $sth = execSql($query);  
  9.     while ($RES = $sth->fetch()) {  
  10.         $thisSimmiar = 0 
  11.         $thisFeature = str_split($RES["feature"],1);  
  12.         $thisNum = $RES["resultnum"];  
  13.         for($i=0;$i<$length;$i++){  
  14.             if($thisFeature[$i]==$str[$i]){  
  15.                 $thisSimmiar ++;  
  16.             }  
  17.         }  
  18.         if($thisSimmiar>$tempSimmiar){  
  19.             $tempSimmiar = $thisSimmiar;  
  20.             $tempNum = $thisNum;  
  21.         }  
  22.     }  
  23.     return $tempNum;  

七、優(yōu)化部分

這塊就大家自己看著來(lái)吧,因?yàn)槲业膱D片不是很復(fù)雜,數(shù)據(jù)量也不是很大(千條級(jí)別),所以也沒(méi)啥優(yōu)化的必要,每次識(shí)別大約 0.1 秒吧。所以我只是沒(méi)事干,做了之前大綱里寫了那兩個(gè)優(yōu)化。其實(shí)我感覺(jué)主要的優(yōu)化方向還是圖像處理那塊,盡量減少干擾,才能提高效率,也能檢測(cè)更復(fù)雜的驗(yàn)證碼。

PS:訓(xùn)練和識(shí)別的接口:

訓(xùn)練:POST 發(fā)送 username(用戶名)、password(密碼)、n1(第一個(gè)數(shù)組)、n2、n3

、n4、num(真實(shí)四位字符)至 http://www.leonszone.cn/test/yanzhengma/train.php[3]。參考代碼: 

  1. function sendData() {  
  2.     var str = prompt("請(qǐng)輸入驗(yàn)證碼:", "");  
  3.     if(!str)  
  4.         return false;  
  5.     postData = {//整合數(shù)據(jù)包  
  6.         username: 'pdgzfx',  
  7.         password: 'pdgzfx',  
  8.         nums: str,  
  9.         n1: numsArray[0],  
  10.         n2: numsArray[1],  
  11.         n3: numsArray[2],  
  12.         n4: numsArray[3]  
  13.     };  
  14.     $.ajax({ 
  15.          url: 'http://www.leonszone.cn/test/yanzhengma/train.php',  
  16.         type: 'POST',  
  17.         data: postData,  
  18.         success: function (data) {  
  19.             console.log(data);  
  20.             setTimeout(function () {  
  21.                 location.reload();  
  22.             },1000);  
  23.         }  
  24.     });  

識(shí)別:POST 發(fā)送 username(用戶名)、password(密碼)、n1(第一個(gè)數(shù)組)、n2、n3、n4 至 http://www.leonszone.cn/test/yanzhengma/check.php[4]。參考代碼: 

  1. function getData() {  
  2.     postData = {//整合數(shù)據(jù)包  
  3.         username: 'pdgzfx',  
  4.         password: 'pdgzfx',  
  5.         nums: 'help!!!',  
  6.         n1: numsArray[0],  
  7.         n2: numsArray[1],  
  8.         n3: numsArray[2],  
  9.         n4: numsArray[3]  
  10.     };  
  11.     $.ajax({  
  12.         url: 'http://www.leonszone.cn/test/yanzhengma/check.php',  
  13.         type: 'POST', 
  14.         data: postData,  
  15.         success: function (data) {  
  16.             $("#Vercode").val(data);  
  17.             console.log(data);  
  18.         }  
  19.     });  

注冊(cè)用戶名密碼(防止大家的庫(kù)混淆):POST 或 GET 發(fā)送 username(用戶名)、password(密碼)至 http://www.leonszone.cn/test/yanzhengma/regist.php[5]。參考代碼: 

  1. function getData() {  
  2.     postData = {//整合數(shù)據(jù)包  
  3.         username: 'pdgzfx',  
  4.         password: 'pdgzfx',  
  5.         };  
  6.     $.ajax({  
  7.         url: 'http://www.leonszone.cn/test/yanzhengma/regist.php',  
  8.         type: 'POST',  
  9.         data: postData,  
  10.         success: function (data) {  
  11.             console.log(data); } }); } 

或直接瀏覽器訪問(wèn):http://www.leonszone.cn/test/yanzhengma/regist.php\?username= 你的用戶名 \&amp;amp;password=[6]你的密碼

好累,先休息下,看看有沒(méi)有人看吧…(我感覺(jué)應(yīng)該沒(méi)多少人= = 還真的有人!!!) 

 

責(zé)任編輯:龐桂玉 來(lái)源: Web開發(fā)
相關(guān)推薦

2013-06-19 10:19:59

2022-05-11 07:41:31

Python驗(yàn)證碼

2024-01-29 08:32:10

Python驗(yàn)證碼識(shí)別

2009-06-26 15:17:27

jQuery

2022-02-02 20:21:24

短信驗(yàn)證碼登錄

2015-09-21 15:31:05

php實(shí)現(xiàn)驗(yàn)證碼

2014-04-24 10:09:05

驗(yàn)證碼C#

2020-12-29 05:33:03

Serverless驗(yàn)證碼架構(gòu)

2023-10-27 08:53:13

Python驗(yàn)證碼圖片識(shí)別

2022-09-21 08:40:04

OCR技術(shù)驗(yàn)證碼

2024-05-10 08:38:16

2009-11-23 16:59:23

PHP圖形驗(yàn)證碼

2022-02-11 07:10:15

驗(yàn)證碼

2021-01-19 10:29:34

短信驗(yàn)證碼密碼

2021-06-16 06:58:09

TensorFlow識(shí)別驗(yàn)證碼

2009-12-16 15:46:41

Ruby on rai

2020-11-16 07:28:53

驗(yàn)證碼

2011-11-02 12:43:33

2024-04-08 14:10:06

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 天天爱综合 | 69av在线视频 | 日日干日日色 | 伊人网综合在线 | 国产一区二区精品在线观看 | 久久综合一区 | 国产精品国产精品国产专区不蜜 | 欧美一区二不卡视频 | 在线看免费的a | 欧美片网站免费 | 中文字幕国产一区 | 国产精品国产成人国产三级 | 色资源在线 | 不卡一区二区在线观看 | 国产999在线观看 | 免费黄色特级片 | 欧州一区二区三区 | 精久久久久 | 伊人网99 | 久久亚洲一区二区三区四区 | 色综合视频 | 成人精品鲁一区一区二区 | 久久影音先锋 | 一区二区三区精品视频 | 精品久久久久久中文字幕 | 欧美精品一区二区三区四区 | 一级片视频免费 | 91精品麻豆日日躁夜夜躁 | 精品日韩电影 | 99久久免费精品国产男女高不卡 | 天天操天天玩 | 国产一级特黄视频 | 欧美aaaaa| 日操操夜操操 | 久草新在线 | 一区二区免费在线视频 | 欧美一级黄色免费看 | 国产精品美女久久久久aⅴ国产馆 | 久久精品欧美电影 | 欧美日韩在线免费 | 一二三四在线视频观看社区 |