成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

為什么隨機(jī)IP、隨機(jī)UA也逃不掉被反爬蟲的命運(yùn)

安全 應(yīng)用安全
但實(shí)際上,還有一個(gè)東西,叫做瀏覽器指紋,它是不會(huì)隨著你更換 IP 或者 User-Agent 而改變的。而且即使你不使用模擬瀏覽器,你直接使用 Golang、使用 Python,它們也有自己各自的指紋,并且他們的指紋每次請(qǐng)求也是固定的。

[[418573]]

有些同學(xué)在寫爬蟲的時(shí)候,覺得只要自己每次請(qǐng)求都使用不同的代理 IP,每次請(qǐng)求的 Headers 都寫得跟瀏覽器的一模一樣,就不會(huì)被網(wǎng)站發(fā)現(xiàn)。

但實(shí)際上,還有一個(gè)東西,叫做瀏覽器指紋,它是不會(huì)隨著你更換 IP 或者 User-Agent 而改變的。而且即使你不使用模擬瀏覽器,你直接使用 Golang、使用 Python,它們也有自己各自的指紋,并且他們的指紋每次請(qǐng)求也是固定的。只要網(wǎng)站發(fā)現(xiàn)某個(gè)擁有特定指紋的客戶端持續(xù)高頻率請(qǐng)求網(wǎng)站,它就可以把你封掉。

你似乎不相信?那我證明給你看。

現(xiàn)在,我準(zhǔn)備一個(gè)隧道代理,如下圖所示:

然后,我們打開一個(gè)網(wǎng)站:https://ja3er.com/json . 當(dāng)你用電腦瀏覽器打開它的時(shí)候,它是這樣的:

不論你怎么刷新網(wǎng)頁,這上面的字符串都是不會(huì)變的。

現(xiàn)在,我使用 Python 去請(qǐng)求這個(gè)頁面,看到的內(nèi)容如下圖所示:

可以看到,雖然我使用了隧道代理,每次請(qǐng)求的 IP 都是不一樣的,但是這個(gè)網(wǎng)站返回的內(nèi)容始終是一樣的。所以如果這不是一個(gè)測(cè)試網(wǎng)站,而是一個(gè)加了這個(gè)檢測(cè)機(jī)制的網(wǎng)站,那么它輕松就能把我給屏蔽了。

這個(gè)檢測(cè)算法,叫做JA3算法。這個(gè)算法在官網(wǎng)上面的介紹信息如下:

The JA3 algorithm takes a collection of settings from the SSL “Client Hello” such as SSL/TLS version, accepted cipher suites, list of extensions, accepted elliptic curves, and elliptic curve formats.

JA3算法收集了 SSL 請(qǐng)求里面的信息,包括但不限于 SSL/TLS 版本,Cipher Suites數(shù)量,瀏覽器擴(kuò)展列表,elliptic curves等等。通過這一系列參數(shù)綜合起來生成一個(gè)指紋字符串。也許這些參數(shù)里面,你跟一些人的 Cipher Suites 數(shù)量相同,你跟另外一些人的瀏覽器擴(kuò)展數(shù)相同,你又跟另外一些人的 TLS版本號(hào)相同……但是所有這些參數(shù)全部相同的人,就非常少了。而在這非常少的人里面,這些人還同時(shí)訪問同一個(gè)網(wǎng)站的可能性就更小了。所以,網(wǎng)站用 JA3算法,可以近似認(rèn)為,在一段時(shí)間內(nèi),指紋字符串相同的連續(xù)請(qǐng)求,有極大概率是來自同一個(gè)人。

JA3算法的三個(gè)作者之一John Althouse寫了一篇文章來介紹瀏覽器指紋和 JA3算法:TLS Fingerprinting with JA3 and JA3S | by John Althouse | Salesforce Engineering[1] 。有興趣的同學(xué)可以看一看。

但我們說,魔高一尺,道高一丈。JA3算法是不是真的無懈可擊呢?其實(shí)也不是,仍然有辦法繞過去的。請(qǐng)大家期待我后面的文章。

P.S.: 給大家科普一個(gè)小知識(shí),日常生活中,我們常常聽一些人說,道高一尺,魔高一丈,又聽另一些人說,魔高一尺,道高一丈。那么這兩句到底哪一句是對(duì)的,什么情況下應(yīng)該用哪一句呢?

其實(shí),以道高一尺,魔高一丈為例,它的意思是,道非常厲害,道往上漲一尺所產(chǎn)生的力量,魔需要往上漲一丈才能抵消。通俗的講,就是巨人走一步,普通人要走十步才能追的上。

同理,魔高一尺,道高一丈的意思是魔非常厲害,魔往上漲一尺所產(chǎn)生的力量,道需要往上漲一丈才能抵消。

但我們?nèi)粘I钪校芏嗳艘詾椋Ц咭怀撸栏咭徽傻囊馑际钦f,魔長(zhǎng)高一尺的時(shí)間,道已經(jīng)長(zhǎng)高了一丈,所以魔永遠(yuǎn)追不上道。這種理解是錯(cuò)誤的,這些人剛好把意思搞反。

參考資料

[1]TLS Fingerprinting with JA3 and JA3S | by John Althouse | Salesforce Engineering:https://engineering.salesforce.com/tls-fingerprinting-with-ja3-and-ja3s-247362855967

本文轉(zhuǎn)載自微信公眾號(hào)「未聞Code」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系未聞Code公眾號(hào)。

 

責(zé)任編輯:武曉燕 來源: 未聞Code
相關(guān)推薦

2022-07-28 14:17:45

黑客網(wǎng)絡(luò)攻擊

2023-12-06 07:33:20

MySQL鎖事間隙鎖

2025-02-04 17:24:22

2012-10-16 09:44:38

微軟Windows 8

2022-11-24 10:24:32

2016-10-13 15:51:50

2022-09-14 23:06:45

2009-12-01 10:19:24

WiMAX

2015-02-05 09:45:19

拙劣軟件軟件開發(fā)

2016-08-17 12:29:53

存儲(chǔ)SSDNAND Flash

2022-03-16 10:07:35

AMDIntel芯片

2021-12-27 09:31:20

HashtableJava隨機(jī)數(shù)

2013-07-10 09:38:22

OpenStackLinux

2021-04-12 05:58:43

進(jìn)程內(nèi)核機(jī)制

2012-02-09 10:41:33

小米手機(jī)雷軍

2010-03-16 16:11:31

2025-02-17 08:10:00

C++代碼lambda

2022-09-20 07:02:20

網(wǎng)絡(luò)爬蟲反爬蟲

2018-01-29 09:28:44

2019-03-21 08:53:01

DRAM存儲(chǔ)器芯片
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 国产精品视频观看 | 香蕉久久久久久 | 精品国产乱码久久久久久中文 | 日韩有码一区 | 成人一区二区三区在线观看 | 羞羞视频在线观看网站 | 精品国产精品国产偷麻豆 | 欧美午夜在线 | 日韩av一区二区在线观看 | 国产成人精品一区二区 | 黄色毛片免费看 | 一区二区福利视频 | 国产小视频在线 | 国产精品精品视频 | 色视频一区二区 | 日韩一级免费电影 | 成人在线观看免费 | 久久久久99 | 在线日韩中文字幕 | 久久精品性视频 | 一区二区中文字幕 | 亚洲激情在线观看 | 成人精品一区 | 日韩精品在线免费 | 亚洲精品乱码久久久久v最新版 | 午夜免费电影院 | 色秀网站| 成人影| 亚洲精品一区二区三区蜜桃久 | 男女网站视频 | 日本a v在线播放 | 一区二区三区精品 | 三级在线免费 | 东方伊人免费在线观看 | 久久er精品 | 久久久www成人免费无遮挡大片 | 成人精品一区二区户外勾搭野战 | 精品国产18久久久久久二百 | 国产成人麻豆免费观看 | 黑人巨大精品欧美黑白配亚洲 | 国产精品有限公司 |