連接池中非常關鍵的兩個參數,到底是干啥用的?
背景
說來慚愧,從事互聯網開發好些年了,有些概念一直沒有徹底搞清楚。其中之一就是,ttp client配置連接池的時候,maxConnectionsPerHost,和maxTotalConnections,在網上搜了一圈,發現很多都講的含含糊糊的。而且有不少故障都是這兩個參數設置不合理,或者壓根就沒有設置maxConnectionsPerHost等等。
題外話,我記得我剛參加工作的時候,第一次使用http client。看見項目中,配置的連接池,有maxConnectionsPerHost,我就請教同事,這個參數是干啥的。他的答復是每條路由最大的連接數。我似懂非懂,但是又不敢多問,哈哈。
分析過程
maxTotalConnections,很好理解。既然是一個連接池,那么一個池子最大能放多少呢?這個參數默認是20。當然這個參數,在不同的連接池實現中可能是不一樣,這不是我關注的重點。

maxConnectionsPerHost,表示一個連接池中,每條路由,池化的最大連接個數。這個值,默認是2,我看過不少故障是沒有設置此值導致的。這個不是我關注的重點,我的疑問是,什么是路由?什么是連接?路由和連接的關系是啥?
首先連接是什么?這個概念很清晰,連接就是源ip:源端口加目的ip:目的端口,以及相關信息形成的邏輯概念。
那什么是路由呢?我的腦袋,一團混亂。網上也沒有比較好的文章,能解答我的疑問。我的猜測是,目的host+port端口就是路由。比如你的項目中需要訪問百度。那么baidu.com+80就是一條路由。同時也需要訪問csdn,那么csdn.net+80也是一條路由。可是這只是我的猜測。
那看看源碼吧。不同版本的http client實現方式是不一樣的。我手頭的項目有3.x,也有4.x的。我都簡單看了下,但是源碼都有一個問題是,route的實現類中,既有host,也有localAddress。

為了繼續解答我的疑問,還是直接debug。簡單寫了一個單元測試,類似這樣。

然后我看到了這樣的信息,以3.x源碼為例子,4.x原理是一致的。

獲取連接的過程,HostConfiguration 雖然其中有本地的地址信息的,但是值是空的。因此route真正起作用的是host。

獲取好連接后,檢查下連接是不是打開了,如果沒有打開,執行open方法,此時會設置localAddress。也就是一條真正的連接才算創建完成。
接下來我們看下Http的連接池,有數據的情況是啥樣。

至此我們就清晰了,連接池是以host(遠端的服務,例如baidu.com)為組,來建立連接池。maxConnectionsPerHost 用來控制一組中連接池的個數,也就是有些同學提到的,用來控制訪問某個服務并發的個數。
結論
maxConnectionsPerHost,連接池是以host(遠端的服務,例如baidu.com)為組,來建立連接池。此參數用來控制一組中連接池的個數,或者用來控制訪問,某個服務并發的個數。
需要注意默認值是2,如果不設置此值。但是流量變大,那么線上故障就會等著你。