成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

前端開(kāi)發(fā)中的字符編碼詳解

開(kāi)發(fā) 后端 前端
本文旨在更好的全面了解涉及前端開(kāi)發(fā)領(lǐng)域的字符編碼,避 免可能出現(xiàn)的交互和開(kāi)發(fā)中的忽視的漏洞。

前端開(kāi)發(fā)過(guò)程中會(huì)接觸各種各樣的編碼,比較常見(jiàn)的主要是UTF-8和HTML實(shí)體編碼,但是web前端的世界卻不止這兩種編碼,而且編碼的選擇也會(huì) 造成一定的問(wèn)題,如前后端開(kāi)發(fā)過(guò)程中不同編碼的兼容、多字節(jié)編碼可能會(huì)造成的XSS漏洞等。因此,本文旨在更好的全面了解涉及前端開(kāi)發(fā)領(lǐng)域的字符編碼,避 免可能出現(xiàn)的交互和開(kāi)發(fā)中的忽視的漏洞。

URL編碼

我曾經(jīng)在URL編碼解碼和base64一文中講述了URL編碼中的三組函數(shù),并對(duì)比了這三組函數(shù)與base64編碼的關(guān)系,在此簡(jiǎn)要說(shuō)明一下。
escape/unescape函數(shù)針對(duì)寬字符做unicode編碼,并針對(duì)碼值做十六進(jìn)制編碼,所以使用escape針對(duì)漢字編碼會(huì)得到形 如”\uxxxx”的結(jié)果;encodeURI/decodeURI,encodeURIComponent/decodeURIComponent函數(shù) 針對(duì)寬字節(jié)編碼卻不同于escape,首先針對(duì)寬字節(jié)字符進(jìn)行UTF-8編碼,然后針對(duì)編碼后的結(jié)果進(jìn)行“%”替換,得到結(jié)果。以上所述都是針對(duì)寬字節(jié)字 符而言,對(duì)于編碼靠前的ASCII字符而言,上述三組函數(shù)的安全字符的范圍也有所不同,具體可在上文中了解。

base64編碼

base64編碼在前端通常用于圖片和icon的編碼,它將每3個(gè)8位字節(jié)為一組,分成4組6位字節(jié),并且每個(gè)字節(jié)的高位補(bǔ)零,形成4個(gè)8位的字 節(jié),由此可看出base64編碼是可逆推的。在大多數(shù)瀏覽器中,提供了ASCII字符的base64編碼函數(shù),即window.btoa()。該函數(shù)無(wú)法 針對(duì)寬字節(jié)進(jìn)行base64編碼,若針對(duì)中文編碼,則需現(xiàn)轉(zhuǎn)換位UTF-8編碼,然后進(jìn)行base64編碼。

  1. function unicodeToBase64(s){ return window.btoa(unescape(encodeURIComponent(s))) } 

通過(guò)encodeURIComponent對(duì)寬字節(jié)字符編碼,是“%xx”形式的編碼,與UTF8編碼的區(qū)別僅在于前綴(這是由規(guī)范RFC3986決定的,將非ASC字符進(jìn)行某種形式編碼,并轉(zhuǎn)換為16進(jìn)制,并在字節(jié)前加上“%”)。因此通過(guò)unescape(encodeURIComponent(s))可以轉(zhuǎn)化為UTF8字節(jié)。當(dāng)然,也可自己寫(xiě)一個(gè)轉(zhuǎn)換函數(shù),按照一定規(guī)則便行為UTF-8編碼的字節(jié),如下例:

  1. ``` 
  2. unescape(encodeURIComponent("中國(guó)")) //結(jié)果:"中国" 
  3. encodeURIComponent("中國(guó)"//結(jié)果:"%E4%B8%AD%E5%9B%BD" 
  4. console.log("\u00E4\u00B8\u00AD\u00E5\u009B\u00BD"// 結(jié)果: "中国" 
  5. ``` 

通過(guò)簡(jiǎn)單的replace函數(shù),就可以完成URL編碼到UTF8編碼的轉(zhuǎn)換,進(jìn)而完成寬字節(jié)字符到base64編碼的轉(zhuǎn)換。有了這個(gè)函數(shù),我們手動(dòng)生成一些data URI形式的內(nèi)容,只需制定MIME類型和編碼方式,就可以實(shí)現(xiàn)文本的轉(zhuǎn)換,如以下代碼:

```

  1. <a href="data:text/html;charset=utf-8;base64,PHNjcmlwdD5hbGVydCgxMik8L3NjcmlwdD4=" >abc</a> 
  2. // 未編碼前:<a href="javascript: alert(1)">test</a> 
  3. ``` 

前端UTF8編碼與后端GBK編碼的兼容

目前前端大都采用UTF8進(jìn)行編碼,不管是html、js抑或是css,而后端則由于歷史原因大都采用GBK或GB2312進(jìn)行解碼,因此前端通過(guò) parameter傳遞的URL編碼的字符串就不可能直接在后臺(tái)進(jìn)行解碼,為了更好的兼容性,前端可進(jìn)行兩次URL編碼,即 encodeURIComponent(encodeURIComponent(“中國(guó)”)),這樣后端接收到參數(shù)后,先使用GBK或GB2312解碼, 得到了UTF8編碼后再使用UTF8解碼即可。兩次編碼主要是利用“ASC字符使用GBK或GB2312編碼不變”的特點(diǎn)完成,富有技巧。

HTML實(shí)體編碼與進(jìn)制編碼

實(shí)體編碼針對(duì)HTML的預(yù)留字符而言,如“<>”等。實(shí)體編碼有兩種形式&實(shí)體名;&entity_number;,由于瀏覽器對(duì)&實(shí)體名;的兼容性有差別,因此***采用實(shí)體號(hào)的形式編碼。

進(jìn)制編碼,顧名思義將ASC字符對(duì)應(yīng)的碼值按照十六進(jìn)制或十進(jìn)制編碼,并轉(zhuǎn)化為&#x;(16進(jìn)制)&#D;(10進(jìn)制)形式。

單單針對(duì)實(shí)體編碼而言并沒(méi)有什么特殊強(qiáng)調(diào)的點(diǎn),之所以把它單獨(dú)列為一個(gè)章節(jié),意在強(qiáng)調(diào)這兩種編碼與js代碼的作用域的關(guān)系。

  1. <div onclick="document.write('<img src=1 onerror=alert(23)>')">cccc</div> 
  2. <div onclick="document.write('&lt;img src=1 onerror=alert(23)&gt;')">cccc</div> 
  3. <img src=1 onerror=alert(23)> 
  4. <img src=1 onerror=alert(23)> 
  5. <script> 
  6.    document.write('&lt;img src=1 onerror=alert(23)&gt;'); 
  7.    document.write('<img src=1 onerror=alert(3)>'); 
  8.    document.write('<img src=1 onerror=alert(23)>'
  9.    document.write('\u003c\u0069\u006d\u0067\u0020\u0073\u0072\u0063\u003d 
  10. \u0031\u0020\u006f\u006e\u0065\u0072\u0072\u006f\u0072\u003d\u0061 
  11. \u006c\u0065\u0072\u0074\u0028\u0032\u0033\u0029\u003e') 
  12. </script> 

代碼中列舉了8個(gè)例子,***個(gè)在事件處理函數(shù)onclick中輸出HTML片段;第二個(gè)則輸出經(jīng)實(shí)體編碼后的HTML片段;第三個(gè)則是直接針對(duì)<img src=1 onerror=alert(23)>做16進(jìn)制編碼;第四個(gè)則是針對(duì)onerror事件處理函數(shù)做16進(jìn)制編碼;第五個(gè)則是在腳本中輸出實(shí)體編碼的字符;第六個(gè)針對(duì)事件處理函數(shù)做16進(jìn)制編碼;第七個(gè)則針對(duì)所有的字符做16進(jìn)制編碼;第八個(gè)則是在script中直接輸出<img src=1 onerror=alert(23)>的unicode編碼。

對(duì)比結(jié)果,前兩個(gè)例子在點(diǎn)擊后都會(huì)彈出alert;第三個(gè)例子則在頁(yè)面中顯示文本<img src=1 onerror=alert(23)>; 第四個(gè)例子則會(huì)在頁(yè)面加載初期彈出alert;第五、七會(huì)輸出字符串;第六、八則會(huì)在第四個(gè)例子中的alert之后也彈出alert。現(xiàn)在分析這些結(jié)果, 通過(guò)***二個(gè)例子可知道,HTML標(biāo)簽中(除script標(biāo)簽)的內(nèi)聯(lián)js代碼可以進(jìn)行HTML實(shí)體編碼,這是非常重要的一點(diǎn),我們可以更為明確的進(jìn)行驗(yàn) 證:

  1. <div onclick="alert('&lt;img src=1 onerror=alert(23)&gt;')">cccc</div> 

輸出的結(jié)果自然是<img src=1 onerror=alert(23)>,這的確論證了我們上文提到的這一點(diǎn);第三個(gè)例子說(shuō)明了HTML解析器在進(jìn)行詞法分析前,首先進(jìn)行解碼,十六進(jìn)制和十進(jìn)制皆可,因此,結(jié)果自然輸出形如<img src=1 onerror=alert(23)>的 字符串;第四個(gè)例子則緊接著論證了內(nèi)聯(lián)在HTML的并采用十六進(jìn)制編碼的js代碼同樣會(huì)被正確解析并執(zhí)行,這說(shuō)明了進(jìn)制編碼同樣可被HTML解析器解析; 第五、七個(gè)例子說(shuō)明在js中同樣可以使用實(shí)體編碼和進(jìn)制編碼,解析的結(jié)果會(huì)渲染在頁(yè)面上;第六個(gè)例子則論證了上一觀點(diǎn),只針對(duì)事件處理函數(shù)做進(jìn)制編碼,執(zhí) 行后頁(yè)面彈出alert;第八個(gè)例子則是在js中執(zhí)行unicode編碼的字符串,正常alert。

由此可見(jiàn),js代碼內(nèi)聯(lián)在HTML的非script標(biāo)簽內(nèi),則會(huì)遵守HTML編碼規(guī)范:進(jìn)制編碼和實(shí)體編碼;而在js代碼(script標(biāo)簽內(nèi)以及js文件內(nèi))中,則遵從js編碼:1,unicode形式編碼(\uxxxx)2,普通的16進(jìn)制編碼(\xH),這可通過(guò)第八個(gè)例子得到證明。之所以在本節(jié)提到這么多編碼特點(diǎn),主要提醒大家在預(yù)防XSS時(shí)需要注意的幾點(diǎn):

  • 檢測(cè)用戶輸入時(shí),不僅僅需要防范類似“<>”這樣的字符,通過(guò)unicode編碼或進(jìn)制編碼仍有可能注入代碼

  • 需要針對(duì)特定的關(guān)鍵字做過(guò)濾,如“eval、write、prototype”

  • 盡可能禁止內(nèi)聯(lián)事件處理函數(shù)的使用

  • js過(guò)濾“src/href/action”屬性,如“javascript:”,”data:”

JS編碼

其實(shí)在上節(jié)中已提到了js編碼,即js可執(zhí)行unicode編碼和十六(八)進(jìn)制編碼后的字符串,但是不支持十進(jìn)制編碼的字串。具體操作可通過(guò)常用 的幾個(gè)函數(shù)來(lái)實(shí)現(xiàn),如“eval,write,setTimeout,F(xiàn)unction”執(zhí)行編碼后的字符串;同樣,對(duì)于十進(jìn)制編碼的字串,通過(guò)結(jié)合 String.fromCharCode和eval同樣可以執(zhí)行。

在此附上筆者實(shí)現(xiàn)的字符轉(zhuǎn)換,更為靈活的實(shí)現(xiàn)各種自定義形式的字串編碼:

 

  1. var Code = {}; 
  2. /** 
  3. * 
  4. * @param str 待編碼字串 
  5. * @param jinzhi 進(jìn)制編碼 
  6. * @param prefix 前綴 
  7. * @param postfix 后綴 
  8. * @param count 總共編碼的位數(shù),默認(rèn)為4 
  9. * @returns {string} 
  10. */ 
  11. Code.encode = function({str = '',jinzhi = '16',prefix = '\\u',postfix = ';',count = '4'} = {}){ 
  12.     var ret = ''
  13.     var addZero,tmp; 
  14.     for(let i=0;i<str.length;i++){ 
  15. tmp = str.charCodeAt(i).toString(jinzhi); 
  16. addZero = count - tmp.length + 1
  17. ret += prefix + new Array(addZero).join('0') + tmp + postfix; 
  18.     } 
  19.     return ret; 
  20. }; 
  21. Code.decode = function({str = '',jinzhi = '16',prefix = '\\u',postfix = ';'} = {}){ 
  22.     var ret = ''
  23.     var splits = str.split(';'); 
  24.     for(let i=0;i<splits.length;i++){ 
  25. let tmp = splits[i].replace(prefix,''); 
  26. ret += String.fromCharCode(parseInt(tmp,jinzhi)); 
  27.     } 
  28.     return ret; 
  29. }; 
  30.  
  31. console.log(Code.encode({str: '<img src=@ onerror=alert(123) />'})); 
  32. console.log(Code.decode({str: Code.encode({str: '<img src=@ onerror=alert(123) />'})})) 

另外,對(duì)于js輸出點(diǎn)的過(guò)濾其實(shí)并不僅限于上文提到的如eval、setTimeout、Function等幾個(gè),由于JS語(yǔ)法比較靈活相對(duì)“漏洞”較多,可使用的“線索”也越豐富,如前段時(shí)間在Stackoverflow上發(fā)現(xiàn)的一個(gè)問(wèn)題,即

 

  1. (0)['constructor']['constructor']('return "abc;"')() 

同樣可以執(zhí)行JS代碼,確實(shí)挺有特點(diǎn)的,具體為什么上述形式可以執(zhí)行代碼,請(qǐng)讀者自己仔細(xì)品味。

責(zé)任編輯:王雪燕 來(lái)源: royalrover
相關(guān)推薦

2010-11-25 15:59:33

字符串.NET

2023-04-13 00:24:00

前端編碼JavaScrip

2010-05-11 17:45:17

MySQL字符

2019-11-19 16:45:09

Web前端開(kāi)發(fā)編碼原則

2024-03-04 07:50:04

Python字符編碼網(wǎng)絡(luò)通信

2011-09-30 10:18:50

Web

2013-05-21 09:54:39

Web前端

2011-02-24 09:27:00

Java字符集編碼

2020-11-05 10:20:54

前端編碼規(guī)范安全漏洞

2009-06-05 15:16:17

Eclipse編碼設(shè)置

2011-06-14 11:48:38

Webkit QT

2009-06-08 19:52:47

Eclipse字符編碼

2009-11-16 14:31:26

原型開(kāi)發(fā)

2012-05-25 09:09:25

Windows Pho

2010-10-08 09:51:52

Mysql設(shè)置字符

2018-05-25 12:18:02

webhtml5javascript

2021-12-24 16:55:44

前端開(kāi)發(fā)JavaScript

2023-03-29 10:19:44

異步編程AsyncPromise

2014-04-14 10:03:16

2011-08-10 17:37:00

iPhoneASIHTTPRequ
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 婷婷99 | 久久久成人网 | 国产日韩精品一区二区 | 欧美乱操| 久久综合九九 | 亚洲国产高清高潮精品美女 | 免费不卡av| 精国产品一区二区三区 | 7777在线视频 | 美美女高清毛片视频免费观看 | 日日干干夜夜 | 国产高清免费视频 | 99久久婷婷 | 国产精品久久久久久久午夜 | 久久久久国产精品 | 中文字幕av一区二区三区 | 伊人色综合久久久天天蜜桃 | 日本在线黄色 | 久久精品色欧美aⅴ一区二区 | 亚洲视频在线播放 | 天天天天操 | jlzzxxxx18hd护士| 久久99精品久久久久久国产越南 | 四虎影视1304t| 男人的天堂久久 | 精品久久香蕉国产线看观看亚洲 | 亚洲精品久久久久中文字幕欢迎你 | 91精品国产色综合久久不卡98 | av片在线观看 | 91精品国产综合久久国产大片 | 97精品国产97久久久久久免费 | 欧美精品电影一区 | 超碰一区二区 | 69堂永久69tangcom | 毛片com | 国产日韩电影 | 波多野吉衣久久 | 日韩视频 中文字幕 | 欧美亚洲国产日韩 | 日本一区二区三区在线观看 | 91久久久久久久久 |