成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

啃論文俱樂部---JSON壓縮算法解讀

系統 OpenHarmony
cJSON壓縮算法的特點就是可以使用自動類型提取壓縮JSON數據格式的內容。它成功解決了一個非常重要的問題,就是我們上一小節提到的第三點,將不斷重復的鍵名舍去了。

??想了解更多關于開源的內容,請訪問:??

??51CTO 開源基礎軟件社區??

??https://ost.51cto.com??

JSON壓縮算法解讀

接下來我們進入關于JSON壓縮算法的學習。

為什么需要壓縮JSON?

盡管JSON數據格式比XML效率要高,但是它仍然是web服務器和瀏覽器傳輸過程中比較低效的數據格式。為什么呢?首先,它將所有的內容都轉換為了文本,第二是轉換之后的文本過度使用引號,這樣會給每個字符串添加多兩個字節。第三,它本身沒有schema的標準格式,比如在一個消息中序列化多個對象的時候,即使每個對象的屬性的鍵名是重復且相同的,但是轉換后的文本數據還是會重復每一個鍵名。

JSON以前的時候有一個優勢,就是可以被Javascript引擎直接解析,但因為現在越來越重視安全性,JSON的這個優勢也逐漸消失了,但是因為它比XML效率以及性能都更高,所以許多傳統的C/S模式都是選擇JSON,比如web服務,當有龐大的數據量以及復雜數據結構需要從web瀏覽器中傳輸到服務器的時候,JSON壓縮就起到了非常大的作用,然而中間就會存在我們剛剛說的三點問題,我們也不能使用傳統的gzip壓縮算法,因為瀏覽器不知道服務器是否支持gzip解壓。

下面我們就來看看兩種常見的JSON壓縮算法,cJSON與HPack。

cJSON壓縮算法(cJSON Compression Algorithm)

cJSON壓縮算法的特點就是可以使用自動類型提取壓縮JSON數據格式的內容。它成功解決了一個非常重要的問題,就是我們上一小節提到的第三點,將不斷重復的鍵名舍去了,我們我們來看一個例子:

使用cJSON前的數據格式:

[
{ //表示一個坐標點
"x":100,
"y":100
},
{ //表示一個長方形
"x":100,
"y":100,
"width":200,
"height":150
},
{},//表示一個空對象
... //以下省略數以萬計的對象
]

上面未經壓縮的數據中,我們可以看到有非常多的空間被重復的鍵名所占據,比如“x”,“y”等等,當數據非常多的時候,這些看起來不起眼的重復鍵名會給傳輸效率帶來非常大的影響,其實解決思路也非常簡單,因為他們是重復的,那我們??只存儲一次??不就好了?下面我們來按照我們的思路看看cJSON處理過后的數據吧。

{
"templates":[
["x","y"], //type1
["x","y","width","height"] //type2
],
"value":[
{ //第一個對象:坐標點
"type":1,
"values":[
100,
100
]
},
{ //第二個對象:矩形
"type":2,
"values":[
100,
100,
200,
150
]
},
{
//第三個空對象
},
//以下省略數以萬計的對象......
]
}

從上面的數據中我們可以看到,我們格式化了數據,把鍵名存儲了起來,重復的就不存儲,然后值通過“type”索引來對應鍵名,這樣在數據量龐大的時候確實減少了不少空間,但是我們仔細看“templates”內的鍵名依舊有重復的字段存在。說明了我們還存在優化空間,優化完壓縮后效果如下:

{  "function": "cjson",
"templates": [
[0, "x", "y"],
[1, "width", "height"]
],
"values": [
[1, 100, 100 ], //第一個對象:坐標點
[2, 100, 100, 200, 150 ], //第二個對象:矩形
[] //第三個空對象
]
}

直接看壓縮后的代碼結構你可能不太能理解,那我們就來看看他的具體原理,為了解決“template”內鍵名重復的字段,這個算法采用了樹這個數據結構,每遇到一個要傳輸的對象,就按順序把鍵值存入樹的節點中(灰色的節點是被標記的結尾節點指針,表示該節點存儲的是某個對象最后一個屬性的鍵值),重復的就不存儲,這樣就解決了我們的問題,這個鍵值樹的變化過程如下:

【FFH】啃論文俱樂部---JSON壓縮算法解讀-開源基礎軟件社區

最后數據在匹配鍵值的時候就根據 “values” 中所標記的結尾節點指針找到對應鍵值數組,這樣就構成了cJSON的壓縮算法。

仔細的同學就會發現,如果一個對象中沒有"X"和"Y",只有“width”和“height”,或者鍵值節點順序是錯的,是不是會出問題?答案是對的,會出現無法匹配的鍵值的情況,所以這種方法只能在特定的場景下應用,存在一定局限性。

總體來說,cJSON在處理非常龐大的數據量的時候效果還是非常客觀的。

JSON.HPack壓縮算法(HPack Compression Algorithm)

JSON.HPack是一種無損、跨語言、注重性能的JSON數據壓縮算法,可以讓我們在使用post請求在客戶端發送數據到服務器的過程中相對普通JSON格式節省約70%的字符。

其原理本質上也是跟cJSON一樣將鍵值抽離開,舉個例子:

使用HPack算法前:

{   
"id" : 1,
"sex" : "Female",
"age" : 38,
"classOfWorker" : "Private",
"maritalStatus" : "Married-civilian spouse present",
"education" : "1st 2nd 3rd or 4th grade",
"race" : "White"
}

使用HPack算法后:

["id","sex","age","classOfWorker","mari talStatus","education","race"],
[1,"Female",38,"Private","Married-civilian spouse present","1st 2nd 3rd or 4th grade","White"]

可以看到相對于普通JSON以及cJSON少了很多字符,比如引號,各種括號等等,這種壓縮算法在數據量龐大的情況下效果也非常可觀。

HPack算法提供了幾個級別的壓縮(從0到4)。等級越高壓縮效率越高,每提升一個等級都有引入附加功能。0級壓縮通過從結構中分離鍵值來執行最基本的壓縮,并在索引0的元素上創建鍵名數組,下一個等級就可以通過假設存在重復條目來進一步減小JSON數據的大小。

性能分析

接下來我們直接用數據來看看這幾個壓縮算法的壓縮效率,我們分別用5組大小不同的JSON文件(50KB~1MB),每個JSON文件將使用servlet容器(tomcat)提供給瀏覽器,并分別用以下算法進行壓縮:

  • Original JSON size - 未作修改的JSON數據。
  • Minimized - 刪除空白和新行(最基本的js優化)。
  • Compresse cJSON - 使用CJSON壓縮算法進行JSON壓縮。
  • Compresse HPack - 使用JSON.HPack壓縮算法進行JSON壓縮。
  • Gzipped - 使用gzip和進行JSON壓縮。
  • Gzipped + Minimized - 使用gzip和刪除空白和新行(最基本的js優化)進行JSON壓縮。
  • Gzipped + Compresse cJSON - 使用gzip和CJSON壓縮算法進行JSON壓縮。
  • Gzipped + Compresse HPack - 使用gzip和JSON.HPack壓縮算法進行JSON壓縮。

下圖(TABLE I.RESULTES)是用以上各種方式處理完后的JSON數據大小(bytes),不同列表示不同的JSON數據集,不同行表示使用不同的壓縮方式。

【FFH】啃論文俱樂部---JSON壓縮算法解讀-開源基礎軟件社區

下面第一個圖表Y軸表示JSON數據大小(bytes):

【FFH】啃論文俱樂部---JSON壓縮算法解讀-開源基礎軟件社區

第二張圖Y軸是JSON數據大小的百分比(%),原始數據為100%:

【FFH】啃論文俱樂部---JSON壓縮算法解讀-開源基礎軟件社區

從上面的幾個圖表中我們可以直觀地看到,單獨使用cJSON可以把原始數據大小壓縮到45%左右,單獨使用HPack可以把原始數據大小壓縮到8%左右,可見整體上HPack是優于cJSON的。

然而我們可以看到當使用gzip和上面提到的兩個壓縮算法相結合進行JSON壓縮,效果才是最優的,基本可以達到1%~2%的壓縮率。

總的來說,HPack比cJSON效率更高,速度也更快,但是在使用壓縮算法進行傳輸的過程中,接收的一端需要進行相應的解壓縮操作,否則無法使用被壓縮過后的JSON數據,這一步也會存在一定的性能開銷,在我們選擇使用JSON壓縮的時候,也需要考慮到這一點。當可以使用gzip進行壓縮的時候,這種方法比其他壓縮算法的效率都高,當兩者同時結合起來,效果顯而易見。

好了,我們這一次完整地了解了JSON序列化的發展,規范,應用以及相關的壓縮算法,相信大家不僅對JSON壓縮算法有了更深的了解,也對JSON序列化這個技術領域有了深刻的認識。

文章相關附件可以點擊下面的原文鏈接前往下載:

https://ost.51cto.com/resource/2290。

??想了解更多關于開源的內容,請訪問:??

??51CTO 開源基礎軟件社區??

??https://ost.51cto.com??。


責任編輯:jianghua 來源: ??51CTO開源基礎軟件社區
相關推薦

2022-08-22 17:36:13

啃論文方法啃論文俱樂部

2022-06-15 15:56:22

壓縮算法神經網絡

2022-10-18 16:14:28

2022-04-07 15:03:07

Harmony計算機鴻蒙

2022-06-27 14:01:31

LZ4 分析數據密集型壓縮算法

2022-06-08 11:46:29

字符串鴻蒙

2022-05-12 15:05:32

云計算數據壓縮

2022-06-08 16:29:45

無損壓縮方案分布式

2022-05-13 22:44:35

物聯網算法鴻蒙

2022-06-15 16:06:29

LZ4 算法硬件加速

2022-06-15 15:44:21

無損數據壓縮鴻蒙

2022-04-20 20:37:58

鴻蒙操作系統

2022-09-30 13:57:15

JSON解析C語言

2022-05-13 23:03:25

大數據Big Data巨量資料

2022-02-24 16:32:26

OpenHarmon壓縮編碼鴻蒙

2022-03-28 15:09:17

無線傳感器網絡Harmony鴻蒙

2022-09-14 15:28:19

操作系統鴻蒙

2022-09-15 15:21:22

操作系統鴻蒙

2022-09-16 15:01:37

操作系統技術鴻蒙

2022-09-07 15:08:58

操作系統鴻蒙
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 精品欧美一区二区三区 | 成人美女免费网站视频 | 亚洲bt 欧美bt 日本bt | 狠狠操狠狠干 | 国产一二区视频 | 国产成人网 | 在线中文字幕av | 中文字幕日韩欧美 | 成人免费xxxxx在线视频 | 国产一级淫片a直接免费看 免费a网站 | 久草综合在线视频 | 九九伦理片 | 欧美一区视频 | 99亚洲精品 | 免费一级毛片 | 综合激情av | 欧美中文在线 | av天天看 | 亚洲高清在线 | 国产黄色在线观看 | 欧美精品在线免费 | 九色www| a久久 | 手机日韩| 极品一区 | 一区二区三区精品 | 国产精品区二区三区日本 | 精品国产乱码一区二区三区 | 永久www成人看片 | 日本在线免费看最新的电影 | 国产成人精品久久二区二区91 | av毛片 | 日韩一区二区三区视频在线观看 | 中文字幕免费 | 国产亚洲成av人片在线观看桃 | 成人乱人乱一区二区三区软件 | 亚洲午夜视频 | 国产精品免费一区二区三区四区 | 国产精产国品一二三产区视频 | 粉嫩一区二区三区性色av | 日韩一区二区三区精品 |