成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

String最大長度是多少?涉及知識面太多,不要錯過!

開發 前端
當你看到這個問題“String長度限制是多少”時是不是感覺很無聊?的確,這就是我第一眼看到時的感覺。

[[397376]]

本文轉載自微信公眾號「程序新視界」,作者二師兄。轉載本文請聯系程序新視界公眾號。  

前言

當你看到這個問題“String長度限制是多少”時是不是感覺很無聊?的確,這就是我第一眼看到時的感覺。

但當深入追蹤該問題時,才發現String的長度限制本身的意義并不重要,重要的是在此過程中會將大量知識點串聯起來,簡直是一個完美的問題。難怪在高階段的面試中會出現類似的問題。

本篇文章就來帶大家追尋String長度的限制,需要提醒讀者的是,結論并不重要,重要的是分析的過程,以及涉及到的知識儲備。比如,String的底層實現、int類型的范圍、《Java虛擬機規范》、Java編譯器源碼實現等大量知識點。

String源碼追蹤

要看String類的長度限制,肯定要先從String的源碼實現看起,這里就以目前使用最多的JDK8為例來進行說明。JDK9及以后String的底層實現有所變化,大家可參考《JDK9對String字符串的新一輪優化》一文。

我們都知道,String類提供了一個length方法,我們是否可以直接通過這個方法得知String的最大長度?

  1. /** 
  2.  * Returns the length of this string. 
  3.  * The length is equal to the number of <a href="Character.html#unicode">Unicode 
  4.  * code units</a> in the string. 
  5.  * 
  6.  * @return  the length of the sequence of characters represented by this 
  7.  *          object. 
  8.  */ 
  9. public int length() { 
  10.     return value.length; 

這里文檔并沒有說明最大長度是多少,但我們可以從返回的結果類型得知一些線索。結果類型為int,也就是說int的取值范圍便是限制之一。

如果你知道int在正整數部分的取值范圍為2^31 -1那很好,如果不知道,可以查看對應的包裝類Integer:

  1. public final class Integer extends Number implements Comparable<Integer> { 
  2.     /** 
  3.      * A constant holding the minimum value an {@code int} can 
  4.      * have, -2<sup>31</sup>. 
  5.      */ 
  6.     @Native public static final int   MIN_VALUE = 0x80000000; 
  7.  
  8.     /** 
  9.      * A constant holding the maximum value an {@code int} can 
  10.      * have, 2<sup>31</sup>-1. 
  11.      */ 
  12.     @Native public static final int   MAX_VALUE = 0x7fffffff; 
  13.     // ... 

無論MIN_VALUE和MAX_VALUE的值或注釋都說明了int的取值范圍。此時計算一下String的最大長度應該是:

  1. 2^31 - 1 = 2147483647 

回到length方法,我們看到length的值是通過是value獲得的,而value在JDK8中是以char數組實現的:

  1. public final class String 
  2.     implements java.io.Serializable, Comparable<String>, CharSequence { 
  3.     /** The value is used for character storage. */ 
  4.     private final char value[]; 
  5.     // ...    

Java中內碼(運行內存)中的char使用UTF16的方式編碼,一個char占用兩個字節。所以,還需要從將上面計算的值乘以2。

此時的計算公式為:

  1. 2^31-1 =2147483647 個16-bit Unicodecharacter 
  2.  
  3. 2147483647 * 2 = 4294967294 (Byte) 
  4.   
  5. 4294967294 / 1024 = 4194303.998046875 (KB) 
  6.   
  7. 4194303.998046875 / 1024 = 4095.9999980926513671875 (MB) 
  8.   
  9. 4095.9999980926513671875 / 1024 = 3.99999999813735485076904296875 (GB) 

也就是說最大字符串占用內存空間約等于4GB。但此時,如果你聲明一個長度為10萬的字符串,你會發現編譯器會拋出異常,提示信息如下:

錯誤: 常量字符串過長

不是說好的21億嗎?怎么10萬個就異常了呢?其實這個異常是由編譯期的限制決定的。

字符串常量池的編譯期限制

了解過JVM虛擬機的朋友肯定知道,當通過字面量進行字符串聲明時,在編譯之后會以常量的形式進入到Class常量池。

  1. String s = "程序新視界"

而常量池對String的長度是有限制的。常量池中的每一種數據項都有自己的類型。Java中的UTF-8編碼的Unicode字符串在常量池中以CONSTANT_Utf8類型表示。

在《Java虛擬機規范》中可以看到對String是通過CONSTANT_String_info來定義的。

可以看到“string_index項的值必須是對常量池的有效索引,常量池在該索引處的項必須是CONSTANT_Utf8_info(§4.4.7)結構”。

繼續看對CONSTANT_Utf8_info的定義:

length則指明了bytes[]數組的長度,類型為u2。同樣是在《Java虛擬機規范》中可以找到對u2的定義:

u2表示兩個字節的無符號數,1個字節有8位,2個字節就有16位。因此,u2可表示的最大值為2^16 - 1= 65535。

到這里,已經得出了第二個限制,也就是Class文件中常量池的格式規定了,其字符串常量的長度不能超過65535。

此時,如果嘗試通過字面量聲明一個65535長度的字符串:

  1. String s = "8888...8888";//其中有65535萬個字符"8" 

編譯器還會拋出同樣的異常。這又是為什么呢?

這個問題我們同樣可以從《Java虛擬機規范》(4.7.3節)中找到答案:

原來是為了彌補早期設計時的一個bug,“長度剛好65535個字節,且以1個字節長度的指令結束,這條指令不能被異常處理器處理”,因此就將數組的最大長度限制到了65534了。

如果你能夠查看JVM中編譯器部分的源碼,可以在Gen類中看到對此限制的代碼實現:

  1. /** Check a constant value and report if it is a string that is 
  2.  *  too large. 
  3.  */ 
  4. private void checkStringConstant(DiagnosticPosition pos, Object constValue) { 
  5.     if (nerrs != 0 || // only complain about a long string once 
  6.         constValue == null || 
  7.         !(constValue instanceof String) || 
  8.         ((String)constValue).length() < Pool.MAX_STRING_LENGTH) 
  9.         return
  10.     log.error(pos, "limit.string"); 
  11.     nerrs++; 

其中Pool.MAX_STRING_LENGTH的定義如下:

  1. public class Pool { 
  2.     public static final int MAX_STRING_LENGTH = 0xFFFF; 
  3.     //... 

再次嘗試聲明一個長度為65534的字符串,會發現可以正常編譯了。此時,可以得出結論,在編譯期字符串的最大長度為65534。

我們知道,Java是區分編譯期和運行期的,那么在運行期是否有長度限制呢?

運行期的長度限制

String運行期的限制主要體現在String的構造函數上。String的一個構造函數如下:

  1. public String(char value[], int offset, int count) { 
  2.    // ... 

其中參數count就是字符串的最大長度。此時的計算與前面的算法一致,這里先轉換為bit,然后再轉換為GB:

  1. (2^31-1)*16/8/1024/1024/1024 = 4GB 

也就是說,運行時理論上可以支持4GB大小的字符串,超過這個限制就會拋出異常的。JDK9對String的存儲進行了優化,底層使用byte數組替代了char數組,對于純Latin1字符來說可以節省一半的空間。

當然,這個4GB的限制是基于JVM能夠分配這么多可用的內存的前提下的。

小結

通過上述的分析,可以得出結論:第一,在編譯期字符串的長度不能超過65534;第二,在運行期,字符串的長度不能超過2^31-1,占用內存(4GB)不能超過虛擬機所分配的最大內存。

 

結論很簡單,但本篇文章分析時所使用的知識和思路你學到了嗎?如果沒有,趕緊補一補吧。

 

責任編輯:武曉燕 來源: 程序新視界
相關推薦

2020-11-10 13:47:29

String源碼長度限制

2022-02-17 10:56:33

Redis數據系統

2009-12-15 17:19:23

架構師梁遠華聚聚呀

2020-06-15 08:25:35

Linux 系統 數據

2021-11-07 07:51:01

JavaString字符串

2022-05-20 15:27:41

React工具Vue

2011-06-23 08:50:46

JavaAndroidOracle

2020-12-16 15:37:19

Python編程語言開發

2023-04-11 16:31:10

開發React 庫Web

2020-07-21 08:14:13

TypeScrip

2010-10-08 14:45:43

mysql中int

2021-10-08 08:00:00

Java開發功能

2013-05-31 15:57:59

Windows 8.1

2020-07-09 07:37:06

數據庫Redis工具

2020-08-17 17:22:34

VSCode插件開發編碼

2023-08-11 08:19:39

JavaStream API

2020-11-17 16:22:45

開源工具報表

2021-03-08 21:57:29

手機科技數碼

2020-03-31 22:09:01

React應用程序
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 99re视频在线观看 | 91在线一区| 欧美日韩在线观看视频 | 天天草av| 日韩成人免费 | 欧美精品一二三 | 国产精品久久久久久久久久久久久久 | 成人a视频| 亚洲精品视频免费 | 成年免费大片黄在线观看一级 | 天天操天天操 | 国产一区二区自拍 | 91在线免费观看网站 | 美女黄色在线观看 | 久久久久99 | 久久99视频精品 | 人成在线 | 九九热国产视频 | 丝袜一区二区三区 | 日韩一区二区三区四区五区六区 | 久久国产精品视频 | 国产精品av久久久久久久久久 | 在线观看a视频 | jizz在线免费观看 | 欧美一级在线免费 | 一区二区三区四区在线视频 | 亚洲伦理自拍 | 午夜视频免费在线观看 | 中文字幕在线不卡播放 | 亚洲综合网站 | 久久久久久国产精品免费免费 | 国产欧美日韩一区 | 日本三级电影在线免费观看 | 大香网伊人 | 日韩中文在线视频 | 一区二区三区在线观看视频 | 久久久久国产精品一区二区 | 国产成人精品综合 | 国产日韩欧美一区 | 中文字幕 欧美 日韩 | 99久久免费精品 |