成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一文讓你讀懂JAVA.IO、字符編碼

開發(fā) 后端
本篇給大家介紹JAVA.IO、字符編碼,希望對(duì)你有所幫助。

 1 JAVA.IO字節(jié)流

inputstream.png

  • LineNumberInputStream和StringBufferInputStream官方建議不再使用,推薦使用LineNumberReader和StringReader代替
  • ByteArrayInputStream和ByteArrayOutputStream 字節(jié)數(shù)組處理流,在內(nèi)存中建立一個(gè)緩沖區(qū)作為流使用,從緩存區(qū)讀取數(shù)據(jù)比從存儲(chǔ)介質(zhì)(如磁盤)的速率快
  1. //用ByteArrayOutputStream暫時(shí)緩存來自其他渠道的數(shù)據(jù) 
  2. ByteArrayOutputStream data = new ByteArrayOutputStream(1024); //1024字節(jié)大小的緩存區(qū) 
  3. data.write(System.in.read()); // 暫存用戶輸入數(shù)據(jù) 
  4.  
  5. //將data轉(zhuǎn)為ByteArrayInputStream 
  6. ByteArrayInputStream in = new ByteArrayInputStream(data.toByteArray()); 

  • FileInputStream和FileOutputStream 訪問文件,把文件作為InputStream,實(shí)現(xiàn)對(duì)文件的讀寫操作
  • ObjectInputStream和ObjectOutputStream 對(duì)象流,構(gòu)造函數(shù)需要傳入一個(gè)流,實(shí)現(xiàn)對(duì)JAVA對(duì)象的讀寫功能;可用于序列化,而對(duì)象需要實(shí)現(xiàn)Serializable接口
  1. //java對(duì)象的寫入 
  2. FileOutputStream fileStream = new FileOutputStream("example.txt"); 
  3. ObjectOutputStream out = new ObjectOutputStream(fileStream); 
  4. Example example = new Example(); 
  5. out.writeObject(example); 
  6.  
  7. //java對(duì)象的讀取 
  8. FileInputStream fileStream = new FileInputStream("example.txt"); 
  9. ObjectInputStream in = new ObjectInputStream(fileStream); 
  10. Example = (Example) in.readObject(); 
  • PipedInputStream和PipedOutputStream 管道流,適用在兩個(gè)線程中傳輸數(shù)據(jù),一個(gè)線程通過管道輸出流發(fā)送數(shù)據(jù),另一個(gè)線程通過管道輸入流讀取數(shù)據(jù),實(shí)現(xiàn)兩個(gè)線程間的數(shù)據(jù)通信
  1. // 創(chuàng)建一個(gè)發(fā)送者對(duì)象 
  2. Sender sender = new Sender(); // 創(chuàng)建一個(gè)接收者對(duì)象 
  3. Receiver receiver = new Receiver(); // 獲取輸出管道流 
  4. // 獲取輸入輸出管道流 
  5. PipedOutputStream outputStream = sender.getOutputStream();  
  6. PipedInputStream inputStream = receiver.getInputStream(); 
  7. // 鏈接兩個(gè)管道,這一步很重要,把輸入流和輸出流聯(lián)通起來   
  8. outputStream.connect(inputStream); 
  9. sender.start();// 啟動(dòng)發(fā)送者線程 
  10. receiver.start();// 啟動(dòng)接收者線程 
  • SequenceInputStream 把多個(gè)InputStream合并為一個(gè)InputStream,允許應(yīng)用程序把幾個(gè)輸入流連續(xù)地合并起來
  1. InputStream in1 = new FileInputStream("example1.txt"); 
  2. InputStream in2 = new FileInputStream("example2.txt"); 
  3. SequenceInputStream sequenceInputStream = new SequenceInputStream(in1, in2); 
  4. //數(shù)據(jù)讀取 
  5. int data = sequenceInputStream.read(); 
  • FilterInputStream和FilterOutputStream 使用了裝飾者模式來增加流的額外功能,子類構(gòu)造參數(shù)需要一個(gè)InputStream/OutputStream
  1. ByteArrayOutputStream out = new ByteArrayOutputStream(2014); 
  2. //數(shù)據(jù)寫入,使用DataOutputStream裝飾一個(gè)InputStream 
  3. //使用InputStream具有對(duì)基本數(shù)據(jù)的處理能力 
  4. DataOutputStream dataOut = new DataOutputStream(out); 
  5. dataOut.writeDouble(1.0); 
  6. //數(shù)據(jù)讀取 
  7. ByteArrayInputStream in = new ByteArrayInputStream(out.toByteArray()); 
  8. DataInputStream dataIn = new DataInputStream(in); 
  9. Double data = dataIn.readDouble(); 
  • DataInputStream和DataOutputStream (Filter流的子類) 為其他流附加處理各種基本類型數(shù)據(jù)的能力,如byte、int、String
  • BufferedInputStream和BufferedOutputStream (Filter流的子類) 為其他流增加緩沖功能
  • PushBackInputStream (FilterInputStream子類) 推回輸入流,可以把讀取進(jìn)來的某些數(shù)據(jù)重新回退到輸入流的緩沖區(qū)之中
  • PrintStream (FilterOutputStream子類) 打印流,功能類似System.out.print

 2 JAVA.IO字符流

21.png 

  • 從字節(jié)流和字符流的導(dǎo)向圖來,它們之間是相互對(duì)應(yīng)的,比如CharArrayReader和ByteArrayInputStream
  • 字節(jié)流和字符流的轉(zhuǎn)化:InputStreamReader可以將InputStream轉(zhuǎn)為Reader,OutputStreamReader可以將OutputStream轉(zhuǎn)為Writer
  1. //InputStream轉(zhuǎn)為Reader 
  2. InputStream inputStream = new ByteArrayInputStream("程序".getBytes()); 
  3. InputStreamReader reader = new InputStreamReader(inputStream, StandardCharsets.UTF_8); 
  4. //OutputStream轉(zhuǎn)為Writer 
  5. OutputStream out = new FileOutputStream("example.txt"); 
  6. OutputStreamWriter writer = new OutputStreamWriter(out); 
  7. //以字符為單位讀寫 
  8. writer.write(reader.read(new char[2])); 
  • 區(qū)別:字節(jié)流讀取單位是字節(jié),字符流讀取單位是字符;一個(gè)字符由字節(jié)組成,如變字長編碼UTF-8是由1~4個(gè)字節(jié)表示

3 亂碼問題和字符流

  • 字符以不同的編碼表示,它的字節(jié)長度(字長)是不一樣的。如“程”的utf-8編碼格式,由[-25][-88][-117]組成。而ISO_8859_1編碼則是單個(gè)字節(jié)[63]
  • 平時(shí)工作對(duì)資源的操作都是面向字節(jié)流的,然而數(shù)據(jù)資源根據(jù)不同的字節(jié)編碼轉(zhuǎn)為字節(jié)時(shí),它們的內(nèi)容是不一樣,容易造成亂碼問題
  • 兩種出現(xiàn)亂碼場(chǎng)景 encode和decode使用的字符編碼不一致:資源使用UTF-8編碼,而在代碼里卻使用GBK解碼打開使用字節(jié)流讀取字節(jié)數(shù)不符合字符規(guī)定字長:字符是由字節(jié)組成的,比如“程”的utf-8格式是三個(gè)字節(jié);如果在InputStream里以每?jī)蓚€(gè)字節(jié)讀取流,再轉(zhuǎn)為String(java默認(rèn)編碼是utf-8),此時(shí)會(huì)出現(xiàn)亂碼(半個(gè)中文,你猜是什么)
  1. ByteArrayInputStream in = new ByteArrayInputStream("程序大法好".getBytes()); 
  2. byte[] buf = new byte[2]; //讀取流的兩個(gè)字節(jié) 
  3. in.read(buf); //讀取數(shù)據(jù) 
  4. System.out.println(new String(buf)); //亂碼 
  5. ---result----  
  6. �  //亂碼 

  • 亂碼場(chǎng)景1,知道資源的字符編碼,就可以使用對(duì)應(yīng)的字符編碼來解碼解決
  • 亂碼場(chǎng)景2,可以一次性讀取所有字節(jié),再一次性編碼處理。但是對(duì)于大文件流,這是不現(xiàn)實(shí)的,因此有了字符流的出現(xiàn)
  • 字節(jié)流使用InputStreamReader、OutputStreamReader轉(zhuǎn)化為字符流,其中可以指定字符編碼,再以字符為單位來處理,可解決亂碼
  1. InputStreamReader reader =  
  2.       new InputStreamReader(inputStream, StandardCharsets.UTF_8); 

4 字符集和字符編碼的概念區(qū)分

  • 字符集和字符編碼的關(guān)系,字符集是規(guī)范,字符編碼是規(guī)范的具體實(shí)現(xiàn);字符集規(guī)定了符號(hào)和二進(jìn)制代碼值的唯一對(duì)應(yīng)關(guān)系,但是沒有指定具體的存儲(chǔ)方式;
  • unicode、ASCII、GB2312、GBK都是字符集;其中ASCII、GB2312、GBK既是字符集也是字符編碼;注意不混淆這兩者區(qū)別;而unicode的具體實(shí)現(xiàn)有UTF-8,UTF-16,UTF-32
  • 最早出現(xiàn)的ASCII碼是使用一個(gè)字節(jié)(8bit)來規(guī)定字符和二進(jìn)制映射關(guān)系,標(biāo)準(zhǔn)ASCII編碼規(guī)定了128個(gè)字符,在英文的世界,是夠用的。但是中文,日文等其他文字符號(hào)怎么映射呢?因此其他更大的字符集出現(xiàn)了
  • unicode(統(tǒng)一字符集),早期時(shí)它使用2個(gè)byte表示1個(gè)字符,整個(gè)字符集可以容納65536個(gè)字符。然而仍然不夠用,于是擴(kuò)展到4個(gè)byte表示一個(gè)字符,現(xiàn)支持范圍是U+010000~U+10FFFF
  • unicode是兩個(gè)字節(jié)的說法是錯(cuò)誤的;UTF-8是變字長的,需要用1~4個(gè)字節(jié)存儲(chǔ);UTF-16一般是兩個(gè)字節(jié)(U+0000~U+FFFF范圍),如果遇到兩個(gè)字節(jié)存不下,則用4個(gè)字節(jié);而UTF-32是固定四個(gè)字節(jié)
  • unicode表示的字符,會(huì)用“U+”開頭,后面跟著十六進(jìn)制的數(shù)字,如“字”的編碼就是U+5B57
  • UTF-8 編碼和unicode字符集

范圍 Unicode(Binary) UTF-8編碼(Binary) UTF-8編碼byte長度 U+0000~U+007F 00000000 00000000 00000000 0XXXXXXX 0XXXXXX 1 U+0080~U+07FF 00000000 00000000 00000YYY YYXXXXXX 110YYYYY 10XXXXXX 2 U+0800~U+FFFF 00000000 00000000 ZZZZYYYY YYXXXXXX 1110ZZZZ 10YYYYYY 10XXXXXX 3 U+010000~U+10FFFF 00000000 000AAAZZ ZZZZYYYY YYXXXXXX 11110AAA 10ZZZZZZ 10YYYYYY 10XXXXXX 4

  • 程序是分內(nèi)碼和外碼,java的默認(rèn)編碼是UTF-8,其實(shí)指的是外碼;內(nèi)碼傾向于使用定長碼,和內(nèi)存對(duì)齊一個(gè)原理,便于處理。外碼傾向于使用變長碼,變長碼將常用字符編為短編碼,罕見字符編為長編碼,節(jié)省存儲(chǔ)空間與傳輸帶寬
  • JDK8的字符串,是使用char[]來存儲(chǔ)字符的,char是兩個(gè)字節(jié)大小,其中使用的是UTF-16編碼(內(nèi)碼)。而unicode規(guī)定的中文字符在U+0000~U+FFFF內(nèi),因此使用char(UTF-16編碼)存儲(chǔ)中文是不會(huì)出現(xiàn)亂碼的
  • JDK9后,字符串則使用byte[]數(shù)組來存儲(chǔ),因?yàn)橛幸恍┳址粋€(gè)char已經(jīng)存不了,如emoji表情字符,使用字節(jié)存儲(chǔ)字符串更容易拓展
  • JDK9,如果字符串的內(nèi)容都是ISO-8859-1/Latin-1字符(1個(gè)字符1字節(jié)),則使用ISO-8859-1/Latin-1編碼存儲(chǔ)字符串,否則使用UTF-16編碼存儲(chǔ)數(shù)組(2或4個(gè)字節(jié))
  1. System.out.println(Charset.defaultCharset()); //輸出java默認(rèn)編碼 
  2. for (byte item : "程序".getBytes(StandardCharsets.UTF_16)) { 
  3.     System.out.print("[" + item + "]"); 
  4. System.out.println(""); 
  5. for (byte item : "程序".getBytes(StandardCharsets.UTF_8)) { 
  6.     System.out.print("[" + item + "]"); 
  7. ----result---- 
  8. UTF-8       //java默認(rèn)編碼UTF-8 
  9. [-2][-1][122][11][94][-113] //UTF_16:6個(gè)字節(jié)? 
  10. [-25][-88][-117][-27][-70][-113] //UTF_8:6個(gè)字節(jié) 正常 
  • “程序”的UTF-16編碼竟是輸出6個(gè)字節(jié),多出了兩個(gè)字節(jié),這是什么情況?再試試一個(gè)字符的輸
  1. for (byte item : "程".getBytes(StandardCharsets.UTF_16)) { 
  2.     System.out.print("[" + item + "]"); 
  3. ---result-- 
  4. [-2][-1][122][11] 

  • 可以看出UTF-16編碼的字節(jié)是多了[-2][-1]兩個(gè)字節(jié),十六進(jìn)制是0xFEFF。而它用來標(biāo)識(shí)編碼順序是Big endian還是Little endian。以字符'中'為例,它的unicode十六進(jìn)制是4E2D,存儲(chǔ)時(shí)4E在前,2D在后,就是Big endian;2D在前,4E在后,就是Little endian。FEFF表示存儲(chǔ)采用Big endian,F(xiàn)FFE表示使用Little endian
  • 為什么UTF-8沒有字節(jié)序的問題呢?個(gè)人看法,因?yàn)閁TF-8是變長的,由第一個(gè)字節(jié)的頭部的0、110、1110、11110判斷是否需后續(xù)幾個(gè)字節(jié)組成字符,使用Big endian易讀取處理,反過來不好處理,因此強(qiáng)制用Big endian
  • 其實(shí)感覺UTF-16可以強(qiáng)制規(guī)定用Big endian;但這其中歷史問題。。。

 【編輯推薦】

 

責(zé)任編輯:姜華 來源: 今日頭條
相關(guān)推薦

2021-03-05 09:10:19

base64編碼

2022-09-29 10:26:59

iOSScaffoldflutter

2023-12-22 19:59:15

2021-08-04 16:06:45

DataOps智領(lǐng)云

2022-09-22 09:00:46

CSS單位

2025-04-03 10:56:47

2018-09-28 14:06:25

前端緩存后端

2022-11-06 21:14:02

數(shù)據(jù)驅(qū)動(dòng)架構(gòu)數(shù)據(jù)

2024-01-29 00:28:01

2025-05-21 09:32:28

2021-12-29 18:00:19

無損網(wǎng)絡(luò)網(wǎng)絡(luò)通信網(wǎng)絡(luò)

2022-10-20 08:01:23

2023-11-27 17:35:48

ComponentWeb外層

2022-07-26 00:00:03

語言模型人工智能

2022-12-01 17:23:45

2022-07-05 06:30:54

云網(wǎng)絡(luò)網(wǎng)絡(luò)云原生

2023-05-20 17:58:31

低代碼軟件

2020-12-30 09:05:24

架構(gòu)微內(nèi)核系統(tǒng)

2017-05-04 20:29:12

HTTP服務(wù)器TCP
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 日本视频中文字幕 | 久久只有精品 | 中文字幕一区在线 | 99久久成人 | 日韩蜜桃视频 | 男女污污动态图 | 欧美日韩综合一区 | 日韩免费福利视频 | 国产成人在线视频 | 在线观看免费av网 | 日韩在线成人 | 99reav| 国产精品爱久久久久久久 | 国产一区 | 91电影在线 | 亚洲伊人精品酒店 | 在线精品亚洲欧美日韩国产 | 五月天国产在线 | 天天操天天射天天舔 | 日本成人毛片 | 人人干人人干人人 | 一区二区三区四区不卡视频 | 亚洲精品日韩综合观看成人91 | 免费在线黄色av | 一区二区三区中文字幕 | 日韩av资源站 | 亚洲国产欧美国产综合一区 | 18gay男同69亚洲网站 | 国产精品成人国产乱一区 | 伊人久久精品一区二区三区 | 欧美视频一区二区三区 | 高清欧美性猛交xxxx黑人猛交 | 91精品国产91久久久久福利 | 免费看a| 久久精品国产99国产 | 日韩av电影在线观看 | 中文字幕不卡视频在线观看 | 国产成人免费视频网站高清观看视频 | 久久精品国产99国产精品 | 人人干人人干人人干 | 久久久久久色 |