從String中移除空白字符的多種方式!?差別竟然這么大!
字符串,是Java中最常用的一個(gè)數(shù)據(jù)類型了。我們?cè)谌粘i_發(fā)時(shí)候會(huì)經(jīng)常使用字符串做很多的操作。比如字符串的拼接、截?cái)唷⑻鎿Q等。
這一篇文章,我們介紹一個(gè)比較常見又容易被忽略的一個(gè)操作,那就是移除字符串中的空格。
其實(shí),在Java中從字符串中刪除空格有很多不同的方法,如trim,replaceAll等。但是,在Java 11添加了一些新的功能,如strip、stripLeading、stripTrailing等。
大多數(shù)時(shí)候,我們只是使用trim方法來(lái)刪除多余的空格。但是好像很多人并沒有去思考過(guò),是否有更好的方式呢?
當(dāng)然,trim()在大多數(shù)情況下都工作得很好,但是Java中有許多不同的方法。每一種都有自己的優(yōu)點(diǎn)和缺點(diǎn)。我們?nèi)绾螞Q定哪種方法最適合我們呢?
接下來(lái)我們將介紹幾種方法,并對(duì)比下他們的區(qū)別和優(yōu)缺點(diǎn)等。
在java中從字符串中刪除空格的不同方法
首先,我們來(lái)看一下,想要從String中移除空格部分,有多少種方法,作者根據(jù)經(jīng)驗(yàn),總結(jié)了以下7種(JDK原生自帶的方法,不包含第三方工具類庫(kù)中的類似方法):
- trim() : 刪除字符串開頭和結(jié)尾的空格。
- strip() : 刪除字符串開頭和結(jié)尾的空格。
- stripLeading() : 只刪除字符串開頭的空格
- stripTrailing() : 只刪除字符串的結(jié)尾的空格
- replace() : 用新字符替換所有目標(biāo)字符
replaceAll() : 將所有匹配的字符替換為新字符。此方法將正則表達(dá)式作為輸入,以標(biāo)識(shí)需要替換的目標(biāo)子字符串
replaceFirst() : 僅將目標(biāo)子字符串的第一次出現(xiàn)的字符替換為新的字符串
需要注意的最重要的一點(diǎn)是,在Java中String對(duì)象是不可變的,這意味著我們不能修改字符串,因此以上所有的方法我們得到的都是一個(gè)新的字符串。
接下啦,我們分別針對(duì)以上這幾個(gè)方法學(xué)習(xí)下用法,了解下其特性。
PS:本文代碼都是使用在線運(yùn)行工具(https://www.jdoodle.com/online-java-compiler/ )執(zhí)行的,因?yàn)槲业臏y(cè)試機(jī)并未安裝Java 11,并且Unicode字符也不完整。如果大家也想實(shí)驗(yàn),建議使用在線工具,選擇對(duì)應(yīng)的JDK即可。
trim
trim()是Java開發(fā)人員最常用的刪除字符串開頭和結(jié)尾的空格方法。其用法也比較簡(jiǎn)單:
- public class StringTest {
- public static void main(String[] args) {
- String stringWithSpace = " Hollis Is A Java Coder ";
- StringTest.trimTest(stringWithSpace);
- }
- private static void trimTest(String stringWithSpace){
- System.out.println("Before trim : \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.trim();
- System.out.println("After trim : \'" + stringAfterTrim + "\'");
- }
- }
輸出結(jié)果:
- Before trim : ' Hollis Is A Java Coder '
- After trim : 'Hollis Is A Java Coder'
如上,使用trim之后,原字符串中開頭和結(jié)尾部分的空格內(nèi)容都被移除掉了。
但是不知道大家有沒有思考過(guò),trim方法移除的空白內(nèi)容都包含哪些東西?除了空格以外,還有其他的字符嗎?
其實(shí),trim移除的空白字符指的是指ASCII值小于或等于32的任何字符(' U+0020 '):
其中包含了空格、換行、退格等字符。
strip()
不知道大家有沒有注意到,在Java 11的發(fā)行版中,添加了新的strip()方法來(lái)刪除字符串中的前導(dǎo)和末尾空格。
已經(jīng)有了一個(gè)trim方法,為什么還要新增一個(gè)strip呢?
這其實(shí)是是因?yàn)閠rim方法只能針對(duì)ASCII值小于等于32的字符進(jìn)行移除,但是根據(jù)Unicode標(biāo)準(zhǔn),除了ASCII中的字符以外,還是有很多其他的空白字符的。
而且為了識(shí)別這些空格字符,從Java 1.5開始,還在Character類中添加了新的isWhitespace(int)方法。該方法使用unicode來(lái)標(biāo)識(shí)空格字符。你可以在http://jkorpela.fi/chars/spaces.html 了解更多關(guān)于unicode空格字符的信息。
而在Java 11中新增的這個(gè)strip方法就是使用這個(gè)Character.isWhitespace(int)方法來(lái)判斷是否為空白字符并刪除它們的:
下面我們來(lái)看一個(gè)使用strip例子:
- public class StringTest {
- public static void main(String args[]) {
- String stringWithSpace ='\u2001' + " Hollis Is A Java Coder " + '\u2001';
- System.out.println("'" + '\u2001' + "' is space : " + Character.isWhitespace('\u2001'));
- StringTest.stripTest(stringWithSpace);
- }
- private static void stripTest(String stringWithSpace){
- System.out.println("Before strip : \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.strip();
- System.out.println("After strip : \'" + stringAfterTrim + "\'");
- }
- }
我們?cè)谧址昂蠖荚黾恿艘粋€(gè)特殊的字符\u2001,這個(gè)字符是不在ASCII中的,經(jīng)過(guò)Character.isWhitespace判斷他是一個(gè)空白字符。然后使用strip進(jìn)行處理,輸出結(jié)果如下:
- ' ' is space : true
- Before strip : ' Hollis Is A Java Coder '
- After strip : 'Hollis Is A Java Coder'
所以,Java 11 中的 strip 方法要比trim方法更加強(qiáng)大,他可以移除很多不在ASCII中的空白字符,判斷方式就是通過(guò)Character.isWhitespace方法。
trim 和 strip 方法的區(qū)別
上面我們介紹了兩個(gè)都可以移除字符串開頭和結(jié)尾的方法,分別是trim 和 strip,再來(lái)對(duì)比下他們的區(qū)別:
stripLeading() 和 stripTrailing()
stripLeading()和stripTrailing()方法也都是在Java 11中添加的。作用分別是刪除字符串的開頭的空格以及刪除字符串的末尾的空格。
與strip方法類似,stripLeading、stripTrailing也使用Character.isWhitespace(int)來(lái)標(biāo)識(shí)空白字符。用法也和strip類似:
- public class StringTest {
- public static void main(String args[]) {
- String stringWithSpace ='\u2001' + " Hollis Is A Java Coder " + '\u2001';
- System.out.println("'" + '\u2001' + "' is space : " + Character.isWhitespace('\u2001'));
- StringTest.stripLeadingTest(stringWithSpace);
- StringTest.stripTrailingTest(stringWithSpace);
- }
- private static void stripLeadingTest(String stringWithSpace){
- System.out.println("Before stripLeading : \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.stripLeading();
- System.out.println("After stripLeading : \'" + stringAfterTrim + "\'");
- }
- private static void stripTrailingTest(String stringWithSpace){
- System.out.println("Before stripTrailing : \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.stripTrailing();
- System.out.println("After stripTrailing : \'" + stringAfterTrim + "\'");
- }
- }
輸出結(jié)果:
- ' ' is space : true
- Before stripLeading : ' Hollis Is A Java Coder '
- After stripLeading : 'Hollis Is A Java Coder '
- Before stripTrailing : ' Hollis Is A Java Coder '
- After stripTrailing : ' Hollis Is A Java Coder'
replace
移除字符串中的空白字符,除了使用trim、strip以外,還有一個(gè)辦法,那就是使用replace方法把其中的空白字符替換掉。
replace是從java 1.5中添加的,可以用指定的字符串替換每個(gè)目標(biāo)子字符串。
此方法替換所有匹配的目標(biāo)元素,使用方式如下:
- public class StringTest {
- public static void main(String args[]) {
- String stringWithSpace =" Hollis Is A Java Coder ";
- StringTest.replaceTest(stringWithSpace);
- }
- private static void replaceTest(String stringWithSpace){
- System.out.println("Before replace : \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.replace(" ", "");
- System.out.println("After replace : \'" + stringAfterTrim + "\'");
- }
- }
結(jié)果:
- Before replace : ' Hollis Is A Java Coder '
- After replace : 'HollisIsAJavaCoder'
可見,以上使用replace方法可以替換掉字符串中的所有空白字符。特別需要注意的是,replace方法和trim方法一樣,只能替換掉ASCII中的空白字符。
replaceAll
replaceAll是Java 1.4中添加的最強(qiáng)大的字符串操作方法之一。我們可以將這種方法用于許多目的。
使用replaceAll()方法,我們可以使用正則表達(dá)式來(lái)用來(lái)識(shí)別需要被替換的目標(biāo)字符內(nèi)容。使用正則表達(dá)式,就可以實(shí)現(xiàn)很多功能,如刪除所有空格,刪除開頭空格,刪除結(jié)尾空格等等。
我們只需要用正確的替換參數(shù)創(chuàng)建正確的正則表達(dá)式。一些正則表達(dá)式的例子如下:
- \s+ 所有的空白字符
- ^\s+ 字符串開頭的所有空白字符
- \s+$ 字符串結(jié)尾的所有空白字符
注意,在java中要添加/我們必須使用轉(zhuǎn)義字符,所以對(duì)于\s+ 我們必須使用 \\s+
- public class StringTest {
- public static void main(String args[]) {
- String stringWithSpace =" Hollis Is A Java Coder ";
- StringTest.replaceAllTest(stringWithSpace," ");
- StringTest.replaceAllTest(stringWithSpace,"\\s+");
- StringTest.replaceAllTest(stringWithSpace,"^\\s+");
- StringTest.replaceAllTest(stringWithSpace,"\\s+$");
- }
- private static void replaceAllTest(String stringWithSpace,String regex){
- System.out.println("Before replaceAll with '"+ regex +"': \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.replaceAll(regex, "");
- System.out.println("After replaceAll with '"+ regex +"': \'" + stringAfterTrim + "\'");
- }
- }
結(jié)果:
- Before replaceAll with ' ': ' Hollis Is A Java Coder '
- After replaceAll with ' ': 'HollisIsAJavaCoder'
- Before replaceAll with '\s+': ' Hollis Is A Java Coder '
- After replaceAll with '\s+': 'HollisIsAJavaCoder'
- Before replaceAll with '^\s+': ' Hollis Is A Java Coder '
- After replaceAll with '^\s+': 'Hollis Is A Java Coder '
- Before replaceAll with '\s+$': ' Hollis Is A Java Coder '
- After replaceAll with '\s+$': ' Hollis Is A Java Coder'
正如我們所看到的,如果將replaceAll()與適當(dāng)?shù)恼齽t表達(dá)式一起使用,它將是非常強(qiáng)大的方法。
replaceFirst
replaceFirst方法也是在java 1.4中添加的,它只將給定正則表達(dá)式的第一個(gè)匹配項(xiàng)替換為替換字符串。
如果您只需要替換第一次出現(xiàn)的情況,那么這個(gè)方法非常有用。例如,如果我們只需要?jiǎng)h除前導(dǎo)空格,我們可以使用\\s+或^\\s+。
我們還可以通過(guò)使用\\s+$正則表達(dá)式使用此方法來(lái)刪除末尾空格。因?yàn)檫@個(gè)表達(dá)式將只匹配行的最后一個(gè)空格。因此最后的空格被認(rèn)為是這個(gè)方法的第一個(gè)匹配。
讓我們舉一個(gè)從字符串中刪除前導(dǎo)和尾隨空格的例子
- public class StringTest {
- public static void main(String args[]) {
- String stringWithSpace =" Hollis Is A Java Coder ";
- StringTest.replaceFirstTest(stringWithSpace," ");
- StringTest.replaceFirstTest(stringWithSpace,"\\s+");
- StringTest.replaceFirstTest(stringWithSpace,"^\\s+");
- StringTest.replaceFirstTest(stringWithSpace,"\\s+$");
- }
- private static void replaceFirstTest(String stringWithSpace,String regex){
- System.out.println("Before replaceFirst with '"+ regex +"': \'" + stringWithSpace + "\'");
- String stringAfterTrim = stringWithSpace.replaceFirst(regex, "");
- System.out.println("After replaceFirst with '"+ regex +"': \'" + stringAfterTrim + "\'");
- }
- }
結(jié)果:
- Before replaceFirst with ' ': ' Hollis Is A Java Coder '
- After replaceFirst with ' ': ' Hollis Is A Java Coder '
- Before replaceFirst with '\s+': ' Hollis Is A Java Coder '
- After replaceFirst with '\s+': 'Hollis Is A Java Coder '
- Before replaceFirst with '^\s+': ' Hollis Is A Java Coder '
- After replaceFirst with '^\s+': 'Hollis Is A Java Coder '
- Before replaceFirst with '\s+$': ' Hollis Is A Java Coder '
- After replaceFirst with '\s+$': ' Hollis Is A Java Coder'
總結(jié)
本文介紹了7種移除字符串中的空白字符的方法。
想要直接移除掉字符串開頭的空白字符,可以使用stripLeading、replaceAll和replaceFirst
想要直接移除掉字符串末尾的空白字符,可以使用stripTrailing、replaceAll和replaceFirst
想要同時(shí)移除掉字符串開頭和結(jié)尾的空白字符,可以使用strip、trim
想要移除掉字符串中的所有空白字符,可以使用replace和replaceAll
而Java 11種新增的strip、stripTrailing以及stripLeading方法,可以移除的字符要比其他方法多,他可以移除的空白字符不僅僅局限于ASCII中的字符,而是Unicode中的所有空白字符,具體判斷方式可以使用Character.isWhitespace進(jìn)行判斷。
【本文是51CTO專欄作者Hollis的原創(chuàng)文章,作者微信公眾號(hào)Hollis(ID:hollischuang)】