Scala中的for表達(dá)式:枚舉的“瑞士軍刀”
Scala的for表達(dá)式是為枚舉準(zhǔn)備的“瑞士軍刀”。它可以讓你用不同的方式把若干簡單的成分組合來表達(dá)各種各樣的枚舉。簡單的用法完成如把整數(shù)序列枚舉一遍那樣通常的任務(wù)。更高級的表達(dá)式可以列舉不同類型的多個集合,可以用任意條件過濾元素,還可以制造新的集合。
51CTO編輯推薦:Scala編程語言專題
枚舉集合類
你能用for做的最簡單的事情就是把一個集合類的所有元素都枚舉一遍。如,代碼7.5展示了打印當(dāng)前目錄所有文件名的例子。I/O操作使用了Java的API。首先,我們創(chuàng)建指向當(dāng)前目錄,".",的文件,然后調(diào)用它的listFiles方法。方法返回File對象數(shù)組,每個都代表當(dāng)前目錄包含的目錄或文件。我們把結(jié)果數(shù)組保存在filesHere變量。
代碼 7.5 用for循環(huán)列表目錄中的文件
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere)
- println(file)
通過使用被稱為發(fā)生器:generator的語法“file < - filesHere”,我們遍歷了filesHere的元素。每一次枚舉,名為file的新的val就被元素值初始化。編譯器推斷file的類型是File,因為filesHere是Array[File]。對于每一次枚舉,for表達(dá)式的函數(shù)體,println(file),將被執(zhí)行一次。由于File的toString方法產(chǎn)生文件或目錄的名稱,因此當(dāng)前目錄的所有文件和目錄的名稱都會被打印出來。
for表達(dá)式語法對任何種類的集合類都有效,而不只是數(shù)組。更精確地說,在<-符號右側(cè)的表達(dá)式必須支持名為foreach的方法。第80頁的表格5-4中看到的Range類型是其中一個方便的特例,你可以使用類似于“1 to 5”這樣的語法創(chuàng)建一個Range,然后用for枚舉。以下是一個簡單的例子:
如果你不想包括被枚舉的Range的上邊界,可以用until替代to:
- scala> for (i < - 1 to 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- Iteration 4
像這樣枚舉整數(shù)在Scala里是很平常的,但在其他語言中就不是這么回事。其它語言中,你或許要采用如下方式遍歷數(shù)組:
- scala> for (i < - 1 until 4)
- println("Iteration " + i)
- Iteration 1
- Iteration 2
- Iteration 3
- // Scala中不常見……
- for (i < - 0 to filesHere.length - 1)
- println(filesHere(i))
這個for表達(dá)式引入了變量i,依次把它設(shè)成從0到filesHere.length - 1的整數(shù)值,然后對i的每個設(shè)置執(zhí)行一次for表達(dá)式的循環(huán)體。對應(yīng)于每一個i的值,filesHere的第i個元素被取出并處理。
這種類型的枚舉在Scala里不常見的原因是直接枚舉集合類也做得同樣好。這樣做,你的代碼變得更短并規(guī)避了許多枚舉數(shù)組時頻繁出現(xiàn)的超位溢出:off-by-one error。該從0開始還是從1開始?應(yīng)該加-1,+1,還是什么都不用直到最后一個索引?這些問題很容易回答,但也很容易答錯。還是避免碰到為佳。
過濾
有些時候你不想枚舉一個集合類的全部元素。而是想過濾出一個子集。你可以通過把過濾器:filter:一個if子句加到for的括號里做到。如代碼7.6的代碼僅對當(dāng)前目錄中以“.scala”結(jié)尾的文件名做列表:
- val filesHere = (new java.io.File(".")).listFiles
- for (file < - filesHere if file.getName.endsWith(".scala"))
- println(file)
代碼 7.6 用帶過濾器的for發(fā)現(xiàn).scala文件
或者你也可以這么寫:
- for (file < - filesHere)
- if (file.getName.endsWith(".scala"))
- println(file)
這段代碼可以產(chǎn)生與前一段代碼同樣的輸出,而且對于指令式背景的程序員來說看上去更熟悉一些。然而指令式格式只是一個可選項,因為這個for表達(dá)式的運(yùn)用執(zhí)行的目的是為了它的打印這個副作用并產(chǎn)生unit值()。正如在本節(jié)后面將展示的,for表達(dá)式之所以被稱為“表達(dá)式”是因為它能產(chǎn)生令人感興趣的值,一個其類型取決于for表達(dá)式< -子句的集合。
如果愿意的話,你可以包含更多的過濾器。只要不斷加到子句里即可。例如,為了加強(qiáng)防衛(wèi),代碼7.7中的代碼僅僅打印文件而不是目錄。通過增加過濾器檢查file的isFile方法做到:
- for (
- file < - filesHere
- if file.isFile;
- if file.getName.endsWith(".scala")
- ) println(file)
代碼 7.7 在for表達(dá)式中使用多個過濾器
注意
如果在發(fā)生器中加入超過一個過濾器,if子句必須用分號分隔。這是代碼7.7中的“if file.isFile”過濾器之后帶著分號的原因。
嵌套枚舉
如果加入多個< -子句,你就得到了嵌套的“循環(huán)”。比如,代碼7.8展示的for表達(dá)式有兩個嵌套循環(huán)。外層的循環(huán)枚舉filesHere,內(nèi)層的枚舉所有以.scala結(jié)尾文件的fileLines(file)。
- def fileLines(file: java.io.File) =
- scala.io.Source.fromFile(file).getLines.toList
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- if line.trim.matches(pattern)
- } println(file + ": " + line.trim)
- grep(".*gcd.*")
代碼 7.8 在for表達(dá)式中使用多個發(fā)生器
如果愿意的話,你可以使用大括號代替小括號環(huán)繞發(fā)生器和過濾器。使用大括號的一個好處是你可以省略一些使用小括號必須加的分號。
mid-stream(流間)變量綁定
請注意前面的代碼段中重復(fù)出現(xiàn)的表達(dá)式line.trim。這不是個可忽略的計算,因此你或許想每次只算一遍。通過用等號(=)把結(jié)果綁定到新變量可以做到這點(diǎn)。綁定的變量被當(dāng)作val引入和使用,不過不用帶關(guān)鍵字val。代碼7.9展示了一個例子。
- def grep(pattern: String) =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(pattern)
- } println(file + ": " + trimmed)
- grep(".*gcd.*")
代碼 7.9 在for表達(dá)式里的流間賦值
代碼中,名為trimmed的變量被從半當(dāng)中引入for表達(dá)式,并被初始化為line.trim的結(jié)果值。之后的for表達(dá)式就可以在兩個地方使用這個新變量,一次在if中,一次在println中。
制造新集合
到現(xiàn)在為止所有的例子都只是對枚舉值進(jìn)行操作然后就放過,除此之外,你還可以創(chuàng)建一個值去記住每一次的迭代。只要在for表達(dá)式之前加上關(guān)鍵字yield。比如,下面的函數(shù)鑒別出.scala文件并保存在數(shù)組里:
- def scalaFiles =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- } yield file
for表達(dá)式在每次執(zhí)行的時候都會制造一個值,本例中是file。當(dāng)for表達(dá)式完成的時候,結(jié)果將是一個包含了所有產(chǎn)生的值的集合。結(jié)果集合的類型基于枚舉子句處理的集合類型。本例中結(jié)果為Array[File],因為filesHere是數(shù)組并且產(chǎn)生的表達(dá)式類型是File。
另外,請注意放置yield關(guān)鍵字的地方。對于for-yield表達(dá)式的語法是這樣的:
- for {子句} yield {循環(huán)體}
yield在整個循環(huán)體之前。即使循環(huán)體是一個被大括號包圍的代碼塊,也一定把yield放在左括號之前,而不是代碼塊的最后一個表達(dá)式之前。請抵擋住寫成如下方式的誘惑:
- for (file < -filesHere if file.getName.endsWith(".scala")) {
- yield file // 語法錯誤!
- }
例如,代碼7.10展示的for表達(dá)式首先把包含了所有當(dāng)前目錄的文件的名為filesHere的Array[File],轉(zhuǎn)換成一個僅包含.scala文件的數(shù)組。對于每一個對象,產(chǎn)生一個Iterator[String](fileLines方法的結(jié)果,定義展示在代碼7.8中),提供方法next和hasNext讓你枚舉集合的每個元素。這個原始的枚舉器又被轉(zhuǎn)換為另一個Iterator[String]僅包含含有子字串"for"的修剪過的行。最終,對每一行產(chǎn)生整數(shù)長度。這個for表達(dá)式的結(jié)果就是一個包含了這些長度的Array[Int]數(shù)組。
- val forLineLengths =
- for {
- file < - filesHere
- if file.getName.endsWith(".scala")
- line < - fileLines(file)
- trimmed = line.trim
- if trimmed.matches(".*for.*")
- } yield trimmed.length
代碼 7.10 用for把Array[File]轉(zhuǎn)換為Array[Int]
【相關(guān)閱讀】