成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Scala 2.8的for表達式:性能與運行順序的改進

開發 后端
Scala 2.8將是Scala語言的一次重要更新,感興趣的開發者們已經可以在通過其Nightly Build進行很好的體驗(各個IDE也已經支持)。本文介紹了Scala 2.8對for表達式的改進:性能更好,運行順序也進行了調整。

本文來自EastSun的博客,原文標題為《Scala2.8探秘之for表達式》。

51CTO編輯推薦:Scala編程語言專題

雖然Scala2.8還在持續跳票中,但目前Nightly Build版本的可用性已經很高了,其中Scala2.8中主要特性都已經實現。毫無疑問,Scala2.8的發布將會是Scala發展中的一個重大里程碑。在這個版本中,不僅包括了許多Scala社區期待已久的特性,如命名參數、類型特殊化等等,詳細的信息可以參看http://eastsun.javaeye.com/blog/373710;而且包含了一些對之前Scala中設計不合理的地方的改進,例如Scala中對String以及數組的處理,在之前的版本中Scala編譯器在編譯的時候對這兩種類型進行了一些比較特殊(魔法)的處理,這樣做雖然某些程度上使得這兩種類型在Scala中更加易用,但同時也破壞了Scala中的一致性,并隨之產生了一些離奇的問題。舉個例子,在Scala2.7.7 final中我們可以看到如下結果:

  1. //Scala2.7.7 final  
  2. scala> val array = Array("String Array")  
  3. array: Array[java.lang.String] = Array(String Array)  
  4.  
  5. scala> println(array.toString())  
  6. Array(String Array)  
  7.  
  8. scala> println(array)  
  9. [Ljava.lang.String;@139491b 
  10.  
  11. scala> "WOW" == "WOW".reverse  
  12. res4: Boolean = false 
  13.  
  14. scala> "abcdefg" map { _.toUpperCase }  
  15. res5: Seq[Char] = ArrayBufferRO(A, B, C, D, E, F, G)         //注意,得到的是個Seq[Char]而不是String  
  16.  

顯然這樣的運行結果有違我們的直覺,即使是對Scala有一定了解的人也未必能馬上明白其中的奧妙。

在Scala2.8中,這些問題都得到了一定的解決——可能有些解決方式會讓你覺得退步了,但是保持了Scala的一致性,并且消除了編譯器在背后做的那些魔法,使事情變得簡單——雖然這樣破壞了Scala的向后兼容性,但我認為這樣做事非常值得的:這為Scala成為一門成功的語言墊下了基礎。下面我們看看在Scala 2.8.0.r20117-b20091213020323中上面代碼的運行結果:

  1. scala> val array = Array("String Array")  
  2. array: Array[java.lang.String] = Array(String Array)  
  3.  
  4. scala> println(array.toString())  
  5. [Ljava.lang.String;@335053 
  6.  
  7. scala> println(array)  
  8. [Ljava.lang.String;@335053 
  9.  
  10. scala> "WOW" == "WOW".reverse  
  11. res2: Boolean = true 
  12.  
  13. scala> "abcdefg" map { _.toUpperCase }  
  14. res3: String = ABCDEFG  
  15.  

可以看到,運行結果就如我們所預想的那樣——固然其中數組的toString結果變得丑陋了,和Java中一樣丑陋,但保持一致了。

OK,String與數組的討論就此為止,以后如果有時間我再來詳細解釋一下其背后的故事;現在我們轉向本文要討論的東東:Scala中的for表達式。注意:在本文中使用了兩種不同的Scala版本:Scala2.7.7final與2.8.0.r20117-b20091213020323進行對比。

1.Scala2.8之前的for表達式

在Scala中,通常有以下幾種使用方式:

  1. for (p <- e) e'  
  2. for (p <- e if g) e'  
  3. for (p <- e; p' <- e' ...) e'' 

以及相應的

  1. for (p <- e) yield e'  
  2. for (p <- e if g) yield e'  
  3. for (p <- e; p' <- e' ...) yield e'' 

其中p,p'為Scala中的Pattern;e,e',e''為表達式;g為Boolean表達式。

根據《The Scala Language Specification Version 2.7》,上面的for表達式將在編譯階段展開為下面的形式(沒有考慮p為比較復雜的Pattern時的情形):

  1. for (p <- e) e'                 => e.foreach { case p => e' }  
  2. for (p <- e if g) e'            => for (p <- e.filter{ (x1,...,xn) => g }) e' => ..  
  3. for (p <- e; p' <- e' ...) e''  => e.foreach{ case p => for (p' <- e' ...) e'' }  

以及相應的

  1. for (p <- e) yield e'                => e.map { case p => e' }  
  2. for (p <- e if g) yield e'           => for (p <- e.filter{ (x1,...,xn) => g }) yield e' 
  3. for (p <- e; p' <- e' ...) yield e'' => e.flatmap { case p => for (p' <- e' ...) yield e'' }  

注意的是,這個轉換發生在類型檢查之前。也就是說,對map,filter,flatMap以及foreach這四個方法的方法簽名沒有任何其它限制,只需要滿足展開后for語句的類型檢查。通常情況下,對于一個具有類型參數A的類C——一般表示某種數據結構(集合)——下面的定義方式是比較自然的:

  1. class C[A] {  
  2.     def map[B](f: A => B): C[B]  
  3.     def flatMap[B](f: A => C[B]): C[B]  
  4.     def filter(p: A => Boolean): C[A]  
  5.     def foreach(b: A => Unit): Unit  
  6. }  
  7.  

相對Java1.5中的for語句,Scala的實現更加靈活,并且以一種輕量級的方式實現了List comprehension。舉個例子,下面幾行代碼實現了求一個List的全排列:

  1. scala> def perm[T](ls: List[T]): List[List[T]] = ls match {  
  2.      |     case Nil => List(Nil)  
  3.      |     case xs  => for(x <- xs;ys <- perm(xs-x)) yield x::ys  
  4.      | }  
  5. perm: [T](List[T])List[List[T]]  
  6.  
  7. scala> perm(1::2::3::Nil)  
  8. res2: List[List[Int]] = List(List(123), List(132), List(213),  
  9.                              List(231), List(312), List(321))  
  10.  

但是這個轉換規則還不甚完美。當轉換后的表達式含有filter方法的時候,會產生幾個問題。

(a)性能問題

以一個簡單的問題為例:求1~999中所有偶數之和。

下面是兩段類似的解決代碼:

  1. val set = 1 until 1000 
  2. var sum = 0 
  3. for(num <- set;if(num%2 == 0)) sum += num  

或者把if語句移到括號外面:

  1. val set = 1 until 1000 
  2. var sum = 0 
  3. for(num <- set) if(num%2 == 0) sum += num  

這兩段代碼功能上應該是等價的,但是運行效率如何呢?下面首先寫一個粗略的測試函數:

  1. /**  
  2.   計算count次調用call所需的時間,單位:毫秒  
  3. */ 
  4. def time(call : => Unit,count: Int): Long = {  
  5.     var cnt = count  
  6.     val start = System.currentTimeMillis  
  7.     while(cnt > 0) {  
  8.         call  
  9.         cnt -= 1 
  10.     }  
  11.     System.currentTimeMillis - start  
  12. }  
  13.  

先在Scala2.7.7final中將每段代碼各運行十萬次:

  1. scala> val set = 1 until 1000 
  2. set: Range = Range(12345678910, ...  
  3.  
  4. scala> time({  
  5.      |     var sum = 0 
  6.      |     for(num <- set;if(num%2 == 0)) sum += num  
  7.      | },100000)  
  8. res3: Long = 47390 
  9.  
  10. scala>  
  11.  
  12. scala> time({  
  13.      |     var sum = 0 
  14.      |     for(num <- set)  if(num%2 == 0) sum += num  
  15.      | },100000)  
  16. res4: Long = 3344 
  17.  
  18. scala>  
  19.  

測試結果很出乎意料:兩段類似的代碼,性能竟相差一個數量級!

之所以會有這么大的差異,根據上述的轉換規則,第一段代碼將會轉換為下面的實際執行代碼:

  1. val set = 1 until 1000 
  2. var sum = 0 
  3. set.filter{ num => num%2 == 0) }.foreach{ case num => sum += num }  

而第二段代碼實際執行的是:

  1. val set = 1 until 1000 
  2. var sum = 0 
  3. set.foreach{ case num => if(num%2 == 0) sum += num }  

相對而言,第一段代碼會調用filter方法,創建一個新的集合類,而這個集合類包含了1~999中所有的偶數。顯然這個過程是比較昂貴的,也是不必要的。

(b)運行順序

  1. for (p <- e if g) e'  
  2.  

為例,實際運行的代碼為:

  1. e.filter{ (x1,...,xn) => g }.foreach{ case p => e'}  
  2.  

可以看到,雖然直觀上if g與e'在遍歷的時候應該是依次循環執行;但事實上轉換后if g整體先于e'執行。當g與e'中同時包含一個變量v,并且在g中對變量v進行改動時,實際運行結果可能和我們所預想的不一致。可能問題描述的不是很清楚,下面引用fineqtbull同學在for語句中內嵌if語句的副作用一文中的代碼作為例子來說明:實現compress方法,其功能是將一個list中連續相同的元素刪減至一個。比如compress(List(1,1,2,3,3,1,1,4)) == List(1,2,3,1,4),下面是兩段類似的實現代碼,咋一看都沒問題,但運行結果卻不一樣。

  1. Welcome to Scala version 2.7.7.final (Java HotSpot(TM) Client VM, Java 1.6.0_17).  
  2.  
  3. scala> def compress1[T](ls: List[T]): List[T] = {  
  4.      |     var res = List(ls.first)  
  5.      |     for(x <- ls) if(x != res.last) res = res:::List(x)  
  6.      |     res  
  7.      | }  
  8. compress1: [T](List[T])List[T]  
  9.  
  10. scala> def compress2[T](ls: List[T]): List[T] = {  
  11.      |     var res = List(ls.first)  
  12.      |     for(x <- ls;if(x != res.last)) res = res:::List(x)  
  13.      |     res  
  14.      | }  
  15. compress2: [T](List[T])List[T]  
  16.  
  17. scala> compress1(List(1,1,2,3,3,1,1,4))  
  18. res0: List[Int] = List(12314)  
  19.  
  20. scala> compress2(List(1,1,2,3,3,1,1,4))  
  21. res1: List[Int] = List(12334)  
  22.  
  23. scala>  
  24.  

有了之前的說明,我們不難發現其原因所在。但這樣的結果顯然違反了C/Java中習慣用法,很容易讓一個剛接觸Scala的人產生困惑。

2.Scala2.8中的for表達式

剛才已經提到了Scala2.8之前for表達式所存在的兩個問題,那么在Scala2.8中這兩個問題有沒有得到解決呢?下面將之前的代碼在2.8.0.r20117-b20091213020323重新運行一次試試:

  1. Welcome to Scala version 2.8.0.r20117-b20091213020323 (Java HotSpot(TM) Client VM, Java 1.6.0_17).  
  2.  
  3. scala> def time(call : => Unit,count: Int): Long = {  
  4.      |     var cnt = count  
  5.      |     val start = System.currentTimeMillis  
  6.      |     while(cnt > 0) {  
  7.      |         call  
  8.      |         cnt -= 1 
  9.      |     }  
  10.      |     System.currentTimeMillis - start  
  11.      | }  
  12. time: (call: => Unit,count: Int)Long  
  13.  
  14. scala> val set = 1 until 1000 
  15. set: scala.collection.immutable.Range ...  
  16.  
  17. scala> time({  
  18.      |     var sum = 0 
  19.      |     for(num <- set;if(num%2 == 0)) sum += num  
  20.      | },100000)  
  21. res0: Long = 6906 
  22.  
  23. scala> time({  
  24.      |     var sum = 0 
  25.      |     for(num <- set)  if(num%2 == 0) sum += num  
  26.      | },100000)  
  27. res1: Long = 4312 
  28.  
  29. scala> def compress1[T](ls: List[T]): List[T] = {  
  30.      |     var res = List(ls.first)  
  31.      |     for(x <- ls) if(x != res.last) res = res:::List(x)  
  32.      |     res  
  33.      | }  
  34. compress1: [T](ls: List[T])List[T]  
  35.  
  36. scala> def compress2[T](ls: List[T]): List[T] = {  
  37.      |     var res = List(ls.first)  
  38.      |     for(x <- ls;if(x != res.last)) res = res:::List(x)  
  39.      |     res  
  40.      | }  
  41. compress2: [T](ls: List[T])List[T]  
  42.  
  43. scala> compress1(List(1,1,2,3,3,1,1,4))  
  44. res2: List[Int] = List(12314)  
  45.  
  46. scala> compress2(List(1,1,2,3,3,1,1,4))  
  47. res3: List[Int] = List(12314)  
  48.  
  49. scala>  
  50.  

#T#可以看到Scala2.8中已經很好的解決了這兩個問題。對于一門語言,要想對已經存在的問題進行改進是很困難的,因為首先這些改進要盡可能少的影響已經存在的舊有代碼,另一方面不能帶來新的問題。幸運的是,Martin想到了一個簡單而優雅的方法成功做到了這些。下面簡單的敘述一下Martin的解決方法,感興趣的同學可以去看Martin的原文Rethinking filter。

首先,Martin引入了一個新的方法withFilter,這個方法與filter方法一樣以一個條件函數A => Boolean作為參數。與filter方法不同的是,withFilter方法是lazy的。它并不會創建一個新的包含符合條件的元素所組成的集合類,而是返回一個代理類WithFilter,這個類具有foreach、map、flatMap以及withFilter等方法,并且所有這些方法的調用是與原來條件組合的結果。下面是TraversableLike中WithFilter的實現,Scala2.8中所有的集合類都繼承了TraversableLike:

  1. class WithFilter(p: A => Boolean) {  
  2.  
  3.   /** Builds a new collection by applying a function to all elements of the  
  4.    *  outer $coll containing this `WithFilter` instance that satisfy predicate `p`.  
  5.    *  
  6.    *  @param f      the function to apply to each element.  
  7.    *  @tparam B     the element type of the returned collection.  
  8.    *  @tparam That  $thatinfo  
  9.    *  @param bf     $bfinfo  
  10.    *  @return       a new collection of type `That` resulting from applying the given function  
  11.    *                `f` to each element of the outer $coll that satisfies predicate `p`  
  12.    *                and collecting the results.  
  13.    *  
  14.    *  @usecase def map[B](f: A => B): $Coll[B]   
  15.    *    
  16.    *  @return       a new $coll resulting from applying the given function  
  17.    *                `f` to each element of the outer $coll that satisfies predicate `p`  
  18.    *                and collecting the results.  
  19.    */ 
  20.   def map[B, That](f: A => B)(implicit bf: CanBuildFrom[Repr, B, That]): That = {  
  21.     val b = bf(repr)  
  22.     for (x <- self)   
  23.       if (p(x)) b += f(x)  
  24.     b.result  
  25.   }  
  26.  
  27.   /** Builds a new collection by applying a function to all elements of the  
  28.    *  outer $coll containing this `WithFilter` instance that satisfy predicate `p` and concatenating the results.   
  29.    *  
  30.    *  @param f      the function to apply to each element.  
  31.    *  @tparam B     the element type of the returned collection.  
  32.    *  @tparam That  $thatinfo  
  33.    *  @param bf     $bfinfo  
  34.    *  @return       a new collection of type `That` resulting from applying the given collection-valued function  
  35.    *                `f` to each element of the outer $coll that satisfies predicate `p` and concatenating the results.  
  36.    *  
  37.    *  @usecase def flatMap[B](f: A => Traversable[B]): $Coll[B]  
  38.    *   
  39.    *  @return       a new $coll resulting from applying the given collection-valued function  
  40.    *                `f` to each element of the outer $coll that satisfies predicate `p` and concatenating the results.  
  41.    */ 
  42.   def flatMap[B, That](f: A => Traversable[B])(implicit bf: CanBuildFrom[Repr, B, That]): That = {  
  43.     val b = bf(repr)  
  44.     for (x <- self)   
  45.       if (p(x)) b ++= f(x)  
  46.     b.result  
  47.   }  
  48.  
  49.   /** Applies a function `f` to all elements of the outer $coll containing this `WithFilter` instance  
  50.    *  that satisfy predicate `p`.  
  51.    *  
  52.    *  @param  f   the function that is applied for its side-effect to every element.  
  53.    *              The result of function `f` is discarded.  
  54.    *                
  55.    *  @tparam  U  the type parameter describing the result of function `f`.   
  56.    *              This result will always be ignored. Typically `U` is `Unit`,  
  57.    *              but this is not necessary.  
  58.    *  
  59.    *  @usecase def foreach(f: A => Unit): Unit  
  60.    */     
  61.   def foreach[U](f: A => U): Unit =   
  62.     for (x <- self)   
  63.       if (p(x)) f(x)  
  64.  
  65.   /** Further refines the filter for this $coll.  
  66.    *  
  67.    *  @param q   the predicate used to test elements.  
  68.    *  @return    an object of class `WithFilter`, which supports  
  69.    *             `map`, `flatMap`, `foreach`, and `withFilter` operations.  
  70.    *             All these operations apply to those elements of this $coll which  
  71.    *             satify the predicate `q` in addition to the predicate `p`.  
  72.    */ 
  73.   def withFilter(q: A => Boolean): WithFilter =   
  74.     new WithFilter(x => p(x) && q(x))  
  75. }  

在Scala2.8中,for表達式的轉換方式大體保持不變,只是將以前使用filter的地方全部替換為withFilter方法。

結語:可以看到Scala2.8成功解決了之前Scala中存在的一些問題,使得Scala語言變得更加優雅、強大。你還在等待Java7的閉包嗎?趕緊去嘗試Scala2.8吧^_^

責任編輯:yangsai 來源: JavaEye博客
相關推薦

2009-07-21 14:03:00

Scalaif表達式while循環

2009-07-21 14:16:18

Scalafor表達式

2009-07-21 14:38:08

Scalamatch表達式break和conti

2012-07-18 09:45:32

Java 8ScalaLambda

2021-05-25 09:18:04

正則表達式Linux字符串

2009-07-21 14:30:38

Scalatry-catch

2010-10-21 10:56:29

SQL Server查

2009-08-19 14:48:57

正則表達式性能

2009-08-10 16:57:21

Lambda表達式

2024-03-25 13:46:12

C#Lambda編程

2018-09-27 15:25:08

正則表達式前端

2014-01-05 17:41:09

PostgreSQL表達式

2012-06-26 10:03:58

JavaJava 8lambda

2024-01-04 08:25:03

String表達式工具

2009-08-07 14:24:31

.NET正則表達式

2024-03-13 13:09:14

性能智能座艙軟件

2012-03-31 15:09:51

JavaFel

2009-09-08 09:32:13

正則表達式學習

2012-01-12 10:21:57

正則表達式

2009-07-09 09:51:07

Lambda表達式C#
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 亚洲女人天堂成人av在线 | 国产精品久久久久久久久久三级 | 国产一区二区三区在线免费 | 日韩精品视频一区二区三区 | 宅女噜噜66国产精品观看免费 | 国产日韩欧美一区二区 | 精品国产乱码一区二区三 | 久久午夜影院 | 久久久久久国产精品免费免费男同 | 国产一二三区精品视频 | 久久久久国产一区二区 | 免费一区二区三区 | 亚洲精品视频二区 | 精品国产精品一区二区夜夜嗨 | 成人在线电影网站 | 国产精品一区三区 | 午夜精| 欧美a在线 | 国产69精品久久99不卡免费版 | 欧美性网 | 99精品99久久久久久宅男 | 在线观看中文字幕一区二区 | 欧美色综合一区二区三区 | www.五月婷婷.com | 国产欧美日韩精品一区二区三区 | 久久久免费观看视频 | 国产精品免费福利 | 久久一久久 | 欧美精品一区二区三区四区五区 | 在线视频中文字幕 | 麻豆成人在线视频 | 亚洲免费一区二区 | 国产视频一区在线 | 天天看天天操 | 国产亚洲欧美日韩精品一区二区三区 | 成人免费视频观看视频 | 日本天堂视频在线观看 | 久久99久久久久 | 日韩精品在线一区 | 国产乱一区二区三区视频 | 在线观看视频福利 |