自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

你可能不知道的陷阱, IEnumerable接口

開(kāi)發(fā) 后端
IEnumerable枚舉器接口的重要性,說(shuō)一萬(wàn)句話都不過(guò)分。幾乎所有集合都實(shí)現(xiàn)了這個(gè)接口,Linq的核心也依賴于這個(gè)萬(wàn)能的接口。C語(yǔ)言的for循環(huán)寫(xiě)得心煩,foreach就順暢了很多。

IEnumerable枚舉器接口的重要性,說(shuō)一萬(wàn)句話都不過(guò)分。幾乎所有集合都實(shí)現(xiàn)了這個(gè)接口,Linq的核心也依賴于這個(gè)***的接口。C語(yǔ)言的for循環(huán)寫(xiě)得心煩,foreach就順暢了很多。

我很喜歡這個(gè)接口,但在使用中也遇到不少的疑問(wèn),你是不是也有與我一樣的困惑:

(1) IEnumerable 與  IEnumerator到底有什么區(qū)別

(2) 枚舉能否越界訪問(wèn),越界訪問(wèn)是什么后果?為什么在枚舉中不能改變集合的值?

(3) Linq的具體實(shí)現(xiàn)到底是怎樣的,比如Skip,它跳過(guò)了一些元素,那么這些元素被訪問(wèn)到了么?

(4) IEnumerable 的本質(zhì)是什么?

(5) IEnumerable 枚舉中是否會(huì)形成閉包?多個(gè)枚舉過(guò)程會(huì)不會(huì)互相干擾?能否在枚舉中動(dòng)態(tài)改變枚舉的元素?

....

如果感興趣,我們接著下面的內(nèi)容。

開(kāi)始之前,我們的文章規(guī)定,枚舉就是IEnumerable,迭代就是IEnumerator,已經(jīng)被實(shí)例化(比如ToList())就是集合。

我的相似的一篇博文:你可能不知道的陷阱:C#委托和事件的困惑

1.  IEnumerable 與  IEnumerator

IEnumerable只有一個(gè)抽象方法:GetEnumerator(),而IEnumerator又是一個(gè)迭代器,真正實(shí)現(xiàn)了訪問(wèn)集合的功能。  IEnumerator只有一個(gè)Current屬性,MoveNext和Reset兩個(gè)方法。

有個(gè)小問(wèn)題,只搞一個(gè)訪問(wèn)器接口不就得了?為什么要兩個(gè)看起來(lái)很容易混淆的接口呢?一個(gè)叫枚舉器,另一個(gè)叫迭代器。因?yàn)?/p>

(1) 實(shí)現(xiàn)IEnumerator是個(gè)臟活累活,白白加了兩個(gè)方法一個(gè)屬性,而且這兩個(gè)方法其實(shí)并不好實(shí)現(xiàn)(后面會(huì)提到)。

(2) 它需要維護(hù)初始狀態(tài),知道如何MoveNext ,如何結(jié)束,同時(shí)返回迭代的上一個(gè)狀態(tài),這些并不容易。

(3)迭代顯然是非線程安全的,每次IEnumerable都會(huì)生成新的IEnumerator,從而形成多個(gè)互相不影響的迭代過(guò)程。在迭代過(guò)程中,不能修改迭代集合,否則不安全。

所以只要你實(shí)現(xiàn)了IEnumerable,編譯器就會(huì)幫我們實(shí)現(xiàn)IEnumerator。何況絕大多數(shù)情況都是從現(xiàn)有集合繼承,一般不需要重寫(xiě)MoveNext和Reset方法。 IEnumerable當(dāng)然還有泛型實(shí)現(xiàn),這個(gè)不影響問(wèn)題的討論。

IEnumerable讓我們想起了單向鏈表,C中需要一個(gè)指針域保存下一個(gè)節(jié)點(diǎn)的信息,那么在IEnumerable中,誰(shuí)幫忙保存了這個(gè)信息?這個(gè)過(guò)程占用內(nèi)存么? 是占在程序區(qū),還是堆區(qū)?

但是,IEnumerable也有它的缺點(diǎn),它沒(méi)法后退,沒(méi)法跳躍(只能一個(gè)一個(gè)的跳過(guò)去),而且實(shí)現(xiàn)Reset并不容易,無(wú)法實(shí)現(xiàn)索引訪問(wèn)。想想看, 如果是一個(gè)實(shí)例集合的枚舉過(guò)程,直接返回到第0個(gè)元素就可以了,但是如果這個(gè)IEnumerable是漫長(zhǎng)的訪問(wèn)鏈條,想找到最初的根是很困難的!所 以CLR via C#的作者告訴你,其實(shí)很多Reset的實(shí)現(xiàn)根本就是謊言,知道有這個(gè)東西就行了,不要太過(guò)依賴它。

2. foreach和MoveNext有區(qū)別嗎

IEnumerable***的特點(diǎn)是將訪問(wèn)的過(guò)程,交給了被訪問(wèn)者本身控制。在C語(yǔ)言中數(shù)組控制權(quán)是外部完全掌握的。這個(gè)接口卻在內(nèi)部封裝訪問(wèn)了的過(guò)程,進(jìn)一步提升了封裝性。比如下面

  1. public class People  //定義一個(gè)簡(jiǎn)單的實(shí)體類(lèi) 
  2.     { 
  3.         public string Name { getset; } 
  4.         public int Age { getset; } 
  5.     } 
  6.  
  7.     public class PersonList 
  8.     { 
  9.         private readonly List<People> peoples; 
  10.  
  11.         public PersonList()  //為了方便,構(gòu)造過(guò)程中插入元素 
  12.         { 
  13.             peoples = new List<People>(); 
  14.             for (int i = 0; i < 5; i++) 
  15.             { 
  16.                 peoples.Add(new People {Name = "P" + i, Age = 30 + i}); 
  17.             } 
  18.         } 
  19.  
  20.         public int OldAge = 31; 
  21.         public IEnumerable<People> OlderPeoples 
  22.         { 
  23.             get 
  24.             { 
  25.                 foreach (People people in _people) 
  26.                 { 
  27.                     if (people.Age > OldAge) 
  28.                         yield return people; 
  29.                 } 
  30.                 yield break
  31.             } 
  32.         } 
  33.     } 

IEnumerable的本質(zhì)是狀態(tài)機(jī),它有點(diǎn)類(lèi)似事件的概念,將實(shí)現(xiàn)丟到外面,實(shí)現(xiàn)代碼間的穿越(想想星際穿越),這是Linq的基礎(chǔ)??犰诺牡?,真的有我們想象的那么簡(jiǎn)單么?

在C語(yǔ)言中,數(shù)組就是數(shù)組,實(shí)實(shí)在在的內(nèi)存空間,那么IEnumerable到底是什么意思呢?如果它由一個(gè)真正的集合(比如List)實(shí)現(xiàn),那么沒(méi)問(wèn)題,也是實(shí)實(shí)在在的內(nèi)存,可是如果是上述的例子呢?篩選返回的yield return 只返回了元素,但可能并不存在這個(gè)實(shí)際的集合,如果你將簡(jiǎn)單的枚舉器的yield return 反編譯后看,會(huì)發(fā)現(xiàn)其實(shí)是一組switch-case, 編譯器在后臺(tái)為我們做了大量的工作。

生成的新迭代器,如果不MoveNext,其實(shí)Current是空的,這是為什么呢?為什么一個(gè)迭代器不直接指向頭元素呢?

(感謝回答:就像C語(yǔ)言的單向鏈表的頭指針一樣,這樣可以指定一個(gè)不包含任何元素的枚舉,程序設(shè)計(jì)起來(lái)更方便)

foreach每次往前移動(dòng)一格,到頭了就停止。 等等,你確定它到頭了就會(huì)停止么?我們來(lái)做個(gè)試驗(yàn):

  1. public IEnumerable<People> Peoples1   //直接返回集合 
  2.         { 
  3.             get { return peoples; } 
  4.         }public IEnumerable<People> Peoples2  //包含yield break; 
  5.         { 
  6.             get 
  7.             { 
  8.                 foreach (var people in peoples) 
  9.                 { 
  10.                     yield return people; 
  11.                 } 
  12.                 yield break;  //其實(shí)這個(gè)用不用都可以 
  13.             } 
  14.         } 

以上兩種,是我們常見(jiàn)的方式,注意第二種實(shí)現(xiàn),ReSharper把yield break標(biāo)成灰色(重復(fù))。

我們?cè)賹?xiě)下如下的測(cè)試代碼,peopleList集合只有五個(gè)元素,但嘗試去MoveNext 8次??梢园裵eopleList.Peoples1換成2,3,分別測(cè)試。

  1. var peopleList = new PeopleList();  //內(nèi)部構(gòu)造函數(shù)插入了五個(gè)元素 
  2.             IEnumerator<People> e1 = peopleList.Peoples1.GetEnumerator(); 
  3.             if (e1.Current == null
  4.             { 
  5.                 Console.WriteLine("迭代器生成后Current為空"); 
  6.             } 
  7.             int i = 0; 
  8.             while (i<8)  //總共只有五個(gè)元素,看看一直迭代會(huì)發(fā)生什么效果 
  9.             { 
  10.                 e1.MoveNext(); 
  11.                 if (e1.Current == null
  12.                 { 
  13.                     Console.WriteLine("迭代第{0}次后為空",i); 
  14.                 } 
  15.                 else 
  16.                 { 
  17.                     Console.WriteLine("迭代第{0}次后為{1}",i,e1.Current.Name); 
  18.                 } 
  19.                 i++; 
  20.             } 

越界枚舉測(cè)試結(jié)果

  1. //PeopleEnumerable1   (直接返回集合) 
  2. 迭代器生成后Current為空 
  3. 迭代第0次后為P0 
  4. 迭代第1次后為P1 
  5. 迭代第2次后為P2 
  6. 迭代第3次后為P3 
  7. 迭代第4次后為P4 
  8. 迭代第5次后為空 
  9. 迭代第6次后為空 
  10. 迭代第7次后為空 
  11.  
  12. //PeopleEnumerable2 (不加yield break) 
  13. 迭代器生成后Current為空 
  14. 迭代第0次后為P0 
  15. 迭代第1次后為P1 
  16. 迭代第2次后為P2 
  17. 迭代第3次后為P3 
  18. 迭代第4次后為P4 
  19. 迭代第5次后為P4 
  20. 迭代第6次后為P4 
  21. 迭代第7次后為P4 
  22.  
  23.  
  24. //PeopleEnumerable2 (加上yield break) 
  25. 迭代器生成后Current為空 
  26. 迭代第0次后為P0 
  27. 迭代第1次后為P1 
  28. 迭代第2次后為P2 
  29. 迭代第3次后為P3 
  30. 迭代第4次后為P4 
  31. 迭代第5次后為P4 
  32. 迭代第6次后為P4 
  33. 迭代第7次后為P4 
  34.  
  35. 越界枚舉測(cè)試結(jié)果 

真讓人吃驚,返回原始集合,越界之后就返回null了,但如果是MoveNext,不論有沒(méi)有加yield break, 越界迭代后還是返回***一個(gè)元素! 也許就是我們?cè)诘?節(jié)里提到的,迭代器只返回上一次的狀態(tài),因?yàn)闊o(wú)法后移,所以就重復(fù)返回,那為什么List集合就不會(huì)這樣呢?問(wèn)題留給大家。

(感謝回答:越界枚舉到底是null還是***一個(gè)元素的問(wèn)題,其實(shí)沒(méi)有明確規(guī)定,具體看.NET的實(shí)現(xiàn),在.NET Framework中,越界后依然是***一個(gè)元素)。

不過(guò)各位看官盡管放心,在foreach的標(biāo)準(zhǔn)枚舉過(guò)程下,枚舉是肯定能枚舉完的,這就說(shuō)明了MoveNext和foreach兩種在實(shí)現(xiàn)上的不同,顯然foreach更安全。同時(shí)還注意,不能在yield過(guò)程中實(shí)現(xiàn)try-catch代碼塊,為什么呢?因?yàn)閥ield模式組合了來(lái)自不同位置的代碼和邏輯,怎么可能靠編譯給每個(gè)引用的代碼塊加上try-catch?這太復(fù)雜了。

枚舉的特性在處理大數(shù)據(jù)的時(shí)候很有幫助,就是因?yàn)樗臓顟B(tài)性,一個(gè)超大的文件,我只要每次讀一部分,就可以順次的讀取下去,直到文件結(jié)束,由于不需要實(shí)例化集合,內(nèi)存占用是很低的。對(duì)數(shù)據(jù)庫(kù)也是如此,每次讀取一部分,就能應(yīng)對(duì)很多難以應(yīng)付的情況。

3.在枚舉中修改枚舉器參數(shù)?

在枚舉過(guò)程中,集合是不能被修改的,比如在foreach循環(huán)中,如果插入或者刪除一個(gè)元素,肯定會(huì)報(bào)運(yùn)行時(shí)異常。有經(jīng)驗(yàn)的程序員告訴 你,此時(shí)用for循環(huán)。for和foreach的本質(zhì)區(qū)別是什么呢? 

在MoveNext中,我突然改變了枚舉的參數(shù),使得它的數(shù)據(jù)量變多或者變少了,又會(huì)發(fā)生什么?

  1. Console.WriteLine("不修改OldAge參數(shù)"); 
  2.             foreach (var olderPeople in peopleList.OlderPeoples) 
  3.             { 
  4.                 Console.WriteLine(olderPeople); 
  5.                
  6.             } 
  7.  
  8.             Console.WriteLine("修改了OldAge參數(shù)"); 
  9.             i = 0; 
  10.             foreach (var olderPeople in peopleList.OlderPeoples) 
  11.             { 
  12.                 Console.WriteLine(olderPeople); 
  13.                 i++; 
  14.                 if (i ==1) 
  15.                     peopleList.OldAge = 33;  //只枚舉一次后,修改OldAge 的值 
  16.             } 

測(cè)試結(jié)果是:

  1. 不修改OldAge參數(shù) 
  2. ID:2,NameP2,Age32 
  3. ID:3,NameP3,Age33 
  4. ID:4,NameP4,Age34 
  5.  
  6. 修改了OldAge參數(shù) 
  7. ID:2,NameP2,Age32 
  8. ID:4,NameP4,Age34 

可以看到,在枚舉過(guò)程中修改了控制枚舉的值,能動(dòng)態(tài)改變枚舉的行為。上面是在一個(gè)yield結(jié)構(gòu)中改變變量的情況,我們?cè)僭囋囋诘骱蚅ambda表達(dá)式的情況(代碼略), 得到結(jié)果是:

  1. 在迭代中修改變量值 
  2. ID:2,NameP2,Age32 
  3. ID:4,NameP4,Age34 
  4. 在Lambda表達(dá)式中修改變量值 
  5. ID:2,NameP2,Age32 
  6. ID:4,NameP4,Age34 

可以看出,外部修改變量能夠控制內(nèi)部的迭代過(guò)程,動(dòng)態(tài)改變了“集合的元素”。 這是一個(gè)好事,因?yàn)樗男袨榇_實(shí)是對(duì)的;也是壞事:在迭代過(guò)程中,修改了變量的值,上下文語(yǔ)境變化,可是如果還按之前的語(yǔ)境進(jìn)行處理,顯然就會(huì)釀成大錯(cuò)。 這里和閉包沒(méi)關(guān)系。

因此,如果一個(gè)枚舉需要在上下文會(huì)發(fā)生變化的情況下保持原有的行為,就需要手動(dòng)保存變量的副本。

如果你把兩個(gè)集合A,B用Concat函數(shù)順次拼接起來(lái),也就是A-B, 而且不實(shí)例化,那么在枚舉A的階段中,修改集合B的元素,會(huì)報(bào)錯(cuò)么? 為什么?

比如如下的測(cè)試代碼:

  1. List<People> peoples=new List<People>(){new People(){Name = "PA"}}; 
  2.             Console.WriteLine("將一個(gè)虛擬枚舉A連接到集合B,并在枚舉A階段修改集合B的元素"); 
  3.             var e8 = peopleList.PeopleEnumerable1.Concat(peoples); 
  4.             i = 0
  5.             foreach (var people in e8) 
  6.             { 
  7.                 Console.WriteLine(people); 
  8.                 i++; 
  9.                 if (i == 1)    
  10.                   peoples.Add(new People(){Name = "PB"});  //此時(shí)還在枚舉PeopleEnumerable1階段 
  11.         } 

如果你想知道,可以自己做個(gè)試驗(yàn)(在我附件里也有這個(gè)例子)。留給大家討論。

4. 更多LINQ的討論

你可以在yield中插入任何代碼,這就是延遲(Lazy)的表現(xiàn),只是需要執(zhí)行的時(shí)候才執(zhí)行。 我們不難想象Linq很多函數(shù)的實(shí)現(xiàn)方式,比較有意思的包括Concat,它將兩個(gè)集合連在了一起,就像下面這樣:

  1. public static IEnumerable<T> Concat<T>(this IEnumerable<T> source, IEnumerable<T> source2) 
  2.        { 
  3.            foreach (var r in source) 
  4.            { 
  5.                yield return r; 
  6.            } 
  7.            foreach (var r in source2) 
  8.            { 
  9.                yield return r; 
  10.            } 
  11.        } 

還有Select, Where都好實(shí)現(xiàn),就不討論了。

Skip怎么實(shí)現(xiàn)的呢?  它跳過(guò)了集合中的一部分元素,我猜是這樣的:

  1. public static IEnumerable<T> Skip<T>(this IEnumerable<T> source, int count) 
  2.        { 
  3.            int t = 0; 
  4.            foreach (var r in source) 
  5.            { 
  6.                t++; 
  7.                if(t<=count) 
  8.                    continue
  9.                yield return r; 
  10.            } 
  11.        } 

那么,被跳過(guò)的元素,到底被訪問(wèn)過(guò)沒(méi)有?它的代碼被執(zhí)行了么?

  1. Console.WriteLine("Skip的元素是否會(huì)被訪問(wèn)到?"); 
  2.  IEnumerable<People> e6 = peopleList.PeopleEnumerable1.Select(d => 
  3.        { 
  4.               Console.WriteLine(d); 
  5.               return d; 
  6.        }).Skip(3); 
  7.  Console.WriteLine("只枚舉,什么都不做:"); 
  8.  foreach (var  r in e6){}   
  9.  
  10.  Console.WriteLine("轉(zhuǎn)換為實(shí)體集合,再次枚舉"); 
  11.  IEnumerable<People> e7 = e6.ToList(); 
  12.  foreach (var r in e7){} 

測(cè)試結(jié)果如下:

  1. 只枚舉,什么都不做: 
  2. ID:0,NameP0,Age30 
  3. ID:1,NameP1,Age31 
  4. ID:2,NameP2,Age32 
  5. ID:3,NameP3,Age33 
  6. ID:4,NameP4,Age34 
  7. 轉(zhuǎn)換為實(shí)體集合,再次枚舉 
  8. ID:0,NameP0,Age30 
  9. ID:1,NameP1,Age31 
  10. ID:2,NameP2,Age32 
  11. ID:3,NameP3,Age33 
  12. ID:4,NameP4,Age34 

可以看出,Skip雖然是跳過(guò),但還是會(huì)“訪問(wèn)”元素的,因此會(huì)執(zhí)行額外的操作,比如lambda表達(dá)式,這不論是枚舉器還是實(shí)體集合都是如此。這個(gè)角度說(shuō),要優(yōu)化表達(dá)式,應(yīng)當(dāng)盡可能在linq中早的Skip和Take,以減少額外的副作用。

但對(duì)于Linq to SQL的實(shí)現(xiàn)中,顯然Skip是做過(guò)額外優(yōu)化的。我們是否也能優(yōu)化Skip的實(shí)現(xiàn),使得上層盡可能提升海量數(shù)據(jù)下的Skip性能呢?

5. 有關(guān)IEnumerable枚舉的更多問(wèn)題

(1) 枚舉過(guò)程如何暫停?有暫停這一說(shuō)么? 如何取消?

(2) PLinq的實(shí)現(xiàn)原理是什么?它改變的到底是IEnumerable接口的哪種特性?是否產(chǎn)生了亂序枚舉?這種亂序枚舉到底是怎么實(shí)現(xiàn)?

(3) IEnumerable實(shí)現(xiàn)了鏈條結(jié)構(gòu),這是Linq的基礎(chǔ),但這個(gè)鏈條的本質(zhì)是什么?

(4) 因?yàn)镮Enumerable代表了狀態(tài)和延遲,因此就不難理解很多異步操作的本質(zhì)就是IEnumerable。我有一次面試時(shí)候,問(wèn)到了異步的實(shí)質(zhì),你說(shuō)異步的實(shí)質(zhì)是什么?異步不是多線程!異步的精彩,本質(zhì)上是代碼的重新組合,因?yàn)殚L(zhǎng)時(shí)間的異步操作就是狀態(tài)機(jī)。。。比如CCR庫(kù)。此處不準(zhǔn)備展開(kāi)說(shuō),因?yàn)闀簳r(shí)超過(guò)了作者的知識(shí)儲(chǔ)備,下次再說(shuō)。

(5) 如果用C語(yǔ)言來(lái)實(shí)現(xiàn)同樣的枚舉器,同樣酷炫的Linq,不靠編譯器能實(shí)現(xiàn)么?先不提Lambda的梗,我們用函數(shù)指針。

(6) IEnumerable寫(xiě)MapReduce? Linq for MapReduce?

(7) IEnumerable如何Sort? 實(shí)例化為一個(gè)集合再排序么?如果是一個(gè)超大的虛擬集合,如何優(yōu)化?

下一篇我們?cè)敿?xì)討論這些內(nèi)容。附件是整個(gè)測(cè)試代碼,如果你覺(jué)得有幫助,請(qǐng)幫忙點(diǎn)推薦,謝謝.

完整測(cè)試代碼。

責(zé)任編輯:張偉 來(lái)源: 博客園
相關(guān)推薦

2012-11-23 10:57:44

Shell

2023-01-29 09:46:47

Dialog彈窗模態(tài)

2023-02-27 09:20:24

絕對(duì)定位CSS

2015-08-13 09:03:14

調(diào)試技巧

2019-11-20 10:25:06

sudoLinux

2020-01-29 19:40:36

Python美好,一直在身邊Line

2021-01-05 11:22:58

Python字符串代碼

2021-07-12 07:59:06

安全 HTML 屬性

2019-11-25 14:05:47

Python裝飾器數(shù)據(jù)

2021-12-17 00:10:00

ChromeDevtools功能

2020-03-05 11:10:18

Left join數(shù)據(jù)庫(kù)MySQL

2018-05-10 11:50:13

Docker容器冷知識(shí)

2024-03-04 00:00:00

Kubernetes技巧API

2016-09-05 13:14:11

2022-09-20 11:58:27

NpmNode.js

2010-07-29 09:18:31

Linux用戶

2015-05-14 15:59:33

DockerLinux容器管理工具

2010-07-26 13:24:11

2010-08-10 09:13:49

Linux用戶

2011-02-14 16:11:44

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)