java 关于for和foreach,兼顾效率与安全

关于for和foreach,兼顾效率与安全 对于数组的访问,是应该使用for的方式的,因为这样性能更高。以下代码是恰当的。

Java代码

Object[] objArray = ...;

int objArrayLength = objArray.Length;

for (int i = 0; i < objArrayLength; ++i)

{

// do something ...

}

String str = ...;

int strLength = str.Length;

for (int i = 0; i < strLength; ++i)

{

// do something ...

}

对ArrayList这样的可使用下标进行随机访问的数据结构,使用下标访问,要比foreach的方式进行顺序访问,速度要快一些。foreach这样写法,使用的过程产生一个额外的对象Enumerator,而且每次访问需要更多的操作,降低性能。


下面的两种写法编译出的代码是一样的:

Java代码

第一种写法:

IList list = new ArrayList();

IEnumerator iter = list.GetEnumerator();

try

{

while (iter.MoveNext())

 {

 Object obj = iter.Current;

//do something ...

 }

}

finally

{

 IDisposable disposableObj = iter as IDisposable;

if (disposableObj != null)

 {

 disposableObj.Dispose();

 }

}

第二种写法:

IList list = new ArrayList();

foreach (Object obj in list)

{

//do something ...

}

对比这两种写法,第一种写法非常罗嗦,所以C#引入了foreach的语法。通过观察第一种写法,foreach是通过GetEnumerator获得一个IEnumerator对象,通过IEnumerator对象执行MoveNext()方法和获取Current属性进行遍历的。


我们再通过Reflector工具,查看mscorlib.dll中System.Collection.ArrayList的实现: //为了简单起见,我只列出ArrayList的Add、Clear、GetEnumerator的代码

public class ArrayList  
{  
    //这是一个版本标识,ArrayList对象,每做一个修改操作,_version都会加1  
    private int _version;  

    public virtual int Add(object value)  
    {  
        int num1;  
        if (this._size == this._items.Length)  
        {  
            this.EnsureCapacity((this._size + 1));  
        }  
        this._items[this._size] = value;  
        ++this._version; //注意此处  
        this._size = ((num1 = this._size) + 1);  
        return num1;  
    }  

    public virtual void Clear()  
    {  
        Array.Clear(this._items, 0, this._size);  
        this._size = 0;  
        ++this._version; //注意此处  
    }  

    //每次调用GetEnumerator方法,都会构造一个FastArrayListEnumerator  
    //或者ArrayListEnumeratorSimple对象。  
    public virtual IEnumerator GetEnumerator()  
    {  
        if (base.GetType() == typeof(ArrayList))  
        {  
            return new ArrayList.FastArrayListEnumerator(this);  
        }  
        return new ArrayList.ArrayListEnumeratorSimple(this);  
    }  
}

通过上述代码可以看到,ArrayList是通过_version成员变量作版本标识的,每次执行Add、Clear等修改ArrayList内容的操作,都会将版本号加1,而每次调用GetEnumerator方法,都会构造一个FastArrayListEnumerator或者ArrayListEnumeratorSimple对象。我们再看


FastArrayListEnumerator的实现:

class FastArrayListEnumerator

{

private int version;

 internal FastArrayListEnumerator(ArrayList list)

 {

this.list = list;

this.index = -1;

//获取构建FastArrayListEnumerator对象时ArrayList的版本号

this.version = list._version;

this.lastIndex = (list._size - 1);

 }

public bool MoveNext()

 {

int num1;

//比较ArrayList当前的版本号,

//是否和构建FastArrayListEnumerator对象时的版本号一致

//如果不一致,则抛出异常。

if (this.version != this.list._version)

 {

throw new InvalidOperationException(

 Environment.GetResourceString("InvalidOperation_EnumFailedVersion")

 );

 }

//... ...

 }

}

FastArrayListEnumerator对象构建时,当时时ArrayList的版本号。当执行MoveNext()操作时,检查ArrayList当前的版本号是否和FastArrayListEnumerator对象构建时的版本号一致,如果不一致就会抛出异常。


由于Enumerator中,做了版本检查处理的工作,所以使用foreach是线程安全,而使用for则不时。为什么呢?如果在使用foreach遍历对象的过程中,其他线程修改了List的内容,例如添加或者删除,就会出现不可知的错误,而使用foreach则能够正确抛出错误信息。

综上所述,结论如下:

使用for,更高效率。

使用foreach,更安全。

那么如何选择呢?我的建议是,在一些全局的,多线程可以访问的数据结构对象,使用foreach。而对本地变量,则使用for,效率和安全兼顾!例如: