C++:迭代器失效问题
本文章主要讲解在什么场景下迭代器会失效,迭代器失效造成的结果是什么,然后迭代器失效后怎么解决。通过这些知识来更好地理解迭代器的使用,以及需要注意的点。
首先我们简单介绍一下迭代器:
迭代器是一种用于遍历容器(例如vector,list等)内元素的数据类型,类似于指针。它可以访问容器中的元素,并提供一种统一的方式来遍历不同类型的容器。迭代器的主要功能包括读取和写入元素、比较两个迭代器的位置、以及在容器中移动位置。
了解了迭代器的概念,我们在探讨一下迭代器失效是什么?
主要原因就是因为我们的增删操作导致迭代器原本指向的内存空间被释放或原来的意义发生改变所造成的程序崩溃或结果异常等问题。
下面我们具体说明一下迭代器是如何通过增删操作而失效以及如何预防。
拿vector为例:
在vector中,当我们插入的数据到达总容量时,再次插入就需要扩容,扩容有原地扩容和异地扩容,原地扩容:在内存足够不需要扩容且尾插时不会使迭代器失效,因为此时并没有影响到其他位置元素的地址改变;但如果在不需要扩容但影响到其他元素内存位置时,那么此时:迭代器真正失效的位置是从插入(删除)的位置开始到最后,插入(删除)位置之前的迭代器并没有失效
但如果是异地扩容,那么此时因为是在一个新的内存空间重新开辟了一处空间,而迭代器在没有进行其他操作的情况下不会随着内存位置的更改而更改指向的元素地址,所以此时的迭代器就会因为原本指向的内存空间被释放变成了野指针进而失效,最后导致程序崩溃。
同理,删除操作同样有可能因为内存位置改变而导致迭代器失效
list:
相较于vector,list因为是通过指针相互连接,所以改变一个位置的增删只会影响当前位置的迭代器失效,不会影响其他元素的迭代器。
总结下来就是:
vector:原地扩或删只会影响当前位置及后面位置的迭代器;异地扩或删则会导致所有迭代器失效
list:插入和删除都不会影响其他迭代器
其他的以指针节点为单位进行增删的不会影响其他迭代器;以连续数组为单位进行增删的会视不同情况影响其他迭代器。
理解了迭代器是如何失效的,下面我们来讨论一下如何预防失效问题:
iterator _start; // 指向数据块的开始iterator _finish; // 指向有效数据的尾iterator _endofstorage; // 指向存储容量的尾
下面的代码中,通过提前保存pos的位置len,这样在reserve分配空间后,可以通过len的长度找到pos的新位置,这样尽管以前的迭代器失效了,但通过这样的方法可以使迭代器指向分配空间后的元素位置。
下面我们在挪动数据后,会导致原来迭代器指向的位置意义变了,所以此时对应的迭代器失效了,以迭代器类型为返回值,这样可以返回一个有效的迭代器(重新返回一个新的地址),能让我们继续在修改后的容器里进行操作。此时insert返回的是新插入位置的迭代器。
iterator insert(iterator pos, const T& x)
{assert(pos >= _start && pos <= _finish);//分配空间if (_finish == _endofstorage){int len = pos - _start;int newcapacity = capacity() == 0 ? 4 : capacity() * 2;reserve(newcapacity);pos = _start + len;}//挪动数据iterator end = _finish - 1;while (pos <= end){*(end + 1) = *end;end--;}*pos = x;_finish = _finish + 1;return pos;
}
这里erase同理,本身删除了一个元素后,对应位置及后面元素的迭代器都会失效,虽然迭代器失效,但它们依然指向一个新的内存空间,此时我们只要返会新的内存空间,这样我们下次删除或增加时就可以以新的位置为新的迭代器进行新的操作。这样就防止因为迭代器失效而影响到后续的操作。
erase返回的是删除位置的下一个位置。
iterator erase(iterator pos)
{assert(pos >= _start && pos < _finish);iterator it = pos + 1;while (it != end()){*(it - 1) = *it;it++;}--_finish;return pos;
}