STL中迭代器的实现_stl迭代器实现-程序员宅基地

技术标签： struct c++ iterator distance vector list class

STL中迭代器的实现
junguo

       最近在看候捷先生的《STL源码剖析》，侯先生写的挺好的。但我读起来总感觉有些拗，理解起来有些费劲，可能他看问题的观点和我不一样造成的。开始的时候总是不太理解，后来理顺了自己的思路，发现有些东西其实并不难。在此把我对迭代器的理解整理一下，也是帮助自己消化一下，因为我发现不动手，很多东西容易遗忘。
      文章里提供的一些例子程序是在Dev-C++ 4.9.9.0中编译的，该版编译器使用的是GNU C++ 3.3.1版本的类库，该代码在其它版本上以及其它编译器中可能无法通过。3.3.1版本中的STL改进了一些内容，例如安全检查一类的东西，虽说使用上更保险。但也增加了理解的困难，所以我在源代码的摘取上参考了侯先生网站上提供的sgi-stl-2.91.57版本的内容，GUN的3.3.1其实也是在sgi-stl版本的基础上改进的。源代码可以在Dev-C++的安装目录的include/c++/3.3.1下找到，多是以stl_开头的（如list的实现文件是stl_list.h）。
        STL中为我们提供的最重要的两个内容是容器（vector，list等）和一系列的算法。在这些算法中有许多需要遍历容器中的所有元素，如search，sort等算法。STL的设计者希望将算法和容器分离开来，一个算法可以帮不同的容器实现功能。为此目的，STL应用到了《设计模式》中提到的迭代器模式。
    《设计模式》中将迭代器模式定义为：提供一种方法，使之能依序遍历容器中的每个元素，而不需要暴露容器内部的信息。在面向对象的设计里，实现迭代器，我们会为所有的迭代器提供一个统一的接口，然后更个容器的迭代器继承这个接口，然后在使用处通过接口来实现对不同迭代器的调用。但STL是采用泛型思维，利用摸版来实现的类库，所以它的迭代器的实现和面向对象稍有不同，但原理类似。在此将通过例子来具体看看STL中迭代器的实现。
    我们先来看看find()函数的实现：

    //摘自stl_algo.h
    template<typename _InputIter, typename _Tp>
    inline _InputIter
    find(_InputIter __first, _InputIter __last,
const _Tp& __val,
input_iterator_tag)
    {
      while (__first != __last && !(*__first == __val))
++__first;
      return __first;
    }

find()函数的功能是在一个容器中查找一个元素，需要遍历两个迭代器对象_first和_last所在的区间。在此我们看到它对区间的遍历是通过++__first来实现的。也就是说迭代器需要重载++运算符来实现对容器的遍历。来具体看看vector和list中的迭代器实现。
我们知道vector中的元素是连续存放的，类似于数组，在数组中可以通过指针很容易的实现对数组的遍历，在vector中也一样，并不需要提供给它专门的迭代器类，通过指针就可以实现迭代器的功能。看看例子：

#include<iostream>
#include<vector>
using namespace std;

template<typename _InputIter, typename _Tp>
inline _InputIter
myfind(_InputIter __first, _InputIter __last,
const _Tp& __val)
{
while (__first != __last && !(*__first == __val))
++__first;
return __first;
}

int main()
{
vector<int> vec;

for( int i = 0; i < 10 ; i ++ )
vec.push_back(i);

int *p0 = &vec[0];
int *p1 = &vec[10];

int *p2 = myfind(p0,p1,6);

if ( p2 != &vec[10])
  cout << *p2 << endl;

system("pause");
    return 0;
}

    例子中，我对find做了改动，改成了myfind，这是因为3.3.1的源代码中加入了traits技巧（在VC中我们是可以直接用find的），稍后我们将讲到该问题。但这里可以看到，通过指针就可以实现对vector的遍历。一般我们对迭代器的使用是如下的方式：
   vector<int>::iterator it;
   这里需要借助vector来定义迭代器，这里主要是为容器的使用提供一种统一的方式。因为list容器不能通过指针来实现遍历，它们需要实现自己的迭代器。我们来看看在vector中对于iterator的实现：

template<typename T,class Alloc = alloc >
    class vector
    {
public:
      typedef T    value_type;
      typedef value_type* iterator;

   ...
};
在此可以看到iterator在vector中也只是简单的被定义成了我们传入的类型参数T的指针（在3.3.1的代码中与这里的代码并不一样，还是traits的原因）。我们使用迭代器的一般方式是如下：
     find(vec.begin(),vec.end,6);
     再简单看看begin和end函数的实现：
template<typename T,class Alloc = alloc >
  class vector
    {
proteted:
iterator start;
iterator finist;
public:
     iterator begin(){return start;}
        iterator end(){return end;}
   ...
};
    这里可以看到，只是为vector设置一个头指针和尾指针，然后通过begin和end来得到这两个指针。
list就不可以直接通过指针来实现迭代器了，因为它里面的元素是不连续的。需要我们自己去实现，我们先把list的定义抽出来看看。
template <class _Tp >
struct _List_node {
_List_node< _Tp>* _M_next;
_List_node< _Tp>* _M_prev;
_Tp _M_data;
};
template <class _Tp, class Alloc = alloc>
class list {
protected:
_List_nod<_Tp>e* node;
....
public:
void push_front(const _Tp & x);
void push_back(const _Tp & x);
....
};
   为了便于理解，我将代码进行了简单的修改，事实上3.3.1里的代码要比这个要复杂一些。一般来说设计一个链表，我们会把它分成两部分：_List_node用来存放数据，list用来操作链表。这样，迭代器实际传回的应该是_List_node，当它向前遍历的时候，传回的应该是它的下一个结点。按着这个结构，为链表来设计一个迭代器，如下：
template<class T>
struct __list_iterator {
   _List_node<T>* node;
__list_iterator(_List_node<T>* x) : node(x) {}
__list_iterator() {}

bool operator==(const __list_iterator<T>& x) const { return node == x.node; }
bool operator!=(const __list_iterator<T>& x) const { return node != x.node; }

T& operator*() const { return (*node)._M_data; }

__list_iterator<T>& operator++() {
    node = (_List_node<T>*)((*node)._M_next);
    return *this;
}

__list_iterator<T> operator++(int) {
    __list_iterator<T> tmp = *this;
    ++*this;
    return tmp;
}

};
      我们可以看到，迭代器中重载了==，！=，*，++等操作符，这是因为这些操作是在算法中经常要用到的操作符。看看myfind中实现，就可以明白：
while (__first != __last && !(*__first == __val))
++__first;
      这里要用到两个迭代器的比较（__first != __last），所以我们需要重载等于运算符；迭代器中值的比较（*__first == __val），这时候比较的不再是迭代器，而是迭代器所包含的内容（这里是_List_node的对象），所以我们需要重载*来得到它；最重要的就是遍历的实现，需要重载++运算符，这里是通过node = (_List_node<T>*)((*node)._M_next);将迭代器中的_List_node对象改为它的下一个对象来实现的。这样我们就完成了迭代器的设计。再来看看它的用法：
int main(int argc, char *argv[])
{
list<int> mylist;

for(int i = 0;i <= 10; i++ )
{
      mylist.push_back(i);
}
// mylist.begin()得到的是STL本身提供的迭代器，所以我们需要得到它所包含的_List_node<T>对象指针。
_List_node<int>* p1 = (_List_node<int>*)mylist.begin()._M_node;
_List_node<int>* p2 = (_List_node<int>*)mylist.end()._M_node;

//这里用我们得到的指针来生成我们自己的迭代器
__list_iterator<int> it1(p1);
__list_iterator<int> it2(p2);

__list_iterator<int> it3 = myfind(it1,it2,6);

if ( it3 != it2 )
cout << *it3 << endl;

system("PAUSE");
return 0;
}
实际的迭代器的设计中，还会重载--和->运算符，感兴趣的可以自己看看源代码。还是和vector一样，STL会把迭代器的定义绑定到list类中去，我们来看看它的具体做法：
typedef _list_iterator<_Tp> iterator;
其实和vector一样，只要把以上的定义放到list类中，就可以了，然后，我们就可以通过list<int>::iterator ite 来定义list的迭代器了，事实上它生成的就是一个_list_iterator<int>对象。
从此可以看到迭代器就是为各个容器生成一个可以迭代自身的类，而再通过typedef来把该迭代类绑定到容器类中，这样就给了外部一个形式统一的使用方法。
除了遍历，迭代器中还用到了一个重要的技巧——traits。我们先来看看traits的用处。

template <class ForwardIterator1, class ForwardIterator2, class T>
inline void __iter_swap(ForwardIterator1 a, ForwardIterator2 b, T*) {
T tmp = *a;
*a = *b;
*b = tmp;
}
        该方法是用来实现两个迭代器中内容的交换，我们可以看到此处需要一个临时变量tmp，而tmp所对应的类型是它所包含的对象的类型。这样我们就需要传入一个类型参数T*进去，如果我们不想传这个参数进去可不可以呢？这时候就需要用到traits技巧了。事实上traits并没有什么太难理解的部分，还是看看例子：
template<class T>
struct __list_iterator {
typedef T value_type;
….
};
     现在我们在__list_iterator头部加typedef T value_type;这么一句话，然后我们重新写一下迭代器的交换函数，如下：
template <class ForwardIterator1, class ForwardIterator2>
inline void myiter_swap(ForwardIterator1 a, ForwardIterator2 b) {
typename ForwardIterator1::value_type tmp = *a;
*a = *b;
*b = tmp;
}
   此时，就可以通过typename ForwardIterator1::value_type来定义临时变量了，看看它的效果：
int main(int argc, char *argv[])
{
list<int> mylist;

for(int i = 0;i <= 10; i++ )
{
      mylist.push_back(i);
}
_List_node<int>* p1 = (_List_node<int>*)mylist.begin()._M_node;
_List_node<int>* p2 = (_List_node<int>*)mylist.end()._M_node;

__list_iterator<int> it1(p1);
__list_iterator<int> it2(p2);

__list_iterator<int> it3(p2);
//交换第一个和最后一个元素的内容
myiter_swap(it1,--it3);
//打印所有的元素
   for( ;it1 != it2;it1++)
  cout << *it1 << endl;
system("PAUSE");
return 0;
}
     事实上，在迭代器中还会包括指针，引用，还有就是两个迭代器之间距离的类型。所以迭代器的中的实际代码应该如下：
template<class T>
struct __list_iterator {
typedef bidirectional_iterator_tag iterator_category; //迭代器的类型，稍后解释
typedef T value_type;    // 对象类型
typedef value_type*pointer; // 指针类型
typedef value_type& reference; // 引用类型
typedef ptrdiff_t difference_type; // 迭代器距离类型，关于这个参数，我也搞不明白为什么需要
…
};
        这样具体的算法中就可以根据这些内容来定义自己所需要的类型了（STL的实际定义中和这里有些不同，在容器类（vector,list）中已经定义了这些类型，迭代器是再通过容器类定义，不过原理是一致的）。另外，STL中还提供了一个自己的萃取机，如下：
template<typename _Iterator>
    struct iterator_traits {
      typedef typename _Iterator::iterator_category iterator_category;
      typedef typename _Iterator::value_type        value_type;
      typedef typename _Iterator::difference_type   difference_type;
      typedef typename _Iterator::pointer           pointer;
      typedef typename _Iterator::reference         reference;
};
    有了它，我们的myinter_swap函数就可以变成以下的内容：
template <class ForwardIterator1, class ForwardIterator2>
inline void myiter_swap(ForwardIterator1 a, ForwardIterator2 b) {
typedef typename iterator_traits<ForwardIterator1>::value_type _ValueType1;
_ValueType1 tmp = *a;
*a = *b;
*b = tmp;
}

似乎这段代码并没有使代码变的方便？想想，我们的vector中并没有定义迭代器类，只是直接把指针当作了迭代器。如果直接用以上的代码明显是会出问题的，因为指针根本没有value_type这些信息。为了这种情况，STL中提供了萃取机中针对指针的偏特化版本：

template<typename _Tp>
    struct iterator_traits<_Tp*> {
      typedef random_access_iterator_tag iterator_category;
      typedef _Tp                         value_type;
      typedef ptrdiff_t                   difference_type;
      typedef _Tp*                        pointer;
      typedef _Tp&                        reference;
};

        这样vector对象就可以使用myiter_swap了，不然肯定编译不过去。还有一些针对其它类型（如常量指针）的偏特化版本，可以自己看看源码。
       在以上的代码中，我们看到了typedef random_access_iterator_tag iterator_category;这样的语句。iterator_category代表的是迭代器的分类，迭代器分为五种类型：
1， Input Iterator 这种类型的迭代器不允许外界改变，是唯读的。
2， Output Iterator 是唯写的。
3， Forard Iterator 可以读写，但它只能向前移动。
4， Bidirectional Iterator 可以读写，可以前后移动。
5， Random Access Iterator 可以读写，前后移动，并且支持p+n型的操作，也就是说可以前后移动多位，而不是一个一个的移动。
     在STL中，它们被定义为如下的形式：
/// Marking input iterators.
struct input_iterator_tag {};
/// Marking output iterators.
struct output_iterator_tag {};
/// Forward iterators support a superset of input iterator operations.
struct forward_iterator_tag : public input_iterator_tag {};
/// Bidirectional iterators support a superset of forward iterator operations.
struct bidirectional_iterator_tag : public forward_iterator_tag {};
/// Random-access iterators support a superset of bidirectional iterator operations.
struct random_access_iterator_tag : public bidirectional_iterator_tag {};

        可以看到它们并没有实际的代码，只是作为一个标记来用的。具体作用的话，还是通过函数来看看。STL的算法中提供了这样一个函数distance，它的作用是求出两个迭代器之间的距离，为了统一，函数可能写成这样：
template<typename _InputIterator>
inline typename iterator_traits<_InputIterator>::difference_type
__distance(_InputIterator __first, _InputIterator __last)
{
typename iterator_traits<_InputIterator>::difference_type __n = 0;
while (__first != __last) {
   ++__first; ++__n;
   }
    return __n;
}
        这样的话，vector和list都可以使用这个函数，但这样一来，vector也需要遍历两个迭代器之间的所有内容了。但事实上，我们知道vector是连续的区间，完全可以通过两个迭代器之间的相减操作来完成这个计算。如果采用以上的操作，会降低它的效率。有什么办法来区分这两种操作呢？通过迭代器类型就可以完成，还是看看代码：
template<typename _InputIterator>
    inline typename iterator_traits<_InputIterator>::difference_type
    __distance(_InputIterator __first, _InputIterator __last,
               input_iterator_tag)
    {
      typename iterator_traits<_InputIterator>::difference_type __n = 0;
      while (__first != __last) {
        ++__first; ++__n;
      }
      return __n;
    }

template<typename _RandomAccessIterator>
    inline typename iterator_traits<_RandomAccessIterator>::difference_type
    __distance(_RandomAccessIterator __first, _RandomAccessIterator __last,
               random_access_iterator_tag)
    {
      return __last - __first;
    }
template<typename _InputIterator>
    inline typename iterator_traits<_InputIterator>::difference_type
    distance(_InputIterator __first, _InputIterator __last)
    {
      typedef typename iterator_traits<_InputIterator>::iterator_category category;
      return __distance(__first, __last, category ());
    }

       可以看到，STL提供了__distance的两个重载函数：一个针对input_iterator_tag，使用的我们上面提到的遍历的方法；一个针对random_access_iterator_tag，采用的直接相减的方法。并提供了distance函数，在该函数里通过
typedef typename iterator_traits<_InputIterator>::iterator_category category;来得到迭代器的类型，并通过category ()生成一个对象传入到__distance中，经过C++的重载机制实现了不同类型的调用。
      迭代器是STL中的重要内容，掌握它能帮助你更好的读懂STL源码，希望这篇文章能对你有帮助。
    （写完这篇东西，时间已经不早了，错误来不及挑了。呵呵，不过有时间也不一定会检查，太懒了，这个懒字了得）

参考书籍：《STL源码解析》侯捷著华中科技大学出版社

本文链接：https://blog.csdn.net/junguo/article/details/671142

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

使用nginx解决浏览器跨域问题_nginx不停的xhr-程序员宅基地

文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的，浏览器出于安全考虑是禁止的。警告信息如下：不过jQuery对跨域问题也有解决方案，使用jsonp的方式解决，方法如下：$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr

在 Oracle 中配置 extproc 以访问 ST_Geometry-程序员宅基地

文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry，也就是我们所说的使用空间SQL 的方法，官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下，主要就分为以下几个步骤。..._extproc

Linux C++ gbk转为utf-8_linux c++ gbk->utf8-程序员宅基地

文章浏览阅读1.5w次。linux下没有上面的两个函数，需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数，转换过程中受到系统编码类型的影响，需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8

IMP-00009: 导出文件异常结束-程序员宅基地

文章浏览阅读750次。今天准备从生产库向测试库进行数据导入，结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误，google一下，发现可能有如下原因导致imp的数据太大，没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件，向高版本imp导出的dmp文件出错传输dmp文件时，文件损坏解决办法：imp时指定..._imp-00009导出文件异常结束

python程序员需要深入掌握的技能_Python用数据说明程序员需要掌握的技能-程序员宅基地

文章浏览阅读143次。当下是一个大数据的时代，各个行业都离不开数据的支持。因此，网络爬虫就应运而生。网络爬虫当下最为火热的是Python，Python开发爬虫相对简单，而且功能库相当完善，力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页，按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息，通过分析请求信息可以了解请..._初级python程序员能力要求

Spring @Service生成bean名称的规则（当类的名字是以两个或以上的大写字母开头的话，bean的名字会与类名保持一致）_@service beanname-程序员宅基地

文章浏览阅读7.6k次，点赞2次，收藏6次。@Service标注的bean，类名：ABDemoService查看源码后发现，原来是经过一个特殊处理：当类的名字是以两个或以上的大写字母开头的话，bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname

随便推点

二叉树的各种创建方法_二叉树的建立-程序员宅基地

文章浏览阅读6.9w次，点赞73次，收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立

解决asp.net导出excel时中文文件名乱码_asp.net utf8 导出中文字符乱码-程序员宅基地

文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能，如果文件名出现中文，便会以乱码视之。解决方法： fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码

笔记-编译原理-实验一-词法分析器设计_对pl/0作以下修改扩充。增加单词-程序员宅基地

文章浏览阅读2.1k次，点赞4次，收藏23次。第一次实验词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别，找出文件中所有的合法的单词，并给出一定的信息作为最后的结果，用于后续语法分析程序的使用；本实验针对 PL/0 语言的文法、词汇表编写一个词法分析程序，对于每个单词根据词汇表输出： (单词种类, 单词的值) 二元对。词汇表：种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词

android adb shell 权限,android adb shell权限被拒绝-程序员宅基地

文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限

投影仪-相机标定_相机-投影仪标定-程序员宅基地

文章浏览阅读6.8k次，点赞12次，收藏125次。1. 单目相机标定引言相机标定已经研究多年，标定的算法可以分为基于摄影测量的标定和自标定。其中，应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统，在标定过程中，相机拍摄多个角度下（至少两个角度，推荐10~20个角度）的标定板图像（相机和标定板都可以移动），即可对相机的内外参数进行标定。下面介绍张氏标定法（以下也这么称呼）的原理。原理相机模型和单应矩阵相机标定，就是对相机的内外参数进行计算的过程，从而得到物体到图像的投影_相机-投影仪标定

Wayland架构、渲染、硬件支持-程序员宅基地

文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的硬件支持简述：　翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构；一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。内核是从一个输入设备中获取一个事件，并通过 evdev 输入_wayland