在我的印象中,getline函数经常出现在自己的视野里,模糊地记得它经常用来读取字符串
。但是又对它的参数不是很了解,今天又用到了getline函数,现在来细细地总结一下:
首先要明白设计getline函数的目的,其实很简单,就是从流中读取字符串。而且读取的方
式有很多,包括根据限定符,根据已读取的字符的个数。从这个函数的名称来看,它的直观
意义是从流中读取一行,但是大家不要被这表面的现象所迷惑。其实如果让我来为这个函数
去一个名字的话,或许我会取一个getString,因为它的目的本来就是从流中读取字符的序
另外要注意,C++中有两个getline函数,一个是在string头文件中,定义的是一个全局的
函数,函数声明是istream& getline ( istream& is, string& str, char delim )与
istream& getline ( istream& is, string& str );另一个则是istream的成员函数,函
数声明是istream& getline (char* s, streamsize n )与istream& getline (char*
s, streamsize n, char delim );注意第二个getline是将读取的字符串存储在char数组
中而不可以将该参数声明为string类型,因为C++编译器无法执行此默认转换。
现在先尝试全局函数getline。从函数声明中我们观察到两种函数声明的不同主要体现在参
数的个数上,如果是两个参数的话,那么默认的限定符便是‘\n’了,但是如果声明了限
定符,'\n'是否仍然有效呢?我写了如下程序做测试:
ifstream infile("test.txt");
getline(infile,tem,'\t');
从中可以看出换行符确实失效了。所以getline函数的限定符只有一个,是相互覆盖的。
ifstream infile("test.txt");
其实istream的getline是在全局函数的getline函数的基础上,又多了一个终止读取的条
件,即根据已读取的字符的个数来判定,实际上是读取n-1个字符,因为最后要为‘\0’留
原理想必也很简单。每一次getline,文件指针都不断向下走,相当于不断的调用get函数
并且将已经读取的字符保存下来。当遇到限定符或者已读取的字符个数达到了参数的要求(
或者是由于文件的原因),那么便终止读取。如果是碰到了限定符,那么该字符便会被
extracted and discarded,也就是文件指针向下再移一位,但是并不保存该字符,也就
是每次getline之后,文件指针会停留在限定符的后面(遇到限定符的情况)。
ifstream infile("test.txt");
getline(infile,tem,'\t');
按照我的理解的话,那么文件中总共11个字母,当文件指针停在‘\t’之后,k之前的时候
,刚好是第八次,第九次getline的时候,由于在读过k之后,遇到了文件结束符,所以get
指针应该停留在k之后,这个时候再getline的话应该是无效的,但是输出结果跟我想的不
这说明第九次getline之后,get指针所指向的位置并没有改变,这说明我想的思路有问题
,于是我在网上看了getline函数的源码,其中有一篇注释比较好的:
_Myt& getline(_Elem *_Str, streamsize _Count, _Elem _Delim)
{// get up to _Count characters into NTCS, discard _Delim
_DEBUG_POINTER(_Str); //判断传入指针的合法性
ios_base::iostate _State = ios_base::goodbit;
_Chcount = 0; //从输入流中读取的字符数
const sentry _Ok(*this, true);
/*注:上面这句很关键,它关系到下面的if是否执行,也就是是否读输入流。这句从
sentry是一个class, _Ok是sentry类的一个const对象,构造这个对象时需要传入两个
第一个是流对象自身的引用,第二个表示对空白字符(如空格、制表符)的处理方式
,为true时意味着不忽略空白字符,即一个字符一个字符的从输入流中提取。
**************************************************************************
* sentry类内部重载了一个类型转换运算符,它把sentry类的实例转换成了一个bool
* 这个表达式返回sentry类的私有成员_Ok的值。
bool sentry::operator bool() const
* { // test if _Ipfx succeeded
* 在初始化时设置,设置的过程比较麻烦,这里不做赘述(其实我也没看十分明白)。
* 但可以肯定的是,当输入流的状态是正常时,这个成员的值也是true,
* _Count是调用者传入的第二个参数,这里用做循环计数器的初值,以后每读一个字
****************************************************************************
// state okay, use facet to extract
int_type _Metadelim = _Traits::to_int_type(_Delim);
int_type _Meta = _Myios::rdbuf()->sgetc();//从输入流读一个字符
for (; ; _Meta = _Myios::rdbuf()->snextc()) //snextc()从输入流中读取下一
if (_Traits::eq_int_type(_Traits::eof(), _Meta))
_State |= ios_base::eofbit;
else if (_Meta == _Metadelim) {
// got a delimiter, discard it and quit
_Myios::rdbuf()->sbumpc();
/*注:上面这句把结束符读掉了,如果不指定结束符,那就是把'\n'读掉了
}/* 注:遇到结束符,getline结束,注意这里的顺序,它是先判断是否遇到结束
_State |= ios_base::failbit;
//注:读到了指定个数,执行到这里已经隐含了在指定个数的最后一位仍然不是
//这直接导致了接下来的getline(或者get)以及>>运算符等读操作都不能正确执
// got a character, add it to string
*_Str++ = _Traits::to_char_type(_Meta);
}//注:这一分支将读取到的单个字符拷贝到缓冲区中
/* add terminating null character /*注:前面这句为字符串加入了终止符'\0'
因为_Elem()构造了一个ascii码为0的字符对象*/
_Myios::setstate(_Chcount == 0 ? _State | ios_base::failbit : _State);
/*注:如果没有读入任何字符,要保持执行这一次getline之前的输入流状态,
否则根据这一次getline执行的情况,设置输入流为相应状态。 */
return (*this); //返回输入流对象本身
sbumpc: advances the get pointer and returns the character pointed by it
snextc: advances the get pointer and returns the character pointed by it
由于是传引用,所以不论调用哪个,都会改变原文件流中get的指针所指向的位置。而且,
ifstream infile("test.txt");
//getline(infile,tem,'\t');
不管按照我的想法还是按照对上面源码的理解,结果都不应该是这个样子。是源码错了,还