谭浩强C语言配套课件第九章.ppt





《谭浩强C语言配套课件第九章.ppt》由会员分享,可在线阅读,更多相关《谭浩强C语言配套课件第九章.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第1313章章 文文 件件13.1文件概述13.2文件类型指针13.3文件的打开与关闭13.4文件的读写13.5文件的定位13.6出错的检测13.7文件输入输出小结习题13.1C文件概述文件(file)是程序设计中一个重要的概念。所谓“文件”一般指存储在外部介质上数据的集合。一批数据是以文件的形式存放在外部介质(如磁盘)上的。操作系统是以文件为单位对数据进行管理的,也就是说,如果想找存在外部介质上的数据,必须先按文件名找到所指定的文件,然后再从该文件中读取数据。要向外部介质上存储数据也必须先建立一个文件(以文件名标识),才能向它输出数据。以前各章中所用到的输入和输出,都是以终端为对象的,即从
2、终端键盘输入数据,运行结果输出到终端上。从操作系统的角度看,每一个与主机相联的输入输出设备都看作是一个文件。例如,终端键盘是输入文件,显示屏和打印机是输出文件。在程序运行时,常常需要将一些数据(运行的最终结果或中间数据)输出到磁盘上存放起来,以后需要时再从磁盘中输入到计算机内存。这就要用到磁盘文件。C语言把文件看作是一个字符(字节)的序列,即由一个一个字符(字节)的数据顺序组成。根据数据的组织形式,可分为ASCII文件和二进制文件。ASCII文件又称文本(text)文件,它的每一个字节放一个ASCII代码,代表一个字符。二进制文件是把内存中的数据按其在内存中的存储形式原样输出到磁盘上存放。如果
3、有一个整数10000,在内存中占2个字节,如果按ASCII码形式输出,则占5个字节,而按二进制形式输出,在磁盘上只占2个字节,见图13.1。用ASCII码形式输出与字符一一对应,一个字节代表一个字符,一个字节代表一个字符,因而便于对字符进行逐个处理,也便于输出字符。但一般占存储空间较多,而且要花费转换时间(二进制形式与ASCII码间的转换)。用二进制形式输出数值,可以节省外存空间和转换时间,但一个字节并不对应一个字符,不能直接输出字符形式。一般中间结果数据需要暂时保存在外存上以后又需要输入到内存的,常用二进制文件保存。图13.1由前所述,一个C文件是一个字节流或二进制流。它把数据看作是一连串的
4、字符(字节),而不考虑记录的界限。换句话说,C语言中文件并不是由记录(record)组成的(这是和PASCAL或其他高级语言不同的)。在C语言中对文件的存取是以字符(字节)为单位的。输入输出的数据流的开始和结束仅受程序控制而不受物理符号(如回车换行符)控制。也就是说,在输出时不会自动增加回车换行符以作为记录结束的标志,输入时不以回车换行符作为记录的间隔(事实上C文件并不由记录构成)。我们把这种文件称为流式文件。C语言允许对文件存取一个字符,这就增加了处理的灵活性。在过去使用的C版本(如UNIX系统下使用的C)有两种对文件的处理方法:一种叫“缓冲文件系统”,一种叫“非缓冲文件系统”。所谓缓冲文件
5、系统是指系统自动地在内存区为每一个正在使用的文件名开辟一个缓冲区。从内存向磁盘输出数据必须先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘去。如果从磁盘向内存读入数据,则一次从磁盘文件将一批数据输入到内存缓冲区(充满缓冲区),然后再图图13.2从缓冲区逐个地将数据送到程序数据区(给程序变量)。见图13.2。缓冲区的大小由各个具体的C版本确定,一般为512字节。所谓“非缓冲文件系统”是指系统不自动开辟确定大小的缓冲区,而由程序为每个文件设定缓冲区。在UNIX系统下,用缓冲文件系统来处理文本文件,用非缓冲文件系统处理二进制文件。用缓冲文件系统进行的输入输出又称为高级(或高层)磁盘输入输出(高层I/
6、O),用非缓冲文件系统进行的输入输出又称为低级(低层)输入输出系统。ANSI C标准决定不采用非缓冲文件系统,而只采用缓冲文件系统。即既用缓冲文件系统处理文本文件,也用它来处理二进制文件。也就是将缓冲文件系统扩充为可以处理二进制文件。在C语言中,没有输入输出语句,对文件的读写都是用库函数来实现的。ANSI规定了标准输入输出函数,用它们对文件进行读写。本章只介绍ANSI C规定的文件系统以及对它的读写。13.2文件类型指针缓冲文件系统中,关键的概念是“文件指针”。每个被使用的文件都在内存中开辟一个区,用来存放文件的有关信息(如文件的名字、文件状态及文件当前位置等)。这些信息是保存在一个结构体变量
7、中的。该结构体类型是由系统定义的,取名为FILE。Turbo C在stdio.h文件中有以下的文件类型声明:typedefstructshortlevel;/*缓冲区“满”或“空”的程度*/unsignedflags;/*文件状态标志*/charfd;/*文件描述符*/unsignedcharhold;/*如无缓冲区不读取字符*/shortbsize;/*缓冲区的大小*/unsignedchar*baffer;/*数据缓冲区的位置*/unsignedar*curp;/*指针,当前的指向*/unsignedistemp;/*临时文件,指示器*/shorttoken;/*用于有效性检查*/FILE
8、;有了结构体FILE类型之后,可以用它来定义若干个FILE类型的变量,以便存放若干个文件的信息。例如,可以定义以下FILE类型的数组。FILEf5;定义了一个结构体数组f,它有5个元素,可以用来存放5个文件的信息。可以定义文件型指针变量。如:FILEfp;fp是一个指向FILE类型结构体的指针变量。可以使fp指向某一个文件的结构体变量,从而通过该结构体变量中的文件信息能够访问该文件。也就是说,通过文件指针变量能够找到与它相关的文件。如果有n个文件,一般应设n个指针变量(指向FILE类型结构体的指针变量),使它们分别指向n个文件(确切地说指向存放该文件信息的结构体变量),以实现对文件的访问。13
9、.3文件的打开与关闭和其他高级语言一样,对文件读写之前应该“打开”该文件,在使用结束之后应关闭该文件。13.3.1文件的打开(fopen函数)ANSI C规定了标准输入输出函数库,用fopen()函数来实现打开文件。fopen函数的调用方式通常为FILEfp;fp=fopen(文件名,使用文件方式);例如:fp=fopen(a1,r);它表示要打开名字为a1的文件,使用文件方式为“读入”(r代表read,即读入),fopen函数带回指向a1文件的指针并赋给fp,这样fp就和文件a1相联系了,或者说,fp指向a1文件。可以看出,在打开一个文件时,通知给编译系统以下3个信息:需要打开的文件名,也就
10、是准备访问的文件的名字。使用文件的方式(“读”还是“写”等)。让哪一个指针变量指向被打开的文件。说明:(1)用“r”方式打开的文件只能用于向计算机输入而不能用作向该文件输出数据,而且该文件应该已经存在,不能用“r”方式打开一个并不存在的文件(即输入文件),否则出错。(2)用“w”方式打开的文件只能用于向该文件写数据(即输出文件),而不能用来向计算机输入。如果原来不存在该文件,则在打开时新建立一个以指定的名字命名的文件。如果原来已存在一个以该文件名命名的文件,则在打开时将该文件删去,然后重新建立一个新文件。(3)如果希望向文件末尾添加新的数据(不希望删除原有数据),则应该用“a”方式打开。但此时
11、该文件必须已存在,否则将得到出错信息。打开时,位置指针移到文件末尾。(4)用“r+”、“w+”、“a+”方式打开的文件既可以用来输入数据,也可以用来输出数据。用“r+”方式时该文件应该已经存在,以便能向计算机输入数据。用“w+”方式则新建立一个文件,先向此文件写数据,然后可以读此文件中的数据。用“a+”方式打开的文件,原来的文件不被删去,位置指针移到文件末尾,可以添加,也可以读。(5)如果不能实现“打开”的任务,fopen函数将会带回一个出错信息。出错的原因可能是用“r”方式打开一个并不存在的文件;磁盘出故障;磁盘已满无法建立新文件等。此时fopen函数将带回一个空指针值NULL(NULL在s
12、tdioh文件中已被定义为0)。常用下面的方法打开一个文件:if(fp=fopen(file1,r)=NULL)printf(cannot open this filen);exit(0);即先检查打开的操作有否出错,如果有错就在终端上输出“cannot open this file”。exit函数的作用是关闭所有文件,终止正在调用的过程。待用户检查出错误,修改后再运行。(6)用以上方式可以打开文本文件或二进制文件,这是ANSI C的规定,用同一种缓冲文件系统来处理文本文件和二进制文件。但目前使用的有些C编译系统可能不完全提供所有这些功能(例如有的只能用“r”、“w”、“a”方式),有的C版本
13、不用“r+”、“w+”、“a+”,而用“rw”、“wr”、“ar”等,请读者注意所用系统的规定。(7)在向计算机输入文本文件时,将回车换行符转换为一个换行符,在输出时把换行符转换成为回车和换行两个字符。在用二进制文件时,不进行这种转换,在内存中的数据形式与输出到外部文件中的数据形式完全一致,一一对应。(8)在程序开始运行时,系统自动打开3个标准文件:标准输入、标准输出、标准出错输出。通常这3个文件都与终端相联系。因此以前我们所用到的从终端输入或输出都不需要打开终端文件。系统自动定义了3个文件指针stdin、stdout和stderr,分别指向终端输入、终端输出和标准出错输?也从终端输出)。如果
14、程序中指定要从stdin所指的文件输入数据,就是指从终端键盘输入数据。13.3.2文件的关闭(fclose函数)在使用完一个文件后应该关闭它,以防止它再被误用。“关闭”就是使文件指针变量不指向该文件,也就是文件指针变量与文件“脱钩”,此后不能再通过该指针对原来与其相联系的文件进行读写操作。除非再次打开,使该指针变量重新指向该文件。用fclose函数关闭文件。fclose函数调用的一般形式为fclose(文件指针);例如:fclose(fp);前面我们曾把打开文件(用fopen函数)时所带回的指针赋给了fp,今通过fp把该文件关闭。即fp不再指向该文件。应该养成在程序终止之前关闭所有文件的习惯,
15、如果不关闭文件将会丢失数据。因为,如前所述,在向文件写数据时,是先将数据输到缓冲区,待缓冲区充满后才正式输出给文件。如果当数据未充满缓冲区而程序结束运行,就会将缓冲区中的数据丢失。用fclose函数关闭文件,可以避免这个问题,它先把缓冲区中的数据输出到磁盘文件,然后才释放文件指针变量。fclose函数也带回一个值,当顺利地执行了关闭操作,则返回值为0;否则返回EOF(-1)。可以用ferror函数来测试(见13.61节)。13.4文 件 的 读 写文件打开之后,就可以对它进行读写了。常用的读写函数如下所述。13.4.1fputc函数和fgetc函数(putc函数和getc函数)1.fputc函
16、数把一个字符写到磁盘文件上去。其一般调用形式为fputc(ch,fp);其中ch是要输出的字符,它可以是一个字符常量,也可以是一个字符变量。fp是文件指针变量。fputc(ch,fp)函数的作用是将字符(ch的值)输出到fp所指向的文件中去。fputc函数也带回一个值:如果输出成功则返回值就是输出的字符;如果输出失败,则返回一个EOF(-1)。EOF是在stdioh文件中定义的符号常量,值为-1。在第4章介绍过putchar函数,其实putchar是从fputc函数派生出来的。putchar(c)是在stdio.h文件中用预处理命令#define定义的宏:#defineputchar(c)fp
17、utc(c,stdout)前面已叙述,stdout是系统定义的文件指针变量,它与终端输出相连。fputc(c瑂tdout)的作用是将c的值输出到终端。用宏putchar(c)比写fputc(c,stdout)简单一些。从用户的角度,可以把putchar(c)看作函数而不必严格地称它为宏。2.fgetc函数从指定的文件读入一个字符,该文件必须是以读或读写方式打开的。fgetc函数的调用形式为ch=fgetc(fp);fp为文件型指针变量,ch为字符变量。fgetc函数带回一个字符,赋给ch。如果在执行fgetc函数读字符时遇到文件结束符,函数返回一个文件结束标志EOF(-1)。如果想从一个磁盘文
18、件顺序读入字符并在屏幕上显示出来,可以:ch=fgetc(fp);while(ch!=EOF)putchar(ch);ch=fgetc(fp);注意:EOF不是可输出字符,因此不能在屏幕上显示。由于字符的ASCII码不可能出现-1,因此EOF定义为-1是合适的。当读入的字符值等于-1(即EOF)时,表示读入的已不是正常的字符而是文件结束符。但以上只适用于读文本文件的情况。现在ANSI C已允许用缓冲文件系统处理二进制文件,而读入某一个字节中的二进制数据的值有可能是-1,而这又恰好是EOF的值。这就出现了需要读入有用数据而却被处理为“文件结束”的情况。为了解决这个问题,ANSI C提供一个feo
19、f函数来判断文件是否真的结束。feof(fp)用来测试fp所指向的文件当前状态是否“文件结束”。如果是文件结束,函数feof(fp)的值为1(真),否则为0(假)。如果想顺序读入一个二进制文件中的数据,可以用while(!feof(fp)c=fgetc(fp);当未遇文件结束,feof(fp)的值为0,!feof(fp)为1,读入一个字节的数据赋给整型变量c,并接着对其进行所需的处理。直到遇文件结束,feof(fp)值为1,!feof(fp)值为0,不再执行while循环。这种方法也适用于文本文件。3.fputc和fgetc函数使用举例在掌握了以上几种函数以后,可以编制一些简单的使用文件的程序
20、。例13.1从键盘输入一些字符,逐个把它们送到磁盘上去,直到输入一个“#”为止。#include main()FILEfp;char ch,filename10;scanf(%s,filename);if(fp=fopen(filename,w)=NULL)printf(cannot open filen);exit(0);ch=getchar();/*此语句用来接收在执行scanf语句时最后输入的回车符*/ch=getchar();/*接收输入的第一个字符*/while(ch!=#)fputc(ch,fp);putchar(ch);ch=getchar();fclose(fp);运行情况如下
21、:file1c(输入磁盘文件名)computer and c#(输入一个字符串)computer and c (输出一个字符串)文件名由键盘输入,赋给字符数组filename,fopen函数中的第一个参数“文件名”可以直接写成字符串常量形式(如“file1c”),也可以用字符数组名,在字符数组中存放文件名(如本例所用的方法)。本例运行时,从键盘输入磁盘文件名“file1c”,然后输入要写入该磁盘文件的字符“computer and c”,“#”是表示输入结束,程序将“computer and c”写到以“file1c”命名的磁盘文件中,同时在屏幕上显示这些字符,以便核对。可以用DOS命令将fi
22、le1c文件中的内容打印出来:Ctype file1ccomputer and c证明了在file1c文件中已存入了“computer and c”的信息。例13.2将一个磁盘文件中的信息复制到另一个磁盘文件中。#include main()FILEin,out;char ch,infile10,outfile10;printf(Enter the infile name:n);scanf(%s,infile);printf(Enter the outfile name:n);scanf(%s,outfile);if(in=fopen(infile,r)=NULL)printf(cannot
23、open infilen);exit(0);if(out=fopen(outfile,w)=NULL)printf(cannot open outfilen);exit(0);while(!feof(in)fputc(fgetc(in),out);fclose(in);fclose(out);运行情况如下:Enter the infile name:file1c(输入原有磁盘文件名)Enter the outfile name:file2c(输入新复制的磁盘文件名)程序运行结果是将file1c文件中的内容复制到file2c中去。可以用下面DOS命令验证ctype file1ccomputer
24、and c(file1c中的信息)ctype file2ccomputer and c(file2c中的信息)以上程序是按文本文件方式处理的。也可以用此程序来复制一个二进制文件,只需将两个fopen函数中的“r”和“w”分别改为“rb”和“wb”即可。也可以在输入命令行时把两个文件名一起输入。这时要用到main函数的参数。程序可改为#include main(int argc,char*argv)FILEin,*out;char ch;if(argc!=3)printf(You forgot to enter a filenamen);exit(0);if(in=fopen(argv1,r)=
25、NULL)printf(cannot open infilen);exit(0);if(out=fopen(argv2,w)=NULL)printf(cannot open outfilen);exit(0);while(!feof(in)fputc(fgetc(in),out);fclose(in);fclose(out);假若本程序的源文件名为a.c,经编译连接后得到的可执行文件名为a.exe,则在DOS命令工作方式下,可以输入以下的命令行:Cafile1cfile2c即在键入可执行文件名后,再输入两个参数file1c和file2c,分别输入到argv1和argv2中,argv0的内容为a
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 谭浩强 语言 配套 课件 第九

限制150内