Linux应用程序开发 基础知识.doc
Linux应用程序开发 基础知识目录1. C语言基础 1.1. 数据类型 1.2. 关键字 1.3. 变量等级 1.4. 特殊字符的表示方法: 1.5. 格式化字符串 1.6. 指针与数组 1.7. 结构体 1.8. typedef-自定义类型名 1.9. 函数和宏 1.10. ANSI标准头文件2. 预处理 3. 使用GCC编译程序 4. 使用gdb调试程序 5. Linux程序开发基础 5.1. 路径 5.2. 库文件 5.3. 预处理 5.4. 系统调用(system call)6. 文件处理 7. Linux环境编程 7.1. 参数选项 7.2. 环境变量 7.3. 时间 7.4. 临时文件 7.5. 用户信息 7.6. 日志信息8. 进程 8.1. 进程状态9. 串口编程 9.1. 常用函数 9.2. 设置串口属性 9.3. c_iflag输入标志说明 9.4. c_oflag输出标志说明 9.5. c_cflag控制模式标志说明 9.6. c_cc控制字符说明 9.7. c_lflag本地模式标志说明 9.8. 下面介绍一些常用串口属性的设置方法。10. 安全 10.1. 内核漏洞介绍11. 数据结构(Data Structure) 11.1. 基础概念 11.2. 线性数据结构12. 网络编程 12.1. TCP/IP协议分析 12.2. 入门示例程序13. 存储器寻址 14. 设备驱动程序开发 15. 字符设备驱动程序 15.1. 设备号 15.2. 设备号的分配和释放 15.3. 重要的数据结构 15.4. 读和写16. PCI设备 17. 内核初始化优化宏 18. 访问内核参数的接口 19. 内核初始化选项 20. 内核模块编程 20.1. 入门 20.2. 为模块添加描述信息 20.3. 内核模块处理命令介绍21. 网络子系统 21.1. sk_buff结构 21.2. sk_buff结构操作函数 21.3. net_device结构 21.4. 网络设备初始化 21.5. 网络设备与内核的沟通方式 21.6. 网络设备操作层的初始化 21.7. 内核模块加载器 21.8. 虚拟设备 21.9. 8139too.c源码分析 21.10. 内核网络数据流22. 备忘录List of Tables1.1. 特殊字符的表示方法Chapter 1. C语言基础Table of Contents1.1. 数据类型 1.2. 关键字 1.3. 变量等级 1.4. 特殊字符的表示方法: 1.5. 格式化字符串 1.6. 指针与数组 1.7. 结构体 1.8. typedef-自定义类型名 1.9. 函数和宏 1.10. ANSI标准头文件Linux是使用C语言开发的,基于Linux平台的应用程序开发,C语言是首选的开发语言。本章记录C语言的基本概念和基础知识。1.1. 数据类型整数类型(int),各种整数数制表示法:· ddd,十进制表示法,d为0-9的整数,但不能以0开头。如:123,345。· 0ooo,八进制表示法,以0(数字0)开头,o为0-7的整数。如:010(八进制)=8(十进制),014(八进制)=12(十进制)。· 0xhhh,十六进制表示法,以0x或0X开头,h为0-9、A、B、C、D、E、F。如:0x10(十六进制)=16(十进制),0xA(十六进制)=10(十进制)。· 以L或l结尾的数表示长整数(long int),编译器会以32位空间存放此数字,但GCC默认是以32位存放整数,所以此表示法在Linux下没什么作用。1.2. 关键字关键字是C语言本身保留使用的,不能用于变量和函数名。auto double int structbreak else long switchcase enum register typedefchar extern return unionconst float short unsignedcontinue for signed voiddefault goto sizeof volatiledo if static while1.3. 变量等级· auto,内部变量,在函数内部声明。只能在函数内部使用,它的生命周期从调用函数开始,到函数执行完时消失。内部变量以堆栈存放,必须在函数执行时才会存在,这种方式称为声明。auto可省略。如:auto int i = 0;/* 可写成int i = 0; */内部变量的优缺点:o 内部变量只在函数内有效,能提高函数的安全。o 内部变量在函数结束时消失,不会长期占用内存空间,能提高内存的利用率。o 内部变量的缺点是生命周期短,函数运行结束后不能保留。· static auto,内部静态变量,在函数内部定义,auto也可省略。内部静态变量以固定地址存放,编译时就已分配置内在空间,这种方式称为定义。由于有固定地址,函静态变量不会随函数的结束而消失。static变量会一直保存在内存空间中,当函数再次执行时,上次保留的使用静态变量可以继续使用。如:static int i = 0;· extern,外部变量,是在函数外定义的变量,可被多个函数存取。在外部变量定义覆盖范围之内的函数内可以自由使用外部变量。不在外部变量定义覆盖范围之内的函数要使用外部变量就要先使用extern关健字来声明外部变量。int i; /* 外部变量定义,在main函数外 */int main(void)i = 1; /* main()函数位于外部变量i定义的下面,不用声明可直接使用 */printf("%dn", i);不在外部变量定义覆盖范围之内的函数要使用外部变量就要先使用extern关健字来声明外部变量。int main(void)extern int i; /* 外部变量i在main()函数之后定义,需用extern关键字声明后才能使用 */i = 1;printf("%dn",i);int i;.在另外的程序文件中我们也可以通过扩展声明使用其它程序文件中的外部变量。程序1 hello.c#include <stdio.h>int main(void) extern int i; /扩展声明外部变量 i = 333; printf("%dn", i); extern des(void); /扩展声明外部函数 des();int i; /外部变量定义程序2 hello1.c#include <stdio.h>extern int i; /扩展声明其它程序文件中的外部变量void des() i+; printf("%dn",i); 编译debian:/c# gcc hello.c hello1.cdebian:/c# ./a.out333334外部变量有效范围总结:o 由外部变量定义的位置开始,至文件结尾。o 不在有效范围内的函数,也可通过extern扩展声明使用定义的外部变量,且可在多个函数中使用。注意:在各函数中使用的外部变量是一样的,对该变量的修改会影响到其它函数内的同一变量。o 可用extern扩展声明使用另外一个程序文件中的外部变量。外部变量的优点是生命周期长,可在函数间共享数据和传输数据。缺点是变量安全性较低,但可通过合理设置外部变量的有效范围提高安全性。· static extern,外部静态变量,在函数外部定义,只供单一程序文件使用,即使其它程序文件定义了同样名称的变量,编译器也把它当成另外一个变量处理。外部静态变量能有效隔离变量在一个程序文件中。static int i;· register,register变量是以寄存器(register)来存放变量,而不是一般内存。只有内部变量才能使用register类型变量。使用这种变量能加快变量的处理速度。但缺点是要占用CPU寄存器。如:register int i;register int j;变量等级的概念也同样适用于函数。若想调用不在有效范围内的函数,则要用extern扩展声明函数的有效范围。内部变量是以堆栈方式存放的,必须在函数执行时才会存在,所以称为声明(Declaration)。其它如static auto、extern和static extern等级的变量,都是以固定的地址来存放的,而不是以堆栈方式存放的,在程序编译时就已分配了空间,所以称之为定义(Definition)。1.4. 特殊字符的表示方法:Table 1.1. 特殊字符的表示方法符号ASCII字符(十六进制)句柄符号作用a07BEL响铃b08BS回格f0CFF换页n0ALF换行r0DCR回车键t09HTtab键v0BVT空行000NUL空字符5C反斜杠'2C'单引号"22"双引号?3F?问号1.5. 格式化字符串· %c,表示字符变量。· %s,表示字符串变量。· %f,表示浮点数变量。· %d,表示整数变量。· %x,表示十六进制变量。· %o,表示八进制变量。1.6. 指针与数组· C语言中专门用来存放内存地址的变量叫指针(pointer)变量,简称指针。· &运算符用来取得变量地址,· "*"运算符用来取得指针变量的值。· 数组名就是地址变量,指向内存中存放第一个数组元素的地址。数组元素编号从0开始,如a0表示数组a的第一个元素。数组是内存中的连续区间,可根据声明类型存放多种数值类型。如:int a10; 声明一个有10个int元素的数组char b20; 声明一个有20个char元素的数组指针示例:int *p; /* p是一个指针,p的内容是内存的地址,在这个地址中将存放一个整数。数组名和指针都是用来存放内存地址的,不过数组名具有固定长度,不可变。而指针与一般变量一样,其值是可变的。1.7. 结构体结构体是用户定义的由基本数据类型组成的复合式数据类型。数组也是复合式数据类型,但二者是不同的,数组是相同类型数据的集合,而结构体是不同类型数据的集合。如我们可以把一个人的姓名、性别,年龄组成一个单一结构体。这样在程序处理时就把它当成一个独立对象进行处理。结构体声明方法有两种,一种是分离式声明,一种是结合式声明。分离式声明是先把声明结构体,在程序中再声明结构体变量。结合式声明是把结构体声明和变量声明同时完成。分离式声明示例struct person char name; char sex; int age;main(void)struct person worker;.结合式声明示例struct person char name; char sex; int age;worker;每个结构体可以表示一个工人的信息,如果要表示多个工人的信息,则可以用结构体数组。struct person char name; char sex; int age;main(void)struct person worker20; /表示20个工人.结构体初始设置。struct person char name; char sex; int age;worker="jims","male",30;用"."和"->"运算符存取结构体中的数据。"."是直接存取法,"->"为间接存取法,用于结构体指针。如果p是一个指向person结构体的指针,则p->name和(*p).name的结果是一样的。1.8. typedef-自定义类型名结构体可以自定义数据类型,而typedef可以自定义新的类型名。如:#include <stdio.h>typedef char *STRING; /定义一个新的字符指针类型名STRINGmain(void) STRING a; a = "abc" printf("the a value is %s.n",a);a为字符指针类型,自定义类型名通常以大写方式表示,以示区别。#define与typedef的区别是:#define只是单纯地进行变量替换,而typedef是创建新的类型名。typedef的一个主要作用是简化声明,提高程序的可读性。如:typedef struct person char name; char sex; int age; p这样我们就定义一个新的结构体类型名p,在程序中我们可以使用它来声明变量。如main(void) p worker; worker = "jims","male",30;1.9. 函数和宏函数是C代码的集合,每个C程序由一个或多个函数组成,main()是一个特殊的函数,是C程序的入口,每个C程序必须有且只能有一个mian()函数。ANSI函数定义:类型 函数名(类型 参数1,类型 参数2, .) 函数代码;示例:int func(int i, char c) .在程序中要使用我们设计开发的函数,需要先进行声明,函数声明的作用是把函数类型告诉编译器。函数声明与定义差不多,只是不包括程序主体。上面示例的函数在主程序中的声明方式如下:void main() int total; int func(int i, char c); /函数声明 total = int(xxx,xxx); /声明后才能调用该函数 定义和声明中的参数类型(int,char)要相同,但名称(i,c)可以不同。当函数没有返回值时,需声定义成void类型,调用者也要做void声明。一般我们把函数的声明放在一个统一的文件中,这个文件叫头文件。在程序中用#include命令把头文件包含进来。在程序中调用函数前就不用再进行函数声明了。头文件简化了函数声明的管理并使头文件可被多个程序重复使用。大大提高C程序的开发效率。例如:我们最常使用的printf()函数,在使用前我们不需每次都进行声明操作,直接使用就可以啦。但前提是我们要把stdio.h头文件包含进来。printf()函数声明在stdio.h文件中已进行了声明。1.10. ANSI标准头文件Linux系统头文件位于/usr/include中。默认情况下编译器只在该目录下搜索头文件。· assert.h,定义assert宏,可用来检查程序错误。· ctype.h,· errno.h· float.h· limits.h· locale.h· math.h· setjmp.h· signal.h· stdarg.h· stddef.h· stdio.h· stdlib.h· string.h· time.hChapter 2. 预处理C语言在程序进行编译之前,会先将程序中以"#"标记的部份进行处理。这种处理叫做预处理。预处理主要的完成以下三个内容:宏处理、头文件和条件式编译。· 宏处理指令语法如下:#define 宏名 字符串 示例:#define MAX 200 宏指令语句尾不用加分号(;)宏定义可以用#undef命令取消,我们可以用该功能进行程序调试。· 头文件处理是把头文件中的函数声明插入程序中。· 条件式编译,编译器可根据条件式编译语句有选择地进代码块进行编译。选择式编译指令如下:#if 表达式 如果表示式结果不为0,则编译下面的程序#ifdef 宏名 若宏名已被定义,则编译下面的程序#ifndef 宏名 若宏名未定义,则编译下面的程序#else 前面条件不成立时,则编译下面的程序#endif 结束上列各种条件式编译Chapter 3. 使用GCC编译程序直接生成a.out可执行文件debian:/c# gcc hello.c编译hello.c程序,生成hello可执行文件:debian:/c# gcc -o hello hello.c生成.s的汇编代码文件。debian:/c# gcc -S hello.cChapter 4. 使用gdb调试程序如果想利用gdb工具来调试程序,在编译程序时要使用-g选项。如:debian:/c# gcc -g serial.c -o serial调试serial程序。debian:/c# gdb serialGNU gdb 6.5-debianCopyright (C) 2006 Free Software Foundation, Inc.GDB is free software, covered by the GNU General Public License, and you arewelcome to change it and/or distribute copies of it under certain conditions.Type "show copying" to see the conditions.There is absolutely no warranty for GDB. Type "show warranty" for details.This GDB was configured as "i486-linux-gnu".Using host libthread_db library "/lib/tls/libthread_db.so.1".(gdb) list8 #include <errno.h> /*错误号定义*/910 int main(void)11 12 int fd,n,status,buffsize;13 struct termios a;14 struct termios *oldtio;15 char m255,*comm;1617 fd = open("/dev/ttyS0",O_RDWR|O_NOCTTY|O_NDELAY);(gdb)gdb的list命令是列出程序源码。下面介绍gdb下的各种操作。· list,列出程序源代码,一次只列出10行的内容。list命令可以指定范围。如:list 5,10可列出第5行到第10行的内容。· run,执行程序。按Ctrl+c可中断程序的执行。· shell,暂时退出gdb回到shell环境。在shell环境用exit命令可以返回gdb。· break,设置断点,后跟行号则把断点设置在指定的行号,后跟函数名则把断点设置在函数。如break 6,break function。还可根据条件设置断点,如:break 9 if result > 50。这条命令的意思是,当运行到第9行时,如果result变量的值大于50,则中断程序。(gdb) break 6Breakpoint 1 at 0x8048634: file serial.c, line 6.· watch,指定条件,如果成立则中断。如:watch result >50。当result的变量大于50时,马上中断程序。· print,打印变量值,如:print result。· whatis,查看变量类型,如:whatis result。· continue,从中断点继续运行程序。· step,从中断点开始单步运行,如果遇到函数,则进入函数单步运行。· next,从中断点开始单步运行,如果遇到函数,则运行函数,该命令不会进入函数单步运行,而是运行整个函数。· info breakpoints,查看程序中所设置的所有中断点信息。(gdb) info breakpointsNum Type Disp Enb Address What1 breakpoint keep y 0x08048634 in main at serial.c:6Enb字段是"y",表示断点1现正生效。· disable/enable,控制中断点失效和启用。如:disable 1。如果disable/enable命令后没有指定断点号,则该命令作用于所有已设置的断点。(gdb) disable 1(gdb) info breakpointsNum Type Disp Enb Address What1 breakpoint keep n 0x08048634 in main at serial.c:6Enb字段由"y"变成"n",断点1暂时被禁止。· enable once,使断点生效一次。· delete,删除断点。如:delete 1。delete要指定断点号。· clear,删除断点。如:clear 6。clear要指定设置断点的行号或函数名。· help all,显示所有gdb环境的命令。在gdb环境下,按tab键可自动补全命令。直接按回车键可重复执行上一个操作。按上下光标键可显示历史命令。Chapter 5. Linux程序开发基础Table of Contents5.1. 路径 5.2. 库文件 5.3. 预处理 5.4. 系统调用(system call)5.1. 路径在设置Linux的系统路径时,使用冒号分隔每个路径名。如:PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/bin/X11"在Linux中的程序有两种,一种是可执行程序,与Windows下的.exe文件类似,一种是脚本,与Windows下的.bat文件类似。Linux中常用的程序存放路径有以下几个:· /bin,该路径存放系统启动时需要使用的程序。· /usr/bin,该路径存放用户需使用的标准程序。· /usr/local/bin,该路径存放本地安装的程序。· Linux使用斜杠"/"分隔路径名,而不是Windows的反斜杠""。· Linux下的C编译器使用GCC,由于历史的原因,在POSIX兼容的操作系统中,C编译器都叫cc,所以Linux下也有一个cc命令,它是一个到gcc的软链接。开发工具,多数位于/usr/bin或/usr/local/bin目录下。头文件,位于/usr/include目录。头文件包含有常量定义、系统调用和库函数调用的声明。这是系统默认的头文件存放路径,在编译程序时,编译器会自动查找该目录。gcc编译器在编译程序时也可用-I参数指定另外的头文件路径。如:gcc -I/usr/local/myinclude test.c。5.2. 库文件库文件,库是一组已编译的函数集合,可方便我们重用代码。默认存放在/lib和/usr/lib目录。库文件可分为静态和共享两类。· .a,静态库文件。使用静态库将会把所有的库代码引入程序,占用更多的磁盘空间和内存空间,所以一般建议使用共享库。· .so,共享库文件。使用共享库的程序不包含库代码,只在程序运行才调用共享库中的代码。在编译时可用包含路径的库文件名或用-l参数指定使用的库文件,/usr/lib/libm.a等价于-lm。如:gcc -o hello hello.c /usr/lib/libm.a 或用-l参数写成 gcc -o hello hello.c -lm如果我们要使用的库文件不在默认位置,在编译程序时可用-L参数指定库文件的路径。下面例子使用了/usr/hello/lib目录下的libhello库文件:gcc -o hello -L/usr/hello/lib hello.c -lhello创建和使用静态库。· 分别创建两个函数,函数a的内容如下:#include <stdio.h>void a(char *arg) printf("function a,hello world %sn",arg);函数b的内容如下:#include <stdio.h>void b(int arg) printf("function b,hello world %dn",arg);· 接着,生成两个对象文件。debian:/c# gcc -c a.c b.cdebian:/c# ls *.oa.o b.o· 最后,用ar归档命令把生成的对象文件打包成一个静态库libhello.a。debian:/c# ar crv libhello.a a.o b.o r - a.or - b.o· 为我们的静态库定义一个头文件lib.h,包含这两个函数的定义。/* * this is a header file. */void a(char *arg);void b(int arg); * 创建jims.c程序,内容如下。#!cplusplus#include "lib.h"int main() a("jims.yang"); b(3); exit(0);· 利用静态链接库编译程序。debian:/c# gcc -c jims.cdebian:/c# gcc -o jims jims.o libhello.adebian:/c# ./jimsfunction a,hello world jims.yangfunction b,hello world 3debian:/c# gcc -o jims jims.o libhello.a也可以写成gcc -o jims jims.o -L. -lhello。共享库比静态库具有以下的优点:· 当多个进程使用同一共享库时,Linux会把共享库中存放可执行代码的内存进行共享。所以共享库可节省内存,提高系统性能。· 程序可共享代码,减少磁盘空间占用。· 共享库出错,只要重新编译共享库即可,不用重新编译应用程序。ldconfig程序用来安装一个共享库,。只有在为系统库安装一个库的时候,才需要在/etc/ld.so.conf中创建记录,并运行ldconfig更新共享库的缓存。LD_LIBRARY_PATH环境变量用来指定附加的库文件路径。系统默认的库文件路径位于/usr/lib和/lib目录下。LD_PRELOAD环境变量指定提前载入的库,用于替代系统库。5.3. 预处理预处理,在程序开头以“#”开头的命令就是预处理命令,它在语法扫描和分析法时被预处理程序处理。预处理有以下几类:· 宏定义,用#define指令定义。如:#define BUFFER 1024。取消宏定义用#undef指令。宏还可带参数,如:#define BUF(x) x*3· 包含头文件,用#include指令,可把包含的文件代码插入当前位置。如:<#include <stdio.h>。包含的文件可以用尖括号,也可用双引号,如:#include "stdio.h"。不同之处是,使用尖括号表示在系统的包含目录(/usr/include)下查找该文件,而双引号表示在当前目录下查找包含文件。每行只能包含一个包含文件,要包含多个文件要用多个#include指令。· 条件编译,格式如下:格式一,如果定义了标识符,则编译程序段1,否则编译程序段2:#ifdef 标识符程序段1#else程序段2#endif格式二,如果定义了标识符,则编译程序段2,否则编译程序段1,与格式一相反:#ifndef 标识符程序段1#else程序段2#endif 格式三,常量表达式为真则编译程序段1,否则编译程序段2:#if 常量表达式程序段1#else程序段2#endif 使用gcc编译程序时,要经过四个步骤。· 预处理(Pre-Processing),用-E参数可以生成预处理后的文件。debian:/c# gcc -E hello.c -o hello.i· 编译(Compiling)· 汇编(Assembling)· 链接(Linking)GCC默认将.i文件看成是预处理后的C语言源代码,所以我们可以这样把.i文件编译成目标文件。debian:# gcc -c hello.i -o hello.o在GCC中使用-pedantic选项能够帮助程序员发现一些不符合ANSI/ISO C标准的代码,但不是全部。从程序员的角度看,函数库实际上就是一些头文件(.h)和库文件(.so或者.a)的集合。5.4. 系统调用(system call)要理解系统调用就要先理解程序代码运行的两种模式,一种是用户模式,一种是内核模式。我们编写的应用程序运行在用户模式下,而设备驱动程序和文件系统运行在内核模式。在用户模式下运行的程序受到严格的管理,不会破坏系统级应用。而在内核模式下运行的程序可以对电脑有完全的访问权。系统调用就是运行在内核模式下的代码为运行在用户模式下的代码提供服务。系统调用的错误返回码是负数,定义在>errno.h<文件中。在系统调用中发生错误,C函数库就会用错误码填充全局变量errno。用perror()和strerror()函数可以输出错误信息。系统调用多数在>unistd.h<中定义。Chapter 6. 文件处理在Linux系统内所有东西都是以文件的形式来表示的,除一般的磁盘文件外,还有设备文件,如硬盘、声卡、串口、打印机等。设备文件又可分为字符设备文件(character devices)和块设备文件(block devices)。使用man hier命令可以查看Linux文件系统的分层结构。文件的处理方法一般有五种,分别是:· open,打开一个文件或设备。· close,关闭一个打开的文件或设备。· read,从一个打开的文件或者设备中读取信息。· write,写入一个文件或设备。· ioctl,把控制信息传递给设备驱动程序。open,close,read,write 和ioctl都是低级的,没有缓冲的文件操作函数,在实际程序开发中较少使用,一般我们使用标准I/O函数库来处理文件操作。如:fopen,fclose,fread,fwrite,fflush等。在使用标准I/O库时,需用到stdio.h头文件。· fopen()这个标准I/O库函数用于打开文件,在Linux中文件要先打开后才能进行读写操作。#include <stdio.h>FILE *fopen(const char *filename, const char *mode);*mode选项:"r" 或o"rb" 为读打开文件"w" 或 "wb" b为写打开文件,如果文件不存在则创建,如果存在则覆盖"a" 或 "ab" b为追加内容而打开文件"r+" 或o"rb+" 或 "r+b"r 为更新打开文件,不会覆盖旧文件"w+" 或 "wb+"b或 "w+b"w 为更新打开文件,会覆盖旧文件"a+"a或 "ab+" 或 "a+b" 为更新打开文件,更新内容追加到文件末尾一些常用的文件和目录维护函数:chmod、chown、unlink、link、symlink、mkdir、rmdir、chdir、getcwd、opendir,closedir、readdir、telldir、seekdir等。fcntl用于维护文件描述符,mmap用于分享内存。创建文档并输入信息的示例代码:#include <stdio.h>main(void) FILE *fp1; char c; fp1 = fopen("text.txt","w"); while (c = getchar()!= 'n') putc(c,fp1); fclose(fp1); 显示路径的示例代码#include <unistd.h>#include <stdio.h>#include <dirent.h>#include <string.h>#include <sys/stat.h>#include <st