深入分析Linux内核源代码
陈莉君 编著
人 民 邮 电 出 版 社
图书在版编目(CIP)数据
深入分析 Linux 内核源代码/陈莉君编著. —北京:人民邮电出版社,2002.8
ISBN 7-115-10525-1
I. 深… II. 陈… III. Linux 操作系统 IV. TP316.89
中国版本图书馆 CIP 数据核字(2002)第 056978 号
内 容 提 要
自由软件 Linux 操作系统源代码的开放,为我们掌握操作系统核心技术提供了良好的条
件。本书共分 13 章,对 Linux 内核 2.4 版的源代码进行了较全面的分析,既包括对中断机
制、进程调度、内存管理、进程间通信、虚拟文件系统、设备驱动程序及网络子系统的分析,
也包括对 Linux 整体结构的把握、Linux 的启动过程的分析及 Linux 独具特色的模块机制的
分析与应用等。其中重点剖析了 Linux 内核中最基础的部分:进程管理、内存管理及文件管
理。
本书对于那些准备进入 Linux 操作系统内部,阅读 Linux 内核源代码以及在内核级进
行程序开发的读者具有非常高的参考价值。同时,操作系统实现者、系统程序员、Linux 应
用开发人员、嵌入式系统开发人员、系统管理员、在校的大学生和研究生及对 Linux 感兴趣
的用户均可在阅读本书中受益。
深入分析 Linux 内核源代码
♦ 编 著 陈莉君
责任编辑 魏雪萍
♦ 人民邮电出版社出版发行 北京市崇文区夕照寺街 14 号
邮编 100061 电子函件 315@ ptpress.com.cn
网址 http://www.ptpress.com.cn
读者热线:010-67180876
北京汉魂图文设计有限公司制作
北京印刷厂印刷
新华书店总店北京发行所经销
♦ 开本:787×1092 1/16
印张:
字数: 千字
2002 年 8 月第 1 版
印数:1- 000 册
2002 年 8 月北京第 1 次印刷
ISBN 7-115-10525-1/TP·3021
定价:00.00 元
本书如有印装质量问题,请与本社联系 电话:(010)67129223
– 1 –
前 言
如果说 Linux 的出现是一个偶然,那么,席卷全球的 Linux 热潮则是一个奇迹,Linux
正以势不可挡的趋势迅猛发展,其发展前景是无法预测的。
有人说,“Linux 不就是类 UNIX 吗?”是的,它的外在表现形式确实与 UNIX 完全兼容,
这也是它赖以生存的基本条件。但是,它的内涵则完全不同,这首先体现在其源代码全部重
写及开放,其次是它的快速更新和发展,而更重要的是世界范围内众多计算机爱好者能通过
Internet 参与开发,由此可见,借助于 Internet 的肥沃土壤,Linux 的迅速发展是毫无置疑
的!
实际上,Linux 最本质的东西体现在其“自由”和“开放”的思想,“自由”意味着世
界范围内的知识共享,而“开放”则意味着 Linux 对所有的人都敞开大门,在这开放而自由
的天地里,你的创造激情可以得到充分的发挥。
Linux 内核源代码的开放给希望深入操作系统内部世界的人敞开无私的胸怀,我们有幸
走进了这个世界,这是一个神奇、错综复杂而又充满诱惑的世界,让喜欢迎接挑战的人们可
以充分检验自己的勇气和耐力。
Linux 内核全部源代码是一个庞大的世界,大约有 200 多万行,占 60MB 左右的空间。因
此,如何在这庞大而复杂的世界中抓住主要内容,如何找到进入 Linux 内部的突破口,又如
何能把 Linux 的源代码变为自己的需要,这就是本书要探讨的内容。
首先,本书的第一章领你走入 Linux 的大门,让你对 Linux 内核的结构有一个整体的了
解。然后,第二章介绍了分析 Linux 源代码应具备的基本硬件知识,这是继续向 Linux 内核
迈进的必备条件。中断作为操作系统中发生最频繁的一个活动,本书用一章的内容详细描述
了中断在操作系统中的具体实现机制。
众所周知,操作系统中最核心的内容就是进程管理、内存管理和文件管理。本书用大量
的篇幅描述了这三部分内容,尤其对最复杂的虚拟内存管理进行了详细的分析,其中对内存
初始化部分的详细描述将对嵌入式系统的开发者有所帮助。
在对 Linux 内核有一定了解后,读者可能希望能够利用内核函数进行内核级程序的开发,
例如开发一个设备驱动程序。Linux 的模块机制就是支持一般用户进行内核级编程。另外,
读者在进行内核级编程时还可以快速查阅本书附录部分提供的 Linux 内核 API 函数。
网络也是 Linux 中最复杂的部分之一,这部分内容足可以写一本书。本书仅以面向对象
的思想为核心,分别对网络部分中的四个主要对象:协议、套接字、套接字缓冲区及网络设
备接口进行了分析。有了对这四个对象的分析,再结合文件系统、设备驱动程序的内容,读
者就可以具体分析自己感兴趣的相关内容。
Linux 在不断地发展,本书介绍的版本为 Linux 2.4.16。尽管本书力图反映 Linux 内核
较本质的东西,但由于笔者的知识有限,对有些问题的理解难免有偏差,甚至可能有“Bug”,
希望读者能尽可能多地发现它,以共同对本书进行改进和完善。
– 1 –
在本书的编写的过程中,笔者查阅了大量的资料,也阅读了大量的源代码,但本书中反
映的内容也仅仅是 Linux 的主要内容。因为一本书的组织形成是一种线性结构,而知识本身
的组织结构是一种树型结构,甚至是多线索的网状结构,因此,在本书的编写过程中,笔者
深感书的表现能力非常有限,一本书根本无法囊括全部。在参考书目中,我们将给出主要的
参考书及主要网站的相关内容。
本书的第一版是《Linux 操作系统内核分析》,在第一版的编写过程中,康华、季进宝、
陈轶飞、张波、张蕾及胡清俊等参与了编写。第一版出版后得到了很多读者的充分肯定和赞
扬,并授权台湾地区出版。在本次改版的过程中,依然保留了第一版的风格,但加深了对进
程管理、内存管理及文件管理等众多内容的剖析。
这次改版由于时间仓促,加之作者的水平有限,书中有些术语的表达可能不妥,有些内
容的分析也可能不够准确,敬请读者朋友批评指正。我的联系方式是:cljun@xiyou.edu.cn。
编者
2002 年 7 月
– 2 –
目 录
第一章 走进 Linux ...................................................................... 1
1.1 GNU 与 Linux 的成长 ............................................................ 1
1.2 Linux 的开发模式和运作机制 .................................................. 2
1.3 走进 Linux 内核 ................................................................ 4
1.3.1 Linux 内核的特征 ....................................................... 4
1.3.2 Linux 内核版本的变化 .................................................. 5
1.4 分析 Linux 内核的意义 ......................................................... 7
1.4.1 开发适合自己的操作系统................................................ 8
1.4.2 开发高水平软件 ......................................................... 9
1.4.3 有助于计算机科学的教学和科研......................................... 9
1.5 Linux 内核结构 ................................................................ 9
1.5.1 Linux 内核在整个操作系统中的位置 ................................... 10
1.5.2 Linux 内核的作用 ...................................................... 11
1.5.3 Linux 内核的抽象结构 ................................................. 11
1.6 Linux 内核源代码 ............................................................. 12
1.6.1 多版本的内核源代码 ................................................... 13
1.6.2 Linux 内核源代码的结构 ............................................... 13
1.6.3 从何处开始阅读源代码 ................................................. 14
1.7 Linux 内核源代码分析工具 .................................................... 16
1.7.1 Linux 超文本交叉代码检索工具 ........................................ 16
1.7.2 Windows 平台下的源代码阅读工具(Source Insight) ................. 17
第二章 Linux 运行的硬件基础.......................................................... 19
2.1 i386 的寄存器................................................................. 19
2.1.1 通用寄存器............................................................. 19
2.1.2 段寄存器 ............................................................... 20
2.1.3 状态和控制寄存器...................................................... 20
2.1.4 系统地址寄存器 ........................................................ 23
2.1.5 调试寄存器和测试寄存器............................................... 24
2.2 内存地址 ...................................................................... 25
2.3 段机制和描述符 ............................................................... 26
2.3.1 段机制 ................................................................. 26
– 1 –
深入分析 Linux 内核源代码
2.3.2 描述符的概念 .......................................................... 27
2.3.3 系统段描述符 .......................................................... 29
2.3.4 描述符表 ............................................................... 30
2.3.5 选择符与描述符表寄存器............................................... 30
2.3.6 描述符投影寄存器...................................................... 32
2.3.7 Linux 中的段 ........................................................... 32
2.4 分页机制 ...................................................................... 34
2.4.1 分页机构 ............................................................... 36
2.4.2 页面高速缓存 .......................................................... 39
2.5 Linux 中的分页机制 ........................................................... 40
2.5.1 与页相关的数据结构及宏的定义........................................ 41
2.5.2 对页目录及页表的处理 ................................................. 42
2.6 Linux 中的汇编语言 ........................................................... 44
2.6.1 AT&T 与 Intel 汇编语言的比较 ......................................... 44
2.6.2 AT&T 汇编语言的相关知识 .............................................. 46
2.6.3 gcc 嵌入式汇编 ........................................................ 49
2.6.4 Intel386 汇编指令摘要 ................................................ 52
第三章 中断机制 ....................................................................... 55
3.1 中断基本知识 ................................................................. 55
3.1.1 中断向量 ............................................................... 55
3.1.2 外设可屏蔽中断 ........................................................ 56
3.1.3 异常及非屏蔽中断...................................................... 57
3.1.4 中断描述符表 .......................................................... 59
3.1.5 相关汇编指令 .......................................................... 60
3.2 中断描述符表的初始化 ........................................................ 61
3.2.1 外部中断向量的设置 ................................................... 61
3.2.2 中断描述符表 IDT 的预初始化 .......................................... 63
3.2.3 中断向量表的最终初始化............................................... 65
3.3 异常处理 ...................................................................... 68
3.3.1 在内核栈中保存寄存器的值 ............................................ 68
3.3.2 中断请求队列的初始化 ................................................. 70
3.3.3 中断请求队列的数据结构............................................... 70
3.4 中断处理 ...................................................................... 77
3.4.1 中断和异常处理的硬件处理。 .......................................... 77
3.4.2 Linux 对中断的处理 .................................................... 78
3.4.3 与堆栈有关的常量、数据结构及宏 ..................................... 79
3.4.4 中断处理程序的执行 ................................................... 81
3.4.5 从中断返回............................................................. 85
– 2 –
目 录
3.5 中断的后半部分处理机制...................................................... 86
3.5.1 为什么把中断分为两部分来处理........................................ 86
3.5.2 实现机制 ............................................................... 87
3.5.3 数据结构的定义 ........................................................ 89
3.5.4 软中断、bh 及 tasklet 的初始化 ....................................... 91
3.5.5 后半部分的执行 ........................................................ 92
3.5.6 把 bh 移植到 tasklet................................................... 96
第四章 进程描述 ....................................................................... 97
4.1 进程和程序(Process and Program) ......................................... 97
4.2 Linux 中的进程概述 ........................................................... 99
4.3 task_struct 结构描述........................................................ 100
4.4 task_struct 结构在内存中的存放 ............................................ 107
4.4.1 进程内核栈............................................................ 107
4.4.2 当前进程(current 宏) .............................................. 108
4.5 进程组织方式 ................................................................ 109
4.5.1 哈希表 ................................................................ 109
4.5.2 双向循环链表 ......................................................... 110
4.5.3 运行队列 .............................................................. 111
4.5.4 进程的运行队列链表 .................................................. 111
4.5.5 等待队列 .............................................................. 112
4.6 内核线程 ..................................................................... 115
4.7 进程的权能................................................................... 116
4.8 内核同步 ..................................................................... 117
4.8.1 信号量 ................................................................ 118
4.8.2 原子操作 .............................................................. 118
4.8.3 自旋锁、读写自旋锁和大读者自旋锁 .................................. 119
第五章 进程调度与切换 ............................................................... 123
5.1 Linux 时间系统 .............................................................. 123
5.1.1 时钟硬件 .............................................................. 123
5.1.2 时钟运作机制 ......................................................... 124
5.1.3 Linux 时间基准 ....................................................... 125
5.1.4 Linux 的时间系统 ..................................................... 126
5.2 时钟中断 ..................................................................... 126
5.2.1 时钟中断的产生 ....................................................... 126
5.2.2 Linux 实现时钟中断的全过程 ......................................... 127
5.3 Linux 的调度程序—Schedule( ) ........................................ 131
5.3.1 基本原理 .............................................................. 132
– 3 –
深入分析 Linux 内核源代码
5.3.2 Linux 进程调度时机 ................................................... 133
5.3.3 进程调度的依据 ....................................................... 135
5.3.4 进程可运行程度的衡量 ................................................ 136
5.3.5 进程调度的实现 ....................................................... 137
5.4 进程切换 ..................................................................... 139
5.4.1 硬件支持 .............................................................. 139
5.4.2 进程切换 .............................................................. 142
第六章 Linux 内存管理................................................................ 147
6.1 Linux 的内存管理概述 ....................................................... 147
6.1.1 Linux 虚拟内存的实现结构 ............................................ 148
6.1.2 内核空间和用户空间 .................................................. 149
6.1.3 虚拟内存实现机制间的关系 ........................................... 151
6.2 Linux 内存管理的初始化..................................................... 152
6.2.1 启用分页机制 ......................................................... 152
6.2.2 物理内存的探测 ....................................................... 157
6.2.3 物理内存的描述 ....................................................... 163
6.2.4 页面管理机制的初步建立.............................................. 166
6.2.5 页表的建立............................................................ 173
6.2.6 内存管理区............................................................ 177
6.3 内存的分配和回收............................................................ 185
6.3.1 伙伴算法 .............................................................. 186
6.3.2 物理页面的分配和释放 ................................................ 187
6.3.3 Slab 分配机制......................................................... 194
6.3.4 内核空间非连续内存区的管理 ......................................... 201
6.4 地址映射机制 ................................................................ 204
6.4.1 描述虚拟空间的数据结构.............................................. 205
6.4.2 进程的虚拟空间 ....................................................... 209
6.4.3 内存映射 .............................................................. 212
6.5 请页机制 ..................................................................... 218
6.5.1 页故障的产生 ......................................................... 218
6.5.2 页错误的定位 ......................................................... 219
6.5.3 进程地址空间中的缺页异常处理....................................... 220
6.5.4 请求调页 .............................................................. 221
6.5.5 写时复制 .............................................................. 223
6.5.6 对本节的几点说明..................................................... 225
6.6 交换机制 ..................................................................... 225
6.6.1 交换的基本原理 ....................................................... 225
6.6.2 页面交换守护进程 kswapd ............................................. 229
– 4 –