unix 编程
艺术
OCR 识别 + 精确校对版
Eric S. Raymond1 德山书生2
版本: 0.02
1 作者:埃里克·斯蒂芬·雷蒙(Eric Steven Raymond,著名黑客。)
2 官方英文网站,姜宏 2005 年翻译,有些小地方修改,以官方英文网站为准。编者邮
箱:a358003542@gmail.com。
前言
与其说 Unix 是个操作系统,不如说是一部口
述历史。
—NeaJ Stephenson
知识和专能差异巨大,凭借知识可以推断出该做什么,而专能让你甚至在无意之
间,条件反射似的把事情做好。
这本书确实有关“知识”,但更着眼于“专能”。你将学到那些 Unix 专家们都
不自知的 Unix 开发知识。少一点技术,多一些共享文化:显见和隐微的,直观和潜
流的——这是本书和大多数 Unix 书籍不同的地方——不止于方法,更重乎理念。
理念于实用大有裨益,有太多设计不良的软件:体积臃肿,难于维护、移植和扩
展——这些都是蹩脚设计的症候。我们希望本书的读者能品出什么是 Unix 所教示的
良好设计。
本书分为四部分:场景、设计、工具和社群。第一部分(场景)涉及哲学和历
史,为后续内容埋下伏笔。第二部分(设计)将 Unix 哲学的原理细分为有关设计与
实现的、更专门的建议。第三部分(工具)着眼于 Unix 所提供的工具,可助你解决
问题。第四部分(社群)则讲述人与人之间的事务与约定,而这正是 Unix 文化拥有
高效能的原因。
这本书是关于共享文化的,我从未想像过独自完成它。你会发现正剧中包含数位
Unix 资深专家的客串演出,正是这些人塑造了 Unix 的习俗。本书曾有过公开大范围
的审阅过程,这期间我邀请这些明星人士对书稿进行评审与研论。这些意见没有湮没
在本书定稿中,而你可以在书中聆听到他们的真实声音:无论是为本书呐喊助阵、还
i
第一节 谁应该看这本书
是摇头反对。
本书中用到人称“我们”时,我并不是虚张声势,仅以此说明这是整个社群都清
楚明了的事实。
因为本书着力传递文化,因此加入了很多野史和坊间传说,这在技术书中并不多
见。希望你喜欢,这些东西其实是 Unix 程序员的教养。须弥不重,芥子不轻。我们
希望以这种方式更好地讲述故事。了解 Unix 的由来和变迁,会培养你对 Unix 风格
的直觉。
同样地,基于此,我们不打算使用回述历史的腔调。你会发现本书参考了众多时
下信息。我们不希望给你一种错觉:书里说的都是亘古不变的终极真理。参考时下的
信息这一做法,也提醒读者,三十年河东,三十年河西,眼前所见,也许过不了多久
就会过时,而需要重新检省。
另外,本书不是 C 教程,不是 Unix 命令和 API 的手册,不是
sed/yacc/Perl/Python 的语言参考,也不是网络编程入门,更不是巨细靡遗的令人
费解的 X 指南。本书也不打算带你巡游 Unix 内幕和体系。有很多其它的好书涵盖这
些领域,本书会在适当的时候告诉你该看哪些。
在这些技术细节外,Unix 文化有一个未见诸笔端的行工传统,以熟练工的考量,
它已经有几百万人年的发展3。本书即立足于这样一个信念:领会此传统,并将它的设
计手法应用到手边,你将成为更好的程序员和设计师。
构成文化的是人,一直以来,获知文化的方式大约是口口相传、潜移默化。本书
不打算取代人际的文化传播,但可以促进这一过程,使你能俯耳倾听他人的心声。
0.1 谁应该看这本书
如果你是个 Unix 编程老手,经常教导菜鸟,或者与人进行操作系统论战时无法
阐明使用 Unix 方案所带来的好处时,可以看看这本书。
3 从 1969 到 2003 年,35 年时间可不算短。以这期间 Unix 站点数量的年度曲线计算,
人们在 Unix 上耕作了约有 5000 万人年。
ii
第二节 如何使用这本书
如果你是个 C、C++ 或者 Java 程序员,有其它操作系统的开发经验,现在轮到
你开展一个 Unix 项目时,可以看看这本书。
如果你是个初级或者中级水平的 Unix 用户,但是没什么开发经验,想学习在
Unix 下如何高效地设计软件时,可以看看这本书。
如果你不在 Unix 下编程却发觉 Unix 的传统给你带来某种启迪,那你就对了,
Unix 哲学适用于其它的操作系统。因此我们会花比其它 Unix 书籍更多的篇幅关注非
Unix 环境(特别是微软的操作系统);当所用到工具或者案例可用于其它操作系统
时,我们会告诉你。
如果你是一个系统架构师,正为通用市场或垂直应用准备平台方案或实现策略时
可以看看这本书。本书将帮助你了解 Unix 作为开发平台的强大功能,以及开放源码
这个 Unix 的传统所带来的开发方式。
如果你想学到 C 编程的细节或者想知道怎么用 Unix 内核 API,本书可能不适合
你。Advanced Programming in the Unix Envirortment
[Stevens92] 是探究 Unix API 的经典名著;The Practice of Programming
[Kernighan-Pike99] 是每个 C 程序员的必读书目(任何语言的程序员都该看看这本
书)。
0.2 如何使用这本书
这本书既重实践,更富理念:既包含警世格言,又不忘检点 Unix 开发中的特殊
案例。在每个警句前后,都有生动实例阐明其由来,这些例子绝不来自小儿科式的示
例程序,而均出自真实世界满眼所见的运行代码。
我们着力避免以大量代码或者规范文件来胡乱凑数,当然这么做会让本书的写作
轻松许多(某些地方或许读起来也更轻松)。绝大多数编程书籍只授你以鱼,而本书
避免这种做法,力求培养读者“探求事情何以如此”的感知力。
正由于此,本书会时常请你阅读代码与规范文档,它们中极少量的内容会附在书
中,其余部分我们会在举例时告诉你如何从网上获取。
从这些范例中汲取养分,将有助你将所学原则消化变为疱丁之技。如果你能就着
一部跑在 Unix 系统上的网页浏览器来读书,是再理想不过的了。任何 Unix 系统都
iii
第三节 相关引文
适合,但是我们将要研究的案例大多都会预装在、或者可以从 Linux 系统上获得,书
中会提示请你浏览或亲身感受它们。这些提示通常是按部就班的,跑开玩一会儿并不
会打散整个讲述过程的连续性。
注意:我们虽力求,但无法给你打保票,声称我们所引用的 URLs 稳定可用。如
果你发现某个引用连接已陈旧过时,来点常识,用你喜爱的搜索引擎来个短语搜索。
如有可能,我们会在所引用的 URLs 附近给出如何搜索的提示。
大多数缩写形式会在首次出现时伴随其全称。为方便起见,我们在附录中提供了
名词对照表。
交叉索引通常以作者名字为主导词。带编号的脚注是那些可能会扰乱你阅读正
文,或者是易变的 URLs; 也可能是旁征博引的战争故事或者笑话4。
为了使这本书不至于让非技术人员太过难读,我们邀请了一些非程序员试读,并
指出一些晦涩但起贯穿作用的词汇。我们把那些编程老手不太会需要的名词解释也放
在脚注中。
0.3 相关引文
一些 Unix 早期拓荒者的著名论文和书籍,比如 Kernighan 和 Pike 的《The
Unix Programming Environment》[Kernighan-Pike84] 就是其中佼佼者,被世
人尊为圭臬。而今看来此书廉颇老矣,它没提到 Internet、万维网以及诸如 Perl、
Tcl 和 Python 这些解释型语言的新秀。
写 作 本 书 的 中 途 我 们 借 鉴 了 Mike Gancarz 的 《The Unix Philosophy》
[Gancarz]。这本书在它的覆盖范围内极其优秀,但是我们觉得需要更多内容才能反
映出事情的全貌。尽管如此我们仍对此书作者心存感激,他愈发使我们知道最简单的
Unix 设计手法就是最持久耐用的。
《The Pragmatic Programmer》[Hunt-Thomas] 是 一 本 关 于 良 好 设 计 的
书,文风机智诙谐,它与本书相比,倾向于软件设计工艺的另一个层面(更注重编
4 这个特别的脚注献给 Terry Pratchett,他对脚注的用法简直是……绝了。
iv
第四节 本书的习俗约定
码,而少着墨于高层面的问题划分)。作者的哲学是其 Unix 领域耕耘的成果,也是
本书内容极好的补充。
《The Practice of Programming》[Kernighan-Pike99] 包含了一些与《The
Pragmatic Programmer》共通的内容,但更钻入 Unix 传统的深处。
最后(明知道会激怒你),我们推荐《Zen Flesh,Zen Bones》
[Reps-Senzaki],一部重要的佛教禅宗本源的合集。对禅的引用书目遍布全书。我们
将这些书目包含进来,是因为禅为表达某种想法提供了丰富的语汇,而在软件设计中
却很难烂熟于心。信奉宗教的读者,请您不要把禅当成宗教,它是一种心灵鸡汤似的
东西,纯净而没有神灵的干扰——此即是禅。
0.4 本书的习俗约定
术语“UNIX”技术上和法律上讲,是 The Open Group 的商标,并且应该仅
限于那些通过 The Open Group 严格的“符合标准”认证的操作系统。本书中我们
使用其较宽松的定义,即大多数程序员所指的,Bell 实验室 Unix 代码的后裔或旁
支。在这个意义下,Linux(大多数例子都举自它)也算是一种 Unix。
本书也使用了 Unix 手册页 (manual page) 的传统,即以括号括起来的手册节
号来标记 Unix 设施。通常用于强调一个 Unix 命令首次出现。比如“munger(1)”
可解读为“munger 程序加入存在于你的系统中,其文档位于 Unix 手册页的第 1
节”。第 2 节是 C 的系统调用,第 3 节是 c 的库函数调用,第 5 节是文件格式与协
议,第 8 节是系统管理工具。其它节号本书未曾用到,其定义在各个 Unix 系统各有
不同。在你的 Unix 外壳提示符下输入man 1 man(老式的 System VUnix 系统可
能要输入man -s 1 man)以获得更多信息。
有时我们会提及某个 Unix 程序(比如 Emacs),后面没有手册节号而且首字母
大写。这意味这个名字代表一族 Unix 程序,其基本功能相同,而我们将讨论其通用
特性。比如 Emacs,就包含了 xemacs。
本书很多地方我们同时给出了老式 (old school) 和新式 (new school) 解法。
new-school 和 rap 音乐一样,开始于 1990 年前后。在这个含义下,我们往往把它
与脚本语言、图形用户界面、开放源码的 Unix 和万维网联系起来。Old-school 指代
1990 年以前(特别是 1985 年以前)的世界:昂贵的共用计算机、专属的 Unix,
v
第五节 所用案例
shell 脚本和无所不在的 C。值得指出这些差异,机器越来越便宜,内存多了起来,
这些有如暗流,渐渐影响着 Unix 编程的风格。
0.5 所用案例
很多编程书籍为证明某一观点而特地造出一个范例,你手中这本书不这么干。我
们的案例研究均来自真实世界,在生产环境中工作已久。下面是一些主要案例:
cdrtools/xcdroast 这两个独立的项目通常被一并使用。cdrtools 是一组刻盘工具
(用关键字”cdrtools” 可以在网上找到)。xcdroast 是 cdrtools 的图型界面
前端,其项目网站在这里。
fetchmail fetchmail 用于从远程邮件服务器上收信,支持 POP3 和 IMAP 邮箱协
议。这是它的主页,也可以用关键字”fetchmail” 从网上找到。
GIMP GIMP(GNU Image Manipulation Program,GNU 图像处理程序)是
一个全特性的绘画和图像处理程序,可对多种图像格式进行复杂处理。其源码可
从GIMP 主页获得(也可以通过关键字”GIMP” 从网上搜到)。
mutt mutt 邮件客户端是目前各类基于文本的邮件客户端程序中的翘楚,提供对
MIME(Multipurpose Internet Mail Extensions)、个人隐私辅助程序,如
PGP(Pretty Good Privacy) 和 GPG (GNU Privacy Guard) 等特性的绝佳支
持。其源码和二进制可执行文件可以从Mutt 项目主页获得。
xmlto xmlto 可 将 DocBook 和 其 它 XML 文 档 以 多 种 格 式 渲 染 输 出, 包 括
HTML、纯文本和 PostScript。其源码和文档可在xmlto 主页获得。
为了将读者理解本书例子所要阅读的代码量降低到最小程度,我们尽量挑选那些
可重复使用、并能体现多种不同设计原理和设计实践的案例。出于同样原因,很多示
例来自于我本人的项目。我没想说这些例子最为恰当,只是我觉得它们对阐述我的观
点非常有用。
vi
第六节 作者致谢
0.6 作者致谢
各位客串贡献者 (Ken Arnold, Steven M. Bellovin, Stuart Feldman, Jim
Gettys, Steve Johnson, Brian Kernighan, David Korn, Mike Lesk, Doug
McIlroy, Marshall Kirk McKusick, Keith Packard, Henry Spencer, and Ken
Thompson) 为本书增添极大价值。特别是 Doug McIlroy,给予本书恪尽职责、鞭
辟入里的评注的同时,也展现了他在 30 年前管理最原始的 Unix 研究组时鞠躬尽瘁
的高风亮节。
我要对 Rob Landley 和我的妻子 Catherine Raymond 致以特别感谢,他们都
不厌其烦地逐行对本书手稿进行审阅。Rob 的深富洞察力的细致评述激励我在最终
稿中加入了一整章内容,他为本书的组织结构和取材范围贡献极多。如果他把所给予
的改进意见落在笔端,那他无愧于本书的合著者。Cathy 代表读者中非技术人员的一
群,如果那些非程序员读者觉得本书并不难读,那全是她的功劳。
写作的五年间,本书从不少人的讨论意见中获益良多。Mark M. Miller 使我对
线程有了更深的认识。John Cowan 教给我不少接口设计方式,并起草了 wily 和
VM/CMS 的学习案例。Jef Raskin 告诉我 the Rule of Least Surprise 的由来。
The UIUC System Architecture Group 对前几章给出的反馈弥足珍贵,What
Unix Gets Wrong 和 Flexibility in Depth 两节是他们直接激励的结果。Russell
J. Nelson 提供了 Bernstein chaining 的素材。第三章中 MVS 学习案例大部分材
料来自 Jay Maynard。Les Hatton 对语言一章给出很多有益的建议,并促使我写成
第 4 章中 Optimal Module Size 的部分内容。David A. Wheeler 贡献了很多发人
深省的批判,以及一些学习案例(特别是设计部分中的)素材。Russ Cox 帮助我对
Plan 9 的调查。Dennis Ritchie 纠正了我的一些错误的 C 历史观念。
成百上千的 Unix 程序员,人数太多以至于无法在此列出他们的名字,在 2003
年 1 月到 6 月间的公开审阅过程间给了我建议和评论。开放的同级复审这一过程让我
觉得紧张刺激而回报极多。当然,任何最终书稿中残留的错误都是我自己的责任。
“把事情说透”的风格,以及其它一些考虑因素,是受到了“设计模式运动”的
影响;说实话,我对到处堆砌 Unix 设计模式这种做法深不以为然。我对此运动的
中心教条不敢苟同,并且没觉得把设计模式严格付诸实用有什么必要,也不想背上
这种思想的包袱。尽管如此,我的行事方法仍然受到 Christopher Alexander 工作
vii