统计陷阱
达莱尔·哈夫著
廖颖林译刘汉良校
上海财经大学出版社
图字:09--2001--305 号
Chinese translation copy right@2002 by Shanghai University of Finance &
Economies Press
Original English language edition copyright
@1954,1982,1993,by Darrell Huff
2002 年中文版专有出版权属上海财经大学出版社
版权所有翻版必究
总序
市场经济发展的一般规律和中国经济改革的实践经验向我们昭示,建立和完善具有中国
特色的证券市场对中国经济的持续健康发展具有重大意义。
充足的自有资本、合理的资本结构是现代企业运行的基本条件。由于历史的原因,作为
中国企业主体的国有企业,必须补上“资本”这一课;同时,各种新兴的经济组织形式也渴
求尽快克服“资本”瓶颈,实现加速增长。据统计,截止到 2002 年 4 月,上海、深圳的证
券市场累计筹资超过 8 000亿元人民币,为中国企业的成功转型奠定了坚实的资本基础。伴
随着证券市场的兴起,中国上市公司运作逐步趋于规范和透明,已经初步建立起现代公司治
理结构的基本框架。
中国资本市场在实验、观望、争议中走过了十余年的发展历程。2002 年 4 月末,中国
证券市场上市公司总市值超过 4500 亿人民币,投资者开户数超过 6700 万户,成为亚洲第三
大证券市场。就其在国民经济以及人民生活中的影响和地位而论,已经很难让人忽视它的存
在。
健康、高效的资本市场反映了并反作用于实质经济的发展,而资本市场效率在很大程度
上取决于市场投资者素质的高低。因此,投资者教育成为市场经济基本建设的重要内容。同
时,作为一个新兴市场,借鉴西方成熟市场的经验教训也是“后发优势”的一种体现。上海
财经大学出版社与东方证券有限责任公司合作,翻译出版了这套“东方证券·透视所有时代
最伟大投资经典”,首批入选的四部著作深入浅出,均为近年来受到西方投资界推崇的畅销
作品。相信对国人了解掌握证券市场运行规律能够有所助益。
谈敏 2002 年 6 月
译者的话
在动手写这篇序的时候,我正巧看到了一则有趣的报道,标题为“生子不是福”。报道
摘录如下:“芬兰图尔库大学的萨姆利·赫利在最近一期的《科学》杂志上发表文章指出,
根据他与同事对 1640 年到 1870 年问 375 名妇女教堂记录的分析结果,在前工业化时代.生
育儿子会显著缩短妇女寿命,而生育女儿则会对妇女的长寿起积极作用。为了保证分析结果
1
的准确性和确定生男生女的长期效果,研究人员把考察对象限定于年过五旬的妇女。结果表
明,生育子女的数目不会影响妇女寿命,但每生一个儿子,却会平均将其缩短 34 周。”如
果你是一名士性,而且又尚未做母亲,读完这则报道之后,你会有怎样的想法呢?也许你的
第一反应会同标题一样——生个女儿该有多好,毕竟 34 周(将近 1 年)的生命是十分珍贵的。
但是,报道的内容是否值得信赖?支撑该报道的分析方法又是否恰当呢。
在信息爆炸的年代,我们将随时随地成为信息的接收者,散布在报纸、杂志、电视、广
播中的信息.良莠并存、真伪同在,我们该如何“借来一双慧眼”,看个清楚明白呢?
20 世纪 50 年代,美国的各大媒体和宣传机构越来越重视利用统计——“这个神秘的语
言” -说话,然而大量的统计数据、统计资料由于主、客观的原因被滥用,很难起到描述
事实、传递信息的作用。相反,还往往对读者形成误导。选莱尔·哈夫(Darrell Huff), 一
位具有深厚统计背景的新闻记者——发现了这一现象。他在广泛调查的基础上,从报刊、杂
志、书籍中,从美国统计学会一些统计学家提供的实例中,收集了大量案例,并在 1954 年
写下了“How to Lie with Statistics”一书。该书一经出版,便畅销美国,成为美国 20
世纪 50 年代的畅销书之一。并受到了当时美国各种书评杂志的好评。《管理评论》认为:“哈
夫先生用如此生动的、充满人情味的方式来论述统计这个干巴巴的课题,真是一讯灵丹妙
药。……我们太需要这本书了,它虽然娱乐性强、浅显易读,却十分具有说服力。”《图书
期刊》如此评价:“作者和制图者倾注了全力,给大家提供了一本十分轻松活泼的读物和卡
通画。它们能给你带来娱乐,又能引发思考,而且还揭穿了许多统计方法的谎言。”《大西
洋》评价道:“这是一本具有善意破坏性的书,读完它后,你对于‘万能统计’的信任将大
大降低。”正是由于这本书融娱乐性和知识性为一体,使它成为一本具有影响力的著作。该
书出版至今,多次重印并被译成多国文字。
这本经典著作自其出版至今已将近 50 年,书中所体现的思想和方法仍然广为称道。事
实上,目前在美国几乎所有知名的网上书店,仍然可以购买到此书,并一直受到读者的好评。
而且,由于该书的畅销,使得“编造虚假信息”这一命题受到了人们持续普遍的关注,如果
上网查询,输入关键字“HOW to Lie with Statistics”,我们将发现:相匹配的查询结果
不是几条、几十条,而是数千条。
本书具有独具匠心的行文结构。从第 1 章到第 9 章,作者想像自己是一个技艺高超的惯
骗,正在向后起之秀面授各种行骗的技巧。协助行骗的工具有很多,包括:有偏的样本、刻
意挑选的平均数、遗漏某些重要的数据、样本的误差、统计图、平面图、不匹配的资料、混
淆相关关系与因果关系以及不正确地使用资料。对每一种工具的功能和使用场合,他都一一
做了详细的介绍。第 10 章是一个总结性的章节,在此章中,作者摈弃了前 9 章使用的描述
手法,直接正面地阐述了“对统计资料”应该“提出的五个问题”:(1)“谁说的?”(2)“如
何知道的?”(3)“是否遗漏了什么?”(4)“是否偷换了概念?”以及(5)“资料是否有意
义?”通过寻找这 5 个问题的答案,读者能初步判断资料是否真实可信。原著的标题为“How
to Lie with Statistics”,有多种译法。可直译为《如何利用统计撒谎》,这样基本体现
了本文前 9 章的行文风格,但考虑到作者的目的是识破谎言,最终将译名定为《统计陷阱》。
本书具有引人入胜的行文风格。作者文笔幽默、活泼,书中的案例充实,插图生动,十
分吸引人,实在很难将它与枯燥、刻板的统计书籍联系起来。在序言中,作者将伪装统计资
料的人比喻成一个在昏暗的灯光下没日没夜工作的“白衣侠客”,将本书描述成“一本如何
利用统计行骗的入门读物”,类似手法的描述散布于书中,十分形象。虽然书中也出现了一
些统计术语和统计方法,但在作者重说明、轻证明的描述下,即使你从来没有接触过统计,
也能很好地掌握其中的思想。
本书实用性强、适用面很广。虽然书中大部分案例发生在美国,但随着我国市场经济体
制的逐步确立,在日常的经济生活中我们将接触到越来越多的统计数据和资料,例如各种证
2
券信息、投资可行性研究报告、公司财务报告等。这些资料、数据,也需要有去粗取精、去
伪存真的过程。我们又该如何进行鉴别?同样的问题已经摆在 7 我们面前。
在对各类统计数据进行利用的过程中,证券市场最具代表性。由于利益的驱动,总会有
“大胆”的公司为了抬高股价或圈钱而操纵财务报表。投资者如果报据虚假的财务数据进行
投资,极可能使投资付之流水。为了对众多数据准确地辨别其真伪,了解、掌握公司的操纵
造假手段是必要的。资产重蛆、资产评估、关联交易等都能够成为利润虚增的手段,而其中
每一种手段还可以包括多种形式。以关联方交易为倒,既可以销售给控股股东和非控股子公
司,也可以是不同控股程度子公司之间的销售,还可以是上市,公司溢价采购控股子公司的
产品厦劳务形成固定资产。美国安然公司(Enron corp..)就是一个很好的例子。在当前安
然案正在调查之际,要讲清安然崩溃的玄机几乎是不可能的。安然是金融创新的巨擘,它所
发明的一系列金融创新工具及衍生产品极其复杂;而同时安然也是操纵财务报表的大师,它
有意识地隐瞒了大量的重要信息及高度复杂的关联交易,安然公司的财务报表多年以来在华
尔街上其实无人能够真正理解,而且几乎无人敢于挑战。从这个角度来看,安然无疑是数据
陷阱大师。众所周知,中国证券市场上类似的例子也层出不穷,其高明程度虽然远逊于安然,
但是这种“统计陷阱”也迷惑了众多的投资者。
随着我国加入 WTO,加入到世界经济一体化的进程中,国与国之间的经济比较也变得越
来越重要。在比较过程中,对比较指标的选择会产生十分微妙的差异。下面是摘自 2002 年
3 月 20 日《财经》杂志中题为“GDP 高增长的背后”一文的一些数据。中国内地、台湾,以
及韩国、美国和日本 5 个地区或国家 1994 年到 2000 年营业盈余的复合增长率分别为:9.8
%、9.5%、7.7%、5.2%和-1.4%,比较这些数值发现:中国内地具有最快的增长率,其
余依次降低,且日本最低,为负增长。然而,如果我们把指标换成反映经济回报率的指标时
却会得到另外一番景象。同样这 5 个地区或国家,营业盈余占 GDP 的比例依次为:20.6%、
31.8%、30.2%、23.3%和 20.1%,营业盈余占社会固定资产净值的比例依次为:13.5
%、21.1%、15.4%、15.6%和 8.0%。比较这样两组指标值,我们不难发现中国内地的经
济回报率水平偏低,在这些地区或国家中大约位于倒数第二名。综合这三组数据能较好地体
现中国内地近几年的经济发展状况:虽然经
济增长速度较快,但是经济效率却仍处于较低水平,这篇文章的作者客观地反映了真实情况。
但如果作者有自己的打算和想法,那么这两组指标将起到完全相反的作用一第一组指标能振
奋人心,而第二组和第三组指标却让人情绪低落。
在比较过程中,选择的指标是否具有可比性也是一个值得玩味的问题。同样是失业率,
我们会很惊奇地发现,中国的失业率远远低于美国和欧盟一些主要的国家,几乎可以认为处
于自然失业率水平上。这是否意味着我国真的不存在失业问题呢?对此,常识就会给出一个
否定的答案,因为我们能够强烈地感受到下岗所带来的影响。我国失业率低仅仅是因为采用
了不同的统计口径和统计计算方法。
“五·一”、“十·一”等假日创造的无限商机已经引起旅游公司、运输部门及住宿餐
饮等部门的高度重视。如何对假日经济加以正确引导和规范成为越来越多人们感兴趣的课
题。为了获得全国消费者旅游习惯的第一手资料,某公司曾展开一个抽样调查,根据已有资
料:旅游总收入中来自农村消费者的收入仅占 20%以下,比例较低。该公司为简化调查,
剔除比例较低的农村消费者,而将调查对象定为 25 个城市的 6400 个居民。暂且不看调查结
果,仅从调查方式中,我们便可肯定地得到结论:该调查结果不足以说明全国消费者的旅游
习惯。虽然来自农村消费者的旅游收入只占总收入的较小比例,但由于经济水平的差异,城
市消费者与农村消费者的消费偏好总是存在较大的区别。因此,用仅包含城市消费者的
样本去说明既包括城市消费者又包括农村消费者的“全国”消费者旅游习惯,明显是不合理
的。
3
上面只是经济中的几个例子,生活中我们还可以接触到各种各样的谎言,每个人都需要
对各种信息进行识别,因此.掌握书中的工具是防止受骗的可行方法。
培根曾经说过:“如果一个人以种种肯定的立论开始,他必将终止于各种怀疑;但如果
他愿意抱着怀疑的态度开始,那么他必将获得肯定的结论。”我想对数据资料的判断和接收
也是如此。
本书翻译过程中,得到了上海财经大学统计学系刘汉良教授的大力支持和帮助,他在百
忙之中仍多次抽空帮助校对译稿。上海财经大学统计学系主任徐国祥教授对本书的翻译、出
版也给予了热情关心和帮助。上海财经大学出版社黄磊先生对本书提出了许多建设性的建
议,在此一并致以诚挚的谢意。
翻译是一门遗憾的艺术。由于译者文字功底和理论水平有限,原著中的精彩程度难免打
了折扣,译作中也难免存在错误和不足,敬请专家、读者批评指正。
在整个翻译过程中,译者经常会为原著中精妙的思想和流畅的语言而惊喜,虽然未必能
将其原汁原味地呈现给大家,但开卷有益,希望读者能与我一起分享这份喜悦!
译者 2002 年 7 月于上海财经大学
4
绪言
有 3 种谎言;谎言,糟糕透顶的谎言和统计资料。
————Disraeli
对于追求效率的公民而言,统计思维总有一天会和读写能力一样必要。
——H.G.Wells
使我们陷入麻烦的通常并非我们不知道的事情,而是那些我们知道却不正确的事情。
——Artemus Ward
整数总是不完善的。
——Ssrnuel Johnson
我需要完成一个很大的课题——统计学,但却感到我的写作功底十分有限,如果不牺牲
准确性和完整性,就很难使人理解。
——Sir Francis Galton
5
致谢
散见在本书中的关于狡辩和欺诈的小例子经过了广泛的收集,并得到了人们的许多帮
助。在我对美国统计学会发出呼吁后,许多专业统计学家——请相信我,他们和任何人一样
痛恨对统计资料的滥用——从他们自身收集的资料中为我提供了大量的实例。这些人,我猜
想,将乐意不被提到姓名。同样,我在许多书籍中发现了有意义的事例,主要的书籍有:Martm
A.Bruinbaugh 和 I.ester s.Kellogg 所著的《商业统计学》;Hadley Cantril 的《公共
观点的测定》;Willard Cope Brin— ton 的《统计图》;Frederick E.croxton 和 Dudley
J cowden 的《实用商业统计学》;George Simpson 和 Fritz Kafka 的《基础统计学》以及
Helen M walker 的《基础统计方法》。
6
目录
总序................................................................................................................................. 1
译者的话.......................................................................................................................... 1
绪言................................................................................................................................. 5
第一章 内在有偏的样本................................................................................................... 9
第二章 精心挑选的平均数 ............................................................................................. 17
第三章 没有披露的数据................................................................................................. 22
第四章 毫无意义的工作................................................................................................. 30
第五章 惊人的统计图形................................................................................................. 33
第六章 平面图形 ........................................................................................................... 36
第七章 不相匹配的资料................................................................................................. 41
第八章 相关关系与因果关系.......................................................................................... 46
第九章 如何进行统计操纵 ............................................................................................. 51
第十章 对统计资料提出的五个问题 ............................................................................... 63
我岳父刚从爱荷华州到加利福尼亚州便对我说:“你们这儿治安不好。”在他所阅读的
报纸中的确是这样描述的。但是,这种报纸以不轻易忽略当地发生的任何犯罪行为,并且以
对于爱荷华州发生的谋杀案用比爱荷华州本地的主要报纸更多的笔墨进行大肆渲染而闻名。
我岳父得出的这个结论是一个建立在明显有偏样本基础之上的随意的统计结论。类似于
其他某些更为精致的统计结论,它也存在着证据与结果不匹配的问题。它假定报纸专栏中对
犯罪行为的报道是测量犯罪率的工具。
几年前,十来个调查人员分别独立地发表了关于抗组织胺药物的数据。所有的数据都证
明,在经过抗组织胺药物治疗后相当大比例的感冒能够治愈。这引起了传媒的大肆宣传,至
少在广告中也是如此,并兴起了药物生产的热潮,这是因为人们长期以来对药物具有强烈的
需求。但奇怪的是,人们拒绝越过统计去注意一下早就了解的事实。正如一位幽默的非医学
权威人士,亨利·G.菲尔森(HenryG.Felsen)所指出的那样,服用上述药物的确能在一个
星期内治愈感冒,但人们却忽略了另一个事实——即使不服用上述药物,一般而言,感冒也
能在七天内痊愈。
你所见所闻的许多东西也和上面的事例一样。平均数、作用关系、趋势和图表与看上去
的并不总是一致。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的也许隐瞒了或者夸大
了一部分事实。
统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用
并成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、
民意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确
理解并恰当地使用这些统计语言,而读者又并不能真正懂得这些术语的含义,那么,统计结
果只能是一堆废话。
7
在通常的科学写作中充斥着被滥用的统计数据,以至于人们很难想到这些统计数据的背
后有一个“白衣侠客”在昏暗的灯光下没日没夜地工作,就像一小撮药粉、一小瓶颜料,统
计把一些重要的事实弄得似是而非。巧妙伪装的统计资料胜过希特勒的弥天大谎,虽然它也
会引起人们的误解,却不会因此受到指责。
本书是一本如何利用统计以达到瞒天过海目的的入门读物。看上去,它很像骗子的行骗
指南。但或许我可以模仿一个已退休的窃贼——在如何神不知、鬼不觉地撬开一把锁的方面,
他的回忆录达到了研究生课程的水平——替这本书说句公道话:毕竟,骗子早就掌握了行骗
的技巧,而诚实的人出于自卫也应该学会它。
8