目录
0TU序言U0T ................................................................................................................................................. 2
0TU前言U0T ................................................................................................................................................. 4
0TU第一章 试验设计和均匀设计U0T ..................................................................................................... 5
0TU1.1 试验设计U0T ........................................................................................................................... 5
0TU1.2 试验的因素和水平U0T ........................................................................................................... 7
0TU1.3 因素的主效应和因素间的交互效应U0T ............................................................................... 9
0TU1.4 全面试验和多次单因素试验U0T ......................................................................................... 13
0TU1.5 正交试验法(正交设计)U0T ............................................................................................. 16
0TU1.6 均匀设计U0T ......................................................................................................................... 18
0TU1.7 均匀设计表的使用U0T ......................................................................................................... 21
0TU第二章 回归分析简介及其在均匀设计中的应用U0T ..................................................................... 24
0TU2.1 一元线性回归模型U0T ......................................................................................................... 24
0TU2.2 多元线性回归模型U0T ......................................................................................................... 29
0TU2.3 二次型回归模型与变量筛选U0T ......................................................................................... 31
0TU2.4 应用实例U0T ......................................................................................................................... 32
0TU2.5 寻求最优工艺条件U0T ......................................................................................................... 35
0TU第三章 均匀设计表的构造和运用U0T ........................................................................................... 36
0TU3.1 均匀设计表的构造U0T ...................................................................................................... 36
0TU3.2 均匀性准则和使用表的产生U0T ...................................................................................... 39
0TU3.4 均匀设计和正交设计的比较U0T ...................................................................................... 46
0TU第四章 配方均匀设计U0T ............................................................................................................... 49
0TU4.1 配方试验设计U0T .............................................................................................................. 49
0TU4.2 配方均匀设计U0T .............................................................................................................. 51
0TU4.3 有约束的配方均匀设计U0T .............................................................................................. 53
0TU4.4 均匀设计在系统工程中的应用U0T .................................................................................. 56
序言
在科学实验与工农业生产中,经常要做实验。如何安排实验,使实验次数尽量少,而又
能达到好的试验效果呢?这是经常会碰到的问题。解决这个问题有一门专门的学问,叫做“试
验设计”。试验设计得好,会事半功倍,反之就会事倍功半了。60 年代,华罗庚教授在我国倡
导与普及的“优选法”,即国外的斐波那契方法,与我国的数理统计学者在工业部门中普及
的“正交设计”法都是试验设计方法。这些方法经普及后,已为广大技术人员与科学工作者
掌握,取得一系列成就,产生了巨大的社会效益和经济效益。随着科学技术工作的深入发展,
上述两种方法就显得不够了。“优选法”是单变量的最优调试法,即假定我们处理的实际问
题中只有一个因素起作用,这种情况几乎是没有的。所以在使用时,只能抓“主要矛盾”,
即突出一个因素,而将其他因素固定,这样来安排实验。因此“优选法”还不是一个很精确
的近似方法。“正交设计”的基础是拉丁方理论与群论,可以用来安排多因素的试验,而且
试验次数对各因素的各水平的所有组合数来说是大大地减少了,但对于某些工业试验与昂贵
的科学实验来说,试验仍嫌太多,而无法安排。
1978 年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水
平数要多于 10,而试验总数又不超过 50,显然优选法和正交设计都不能用,方开泰教授在
几年前,曾为近似计算一个多重积分问题找过我,我向他介绍了多重数值积分的方法并取得
了好结果,这就使他想到是否可能用数论方法于试验设计的问题,于是我们经过几个月的共
同研究,提出了一个新的试验设计,即所谓“均匀设计”,将这一方法用于导弹设计,取得
了成效,我们的文章在 80 年代初发表后,15 年来,均匀设计已在我国有较广泛的普及与使
用,取得了一系列可喜的成绩。
均匀设计属于近 30 年发展起来的“伪蒙特卡罗方法”的范筹。将经典的确定的单变量
问题的计算方法推广后用于多变量问题的计算时,计算量往往跟变量个数有关,即使电脑再
进步很多,这种方法仍无法实际应用,乌拉母(S.Ulam)与冯诺依曼(J.von Neumann)在 40
年代提出蒙特卡罗方法,即统计模拟方法,这个方法的大意是将一个分析问题化为一个有同
样解答的概率问题,然后用统计模拟的方法来处理后面这个问题,这样使一些困难的分析问
题反而得到了解决,例如多重定积分的近似计算。蒙特卡罗方法的关键是找一组随机数作为
统计模拟之用,所以这一方法的精度在于随机数的均匀性与独立性。
50 年代末,有些数学家试图用确定性方法寻找空间中均匀散布的点集来代替蒙特卡罗
方法中的随机数,已经找到的点集都是用数论方法找到的。按照外尔(H. Weyl)定义的测
度来度量,它们的均匀性很好,但独立性差些,用这些点集来代替蒙特卡罗方法中的随机数,
往往会得到更精确的结果。这一方法称为伪蒙特卡罗方法或数论方法,数学家首先将这一方
法成功地用于多重积分近似计算。从统计学的观点看,伪随机数就是一个均匀分布的样本。
数值积分需要大样本,均匀设计则要找一些小样本。由于这个样本比正交设计所对应的样本
要均匀,所以用它来安排实验会得到好的效果。当然在寻求小样本时,寻求大样本的方法是
起了借鉴作用的。
均匀设计只是数论方法的一个应用,数论方法还有广泛应用的园地。例如多重插值公式
的建立,某些积分与微分的近似求解,求函数整体极值,求某些多元分布的近似代表点,及
用于统计推断的一些问题,如多元正态性检验及多元球性检验。
早在 50 年代末,外国刚开始研究为蒙特卡罗方法时,华罗庚就倡议并领导了这一方法
在我国的研究,他的开拓性成果总结在我们的专著“数论在近似分析中的应用”(科学出版
社,1978 年;英文版:Springer-Verlag and Science Press,1981)中,这些工作是方开泰教授
与我合作的工作重要的背景与参考材料之一。
我与方开泰教授合作了近 20 年,由于他既是一个数学家,又有长期在中国各工业部门
普及应用数理统计的宝贵经验,所以他有很好的应用数学背景与洞察力。他能及时地提出有
价值的研究问题及解决问题的可能途径,我们的合作既是愉快的,又是富于成效的,我们的
成果总结在我们的专著”Number-Theroretic Methods in Statistics”(Chapman and Hall,1993,中
文版在出版过程中)之中。
方开泰教授的这本书着重于应用及普及,但也包括了他的最新成果,书后的均匀设计表
就是最近他用准确的偏差方法算出来的,比过去的结果有较大的改进,我相信本书的出版,
对于在我国进一步普及与应用均匀设计将是很重要的,我愿借此机会预祝本书成功。
王元
1994 年 2 月
前言
均匀设计是 1978 年王元教授和我共同提出的,10 多年来,均匀设计在理论上有了不少
新的发展,如各种均匀性度量的探讨,拉丁方均匀设计的提出将均匀设计用于配方设计而产
生的配方均匀设计,特别地,最近我们又发现了一批奇数的均匀设计表,它们比原来的表均
匀性有显著地改善,这些表和它们的均匀表都已收集在本书的附录中,由于实际的需要,利
用拟水平的技术可以产生有混合水平的均匀设计表,本书也给出了不少这一类的设计表,并
列出它们的均匀度,此外,本书给出了均匀设计和正交设计的比较。
本书是一本普及教材,目的是向广大科技工作者介绍均匀设计的原理,方法和应用,读
者并不需要具备高深的数学和统计知识,中国数学会均匀设计学会已经研制了有关软件和教
学录象带,方便使用者有效地使用均匀设计,特别是数据分析方面,该软件包含了丰富的内
容,比本书的材料更为丰富,本书也可作为大学和研究生的教材和参考书。
本书共分四章,第一章介绍试验设计的重要性,正交设计和如何使用均匀设计来设计试
验。第二章首先对回归分析作了简单的介绍,随后介绍均匀设计的数据分析,工艺条件的优
化。第三章介绍均匀设计表的构造,使用表的构造,均匀度准则,以及正交设计和均匀设计
的比较。第四章讨论配方设计,首先介绍文献中推荐的三种配方设计方法,然后给出配方均
匀设计,有约束配方均匀设计,最后给出均匀设计在系统工程等方面的应用。
在编写这本讲义中,中国科学院院士王元教授给出了许多指导性意见,并为本书写了精
彩的序言,没有华一王(华罗庚王元)当年开创性的工作,就不可能有均匀设计。
中国航天工业总公司三院张建舟高级工程师,东北制药总厂张承恩高级工程师,北京军
事医学科学院张学中研究员给了我很多支持和帮助,中国科学院应用数学所我的学生李润泽
和张金廷同志协助我整理和打印,在此表示衷心地感谢。
由于作者水平有限,加之本书是利用春节假期匆匆赶出来的,难免有错误或不恰当之处,
欢迎读者批评指正。
方开泰
中国科学院应用数学研究所
香港浸会大学
1994 年 2 月
第一章 试验设计和均匀设计
1.1试验设计
在工农业生产和科学研究中,经常需要做试验,以求达到预
期的目的。例如在工农业生产中希望通过试验达到高质、优产、
低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸
索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,
会事半功倍,反之会事倍功半,甚至劳而无功。
本世纪 30 年代,由于农业试验的需要,费歇尔(R.A.Fisher)
在试验设计和统计分析方面做出了一系列先驱工作,从此试验设
计成为统计科学的一个分支。随后,F.Yates,R.C.
Bose,O.Kempthome,W.G.Cochran,D.R.Cox 和 G.E.P.Box 对试验设
计都作出了杰出的贡献,使该分支在理论上日趋完善,在应用上
日趋广泛。60 年代,日本统计学家田口玄一将试验设计中应用
最广的正交设计表格化,在方法解说方面深入浅出为试验设计的
更广泛使用作出了众所周知的贡献。田口玄一的方法对我国试验
设计的普及和广泛应用有巨大的影响,70 年代我国许多统计学
家深入工厂、科研单位,用通俗的方法介绍正交试验设计,帮助
工程技术人员进行试验的安排和数据分析,获得了一大批优秀成
果,出版了许多成果汇编,举办了不少成果展览会。
在广泛使用试验设计方法的洪流中,必然会出现一些新的问
题,这些总是用原有的各种试验设计方法不能圆满地解决,特别
是当试验的范围较大,试验因素需要考察较多等级(在试验设计
中这些等级称之为水平)时,用正交试验及其它流行的试验方法
要求做较多的试验,常使得试验者望而生畏。许多实际问题要求
一种新的试验方法,它能有效地处理多水平的试验,于是王元和
方开泰于 1978 年提出了均匀设计(见文献「1-3」),该设计考
虑如何将设计点均匀地散布在试验范围内,使得能用较少的试验
点获得最多的信息。10 多年来,均匀设计在国内得到了广泛应
第一章 试验设计和均匀设计 共17页
5
用,并获得不少好的成果。
试验设计在工业生产和工程设计中能发挥重要的作用,例如:
1) 提高产量;
2) 减少质量的波动,提高产品质量水准;
3) 大大缩短新产品试验周期;
4) 降低成本;
5) 延长产品寿命。
在自然科学中,有些规律开始尚未由人们所认识,通过试验
设计可以获得其统计规律,在此基础上提出科学猜想,这些猜想
促进了学科的发展,例如遗传学的许多发现都藉助于上述过程。
材料工业是工业中的栋梁,汽车拖拉机的制造离不开各种合
金钢,钛合金的发明和发现使飞机制造工业产生飞跃。超导的研
究 和 超 导 材 料 的 配 方 息 息 相 关 。 配 方 试 验 又 称 混 料 试 验
(Experiments with Mixtures),不仅出现于材料工业,而且在人
们生活和其它工业中处处可见,例如在中药、饮料、混凝土的配
方中。由于在配方中各种材料的总和必须为 100%,其试验设计
必须考虑到这个约束条件,由于这个原因正交试验设计等方法不
能直 接用于配方设计 。针对配方设计 的要求,Scheffé于 1958
年提出了单纯形格子点设计,随后于 1963 年他又提出了单纯形
重心设计。Cornell P
P对配方试验设计的各种方法作了详尽的介
绍和讨论。显然,均匀设计的思想也能用于配方试验,王元和方
[27]
[9]
P给出了配方均匀设计的设计方法和有关的讨论。本书第五
开泰 P
章将系统介绍配方试验设计和配方均匀设计。
不论是均匀设计或配方均匀设计,其数据分析都要藉助于回归
分析,要用到线性回归模型、二次回归模型、非线性模型,,以
及各种选择回归变量的方法(如前进法、后退法、逐步回归、最
优回归子集等)。有关回归分析的书籍成百上千,本书仅作梗概
介绍。读者很容易找到各种参考书籍获得更详细的介绍。
试验设计的方法很多,本书重点介绍均匀设计,这并不意味
其它方法不重要,每种方法都有其优点,也有其局限性,根据实
际情况选取合适的方法是应用统计的重要内容。
第一章 试验设计和均匀设计 共17页
6
1.2试验的因素和水平
在工业、农业、科学研究和军事科学的研究中,经常需要作各种
试验,以研究各种因素之间的关系,找到最优的工艺条件或最好的配
方。让我们先看一个例子:
例 1 在一个化工生产过程中,考虑影响得率(产量)的三个
因素:温度(A),时间(B)和加碱量(C)。为了便于试验的安排,每个因
素要根据以往的经验来选择一个试验范围,然后在试验范围内挑出几
个有代表性的值来进行试验,这些值称做该因素的水平。在该例中,
我们选择的试验范围如下:
温度: 77.5℃~92.5℃
时间: 75 分~165 分
加碱量: 4.5%~7.5%
然后在上述范围内,每个因素各选三个水平,组成如下的因素水
平表:
表 1 因素水平表
3
1
因素
2
温度(°C)
时间(分)
加碱量(%)
80
90
5
85
120
6
90
150
7
选择因素和水平关系到一个试验能否成功的关键,下列的注意事
项和建议对使用试验设计的人员可能是有益的。
1.在一个生产过程中,有关的因素通常是很多的,例如在例 1
的化工生产工艺中,有催化剂的品种,催化剂用量,加碱时的速度,
第一章 试验设计和均匀设计 共17页
7
容器中的压力等。但根据这次试验目的,除了温度(A),时间(B),
和加碱量(C)各取三个水平外,其余因素是固定的,或者讲,他们
只取一个水平。为了方便,通常这些固定的因素在试验方案中并不称
为因素,只有变化的因素才称为因素。
2.在一项试验中,如何从众多的有关因子中挑选出试验方案中
的因素?我们建议课题的领导者应当要请有经验的工程师、技术员、
工人共同讨论决定。在一次试验中,因素不宜选得太多(如超过 10
个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。相反地,
因素也不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重
要的因素,或遗漏因素间的交互作用,使试验的结果达不到预期的目
的。例如,有这样的故事,原计划试验方案中只有三个因素,而利用
试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,
既然不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是
最重要的,从而发现了历史上最好的工艺条件,正是“有心栽花花不
成,无意插柳柳成荫。”
3.试验的范围应当尽可能大一点。如果试验在试验室进行,试
验范围大比较容易实现;如果试验直接在生产中进行,则试验范围不
宜太大,以防产生过多次品,或产生危险。试验范围太小的缺点是不
易获得比已有条件有显著改善的结果。历史上有些重大的发明和发
现,是由于“事故”而获得的,也就是说试验的范围大大不同于有经
验的范围。
4.若试验范围允许大一些,则每一因素的水平个数最好适当多一
些。
5.水平的间隔大小和生产控制精度是密切相关的。若在例 1 中温
度的控制只能作到
第一章 试验设计和均匀设计 共17页
8