logo资料库

DOE试验设计(SAS_JMP)经典学习案例.pdf

第1页 / 共33页
第2页 / 共33页
第3页 / 共33页
第4页 / 共33页
第5页 / 共33页
第6页 / 共33页
第7页 / 共33页
第8页 / 共33页
资料共33页,剩余部分请下载后查看
DOEDOEDOEDOE 就在你身边 DOEDOEDOEDOE 系列之一 DOE,即试验设计(Design Of Experiment),是研究和处理多因子与响应变量关系的一 种科学方法。它通过合理地挑选试验条件,安排试验,并通过对试验数据的分析,从而找出 总体最优的改进方案。从上个世纪 20 年代费雪(Ronald Fisher)在农业试验中首次提出 DOE 的概念,到六西格玛管理在世界范围内的蓬勃发展,DOE 已经历了 80 多年的发展历程,在 学术界和企业界均获得了崇高的声誉。 然而,由于专业统计分析的复杂性和各行各业的差异性,DOE 在很多人眼中逐渐演变 为可望而不可及的空中楼阁。其实,DOE 绝不是少数统计学家的专属工具,它很容易成为 各类工程技术人员的好朋友、好帮手。本文将以一个日常生活中的小案例为线索,结合操作 便捷的专业统计分析软件 JMP,帮助大家揭开 DOE 的神秘面纱,了解 DOE 的执行过程, 自由自在地建立属于自我的 DOE 空间。 场景 :相信大家都吃过爆米花,但是大家是否都了解爆米花的制作过程?在品尝爆米花 的时候,不知道您是否注意到有很多爆米花没有爆开,也有很多被爆焦。这两种情况都是生 产过程中的质量缺陷。 这里,我们基于六西格玛软件 JMP 来实现我们的目标:寻找使用微波炉加工一包爆玉 米花的更佳程序。凭借经验,我们很容易就能确定重要因子的合理范围:加工爆玉米花的时 间(介于 3 至 5 分钟之间) 微波炉使用的火力(介于 5 至 10 档之间) 使用的玉米品牌(A 或 B) 在爆玉米花时,我们希望所有(或几乎所有)的玉米粒都爆开了,没有(或很少)玉米 粒未爆开。因此 玉米的"爆开个数"是最终关注的重点。 第 1 步:定义响应和因子(如图一所示) 第 2 步:定义因子约束(如图二所示) 图一 定义响应和因子 根据经验,你知道:不能在试验中长时间高火力加工爆玉米花,因为这样会烧焦某些 玉米粒。不能在试验中短时间低火力加工爆玉米花,因为这样只有少数玉米粒爆开。所以 要限制试验,以使加工时间加上微波炉火力小于等于 13,但大于等于 10。 图二 定义因子约束
第 3 步:添加交互作用项(如图三所示) 我们可以推测:与爆开玉米比例相关的任意因子效应可能取决于某些其它因子的值。 例如,品牌 A 时间变化的效应可能大于或小于使用品牌 B 相同时间变化的效应。这种因子 表现出的协同效应统称为二因子交互作用。我们决定在爆玉米花加工过程的先验模型中纳 入所有可能的二因子交互作用。 第 4 步:确定试验次数(如图四所示) 图三 添加交互作用项 根据在模型中添加的效应,执行试验需要一定的试验次数。我们可以使用最小值、建 议值,也可以指定试验次数,只要其值大于最小值。本例中,我们将使用默认的试验次数 16。 图四 确定试验次数 第 5 步:指定输出表格(如图五所示) 生成的数据表保留了随机化的特性,显示了我们应该运行试验的顺序,首先在 7 级火 力下将第一包 B 牌的玉米加工 3 分钟,然后在 5 级火力下将 B 牌玉米加工 5 分钟,依次 进行。 第 6 步:收集和输入数据(如图六所示) 图五 指定输出表格
根据设计方案加工爆玉米花。然后,计算每包中爆开的玉米粒的数量。最后,保存结 果至数据表。 第 7 步:分析结果(如图七所示) 图六 收集和输入数据 可以构建数据模型了,一般使用最常见的分析方法--最小二乘法,但是如果响应数据 明显不呈正态分布时,选择广义线形模型法会显得更为合适。 图七 分析结果 简要地查看输出报告中的"参数估计"表,发现所有的 p 值都小于 0.05,表明所有的 模型效应,包括一次主因子作用、二次主因子作用和双因子交互作用,均是显着的。 我们已确认时间、火力以及品牌与爆开玉米粒个数之间存在着紧密关系,要进行进一 步研究,可以打开"预测刻画器",分析因子组合的变化如何影响爆开玉米粒的个数。预测 刻画器显示了每个因子对响应的预测轨迹,移动红色虚线,便能查看更改因子值对响应产 生的影响。例如,单击"时间"图中的红线并左右拖动,当"时间"值从 3 转移至 5 时,"爆开 个数"也在发生相应得变化。同时,随着时间的增加和减少,时间和火力预测轨迹的斜率 也随之改变,表明确实存在时间和火力的交互效应。
最后,还可以通过"预测刻画器"寻找出最优设置,即最合意的设置。我们根据试验分 析结果而推荐的方法是:使用 A 品牌,加工 5 分钟,并将火力调为 6.96 级。试验预测在 此种设置下加工,产出的玉米粒 445 个以上都爆开了。 类似这种爆玉米花的案例在我们的生活和工作中还有很多很多,有兴趣的读者完全可 以将平时遇到的问题抽象成一个 DOE 模型,然后借助 JMP 这样的专业统计分析软件,轻 轻松松地得到问题的解决方案。有关 DOE 的更加深入的理论和应用,笔者会在今后的文 章中继续与大家交流。 初识 DOEDOEDOEDOE-DOEDOEDOEDOE 系列之二 其实,DOE 对中国人来说,也不是一个完全崭新的内容。早在新中国成立初期,华 罗庚教授就在我国农业、工业领域大力倡导与普及 DOE,只是当时他运用的是另一个名 词——优选法。七十年代末,方开泰教授和王元院士又提出了著名的“均匀设计”法,这一 方法在我国航空航天事业中的导弹设计中取得了巨大成效。与此同时,“均匀设计”法也在 全球研究 DOE 理论的学术界得到了高度赞誉。但是,在将 DOE 的先进理念和科技方法向 各行各业转移,向一般技术人员转移,并转换为高效生产力的道路上,我们的进展还很有 限。 通过“DOE 系列之一”我们已经知道:DOE 与人们的生活及工作密切相关,在专业六 西格玛统计分析软件 JMP 的帮助下,掌握 DOE 也不再是一件难事。从本质上讲,DOE 是这样一门科学:研究如何以最有效的方式安排试验,通过对试验结果的分析以获取最大 信息。所以,DOE 有两大技术支柱:试验规划和分析方法。其中,试验规划又可以分为 均分设计、因子设计、响应面设计等,分析方法又可以分为极差分析、方差分析、多元回 归分析等。虽然 DOE 的理论体系中涉及统计分析的专业词汇很多,但为便于读者理解, 本文包括后续的系列文章将尽量避免过多地涉及统计分析的基本概念,而是将以“解决问题 的思路”为导向,由浅入深地向读者介绍 DOE 的理论体系和应用过程。另外,感谢当代高 速发展的计算机技术,我们可以借助六西格玛统计分析软件 JMP 来实现上述所有的试验 设计方案,顺便提一下,JMP 是目前唯一能实现上述所有试验设计方案的六西格玛统计分 析软件,而且已经面向大中华地区推出中英文双语版软件。 一般的实际问题都是纷繁复杂、千变万化的,但是透过现象看本质,所有实际问题的 共同点也可以通过统一的模型来抽象概括。图一就是一个高度简化的过程模型,其中 Y1, Y2,…,Ys 是我们关心的输出变量,例如质量指标、生产能力和成本等,通常被称为“响 应变量”(Response); X1,X2,…Xk 是我们在工作中可以加以控制的输入变量,例 如人员、设备、原材料、操作方法和环境等,通常被称为“可控因子”(Factor),它们可 以是连续型数据,也可以是离散型数据;中间的“黑匣子”是“过程”(Process),在前两者 之间起着衔接转换的作用,它与不同行业、不同产品、不同技术密切相关,但整体都可以 用 的数学模型来表示。这个数学模型的具体表达式越精准,说明我们对这个过程的理解 越深刻,DOE 就是协助我们揭示或验证数学模型表达式的利器!
图一 过程模型 在某些要求不高的工作环境中,往往不需要用一个复杂的数学表达式来描述过程 的全貌,但至少要了解哪个或哪几个因子(X)对响应(Y)的影响显著,哪些因子之间存 在着相互影响的关系等。这时,“主因子作用”(Main Effect)和“交互作用”(Interaction) 可以帮助我们回答这些问题。在此,不强调具体的计算过程,主要以视觉效果阐述主要概 念。主因子作用是指一个因子在不同水平下的变化导致响应的平均变化量。正如图二所示 , X 在-1 和+1 两个水平下 Y 值的落差反映的就是主因子作用。交互作用是指当其他因子的 水平改变时,一个因子的主因子作用的平均变化量。正如图三所示,左半部分的因子 A 对 Y 的影响没有受因子 B 的变化而变化,两组 A 与 Y 的回归直线完全平行,表明因子 A 与 B 之间没有任何交互作用;反之,右半部分的因子 A 对 Y 的影响受因子 B 的变化而变化, 两组 A 与 Y 的回归直线明显相交,表明因子 A 与 B 之间存在显著的交互作用。 图二 主因子作用示意图 图三 交互作用示意图
秉承“理论联系实际”的原则,接下来我们用一个真实的案例来说明上述原理的实际意 义。 场景:一位工程师希望通过减小厚度来改善涡轮叶片质量,首先他想定量地研究在相 关的生产过程中,三个最有可能会影响厚度的变量:铸造温度(Mold Temp)、浇注时间(Mo ld Time)和放置时间(Set Time)。根据 DOE 理论中最简单的“完全因子设计”,工程师决定 开展一个“三因子,两水平,共八次”的现场试验。试验方案和最终结果如表一所示,试通 过主因子作用和交互作用进行分析。 铸造温度(C) 浇铸时间(S) 放置时间(M) 厚度(mm) 300 350 300 350 300 350 300 350 1 1 3 3 1 1 3 3 1 1 1 1 2 2 2 2 3.61 3.77 6.75 3.72 3.34 3.24 7.01 4.14 表一 涡轮叶片厚度试验记录 相关的统计计算可以借助专业六西格玛统计分析软件 MP 轻松实现,在此不一一详述 , 重点用形象直观的图形说明分析结果。 图四 各因子的主因子作用
图五 各因子间的交互作用 由图四可知,铸造温度和浇铸时间对涡轮叶片的厚度有比较显著的影响,而放置时间 则几乎没有任何影响。由图五可知,铸造温度与浇铸时间之间、放置时间与浇铸时间之间 的交互作用比较明显,而铸造温度与放置时间之间的交互作用则几乎为零。通过上述可视 化的分析过程,我们清楚地理解了该过程中铸造温度和浇铸时间的正确设置对最终产品质 量的重要性。 当然以上只是有关 DOE 的一个最基础的应用,笔者会在下期文章中进一步与大家交 流更深层次的内容。(资深六西格玛咨询专家 周暐) 多因子 DOEDOEDOEDOE 的魅力-DOEDOEDOEDOE 系列之三 通过前两期的介绍,我们已经初步认识到了 DOE 的强大分析功能。但是有的读者可 能会不以为然:在此之前的两个案例中因子的数量太少(只有 3 个),而实际需要解决的问 题会复杂得多,涉及的因子数量也可能会很多(至少有 6 个)。因此,他就可能会得出一个 结论:DOE 只适合于少数因子的问题分析,至于处理多因子问题,则显得无能为力了。 这个结论显然有失偏颇,其实 DOE 的一大特点就是可以处理包含多达 50 个(并不限 于 50 个)因子的复杂问题,本期的主要内容就是向读者介绍多因子 DOE 的方法。 从理论上讲,上一期的 DOE 案例实质上采用的是完全因子设计(Full Factorial Desig n),这类方法在因子数量较少的时候实施起来比较方便。但是正如表一所示,当试验中的 因子数量逐步增加时,试验次数却呈指数增加,庞大的试验规模意味着巨额的试验费用, 意味着实施 DOE 的可行性越来越小。
因子数量 试验次数 2 3 4 5 6 7 8 9 10 … 4 8 16 32 64 128 256 512 1024 … 表一 完全因子 DOE 的局限 为了解决这个矛盾,我们可以用一种更具魅力的方法——部分因子设计(Fractional Fa ctorial Design)来替代一般的完全因子设计。顾名思义,部分因子设计源于完全因子设计, 是与其对应的完全因子设计中的一部分。但究竟是哪一部分,是否可以随机选取?举一个 简单的例子来说明。 表二显示的是一个完全因子设计的计划表,A、B 和 C 表示三个主因子,+1 和-1 表示 因子的两个不同水平,AB、AC 和 BC 表示二阶交互作用,ABC 表示三阶交互作用,总共 需要做 8 次不同的水平组合来完成 1 次完全因子设计的计划。 Run 1 2 3 4 5 6 7 8 A -1 1 -1 1 -1 1 -1 1 B -1 -1 1 1 -1 -1 1 1 C -1 -1 -1 -1 1 1 1 1 AB 1 -1 -1 1 1 -1 -1 1 AC 1 -1 1 -1 -1 1 -1 1 BC 1 1 -1 -1 -1 -1 1 1 ABC -1 1 1 -1 1 -1 -1 1 表二 3 因子的完全因子设计计划表
分享到:
收藏