logo资料库

PMF5.0翻译.doc

第1页 / 共7页
第2页 / 共7页
第3页 / 共7页
第4页 / 共7页
第5页 / 共7页
第6页 / 共7页
第7页 / 共7页
资料共7页,全文预览结束
EPA PMF 然后总结所有的引导运行(bootstrapping runs).用户应当检查 BS 的结果以决定假 如基本运行(BSrun)(蓝色方块)在四分位数间距(盒)周围的轮廓之内。元素的基本运 行值在四分位间距之外的结果应当被小心的解释,因为观察的一个小的设置可能影响基本运 行结果或者物种中的因子浓度是无关紧要。BS 因子对基础因子的映射理想的是一对一。那 就是说,来自于 BS 因子的每一个因子应该和一个唯一正确的一个基础因子对应。然而,很 可能是几个重要观察的存在(或不存在)能极大地影响 BS 因子轮廓。 在这种情况下,受影响的 BS 因子可能接近与一个特定基础因子符合在大多数情况下,其他 情况下,会和其他因子符合。另外,在基础模型中(BASE model)太多因素规范也可能创 造出一个虚拟因素。, 任何因子接近 80%或者更少来自 BS run 的映射应当有主要贡献物种在调查轮廓当中,以及 更进一步的评估基础模型结果应该被做用 BS-DISP and DISP 错误估计的方法。 启动 BS run BS 捕获与随机误差相关的错误,它在 BS 标签框里触发,在 Base Model Runs 显示屏幕上 (Figure 26, red box)。 对于 base runs,用户必须作出多项选择在触发它之前。 Base Run – the base run 用来映射每一次 BS 运行。base 运行在最低的 Q(robust)条件 下自动提供,用户可选择另一个运行数。 Block Size – 块大小,样品数将在每一步重采样的过程中被选择 例如,一个 3 的块大小意味着每一个 BS 块将包括来自输入数据集的三个样(例如,样 8-10 可以是一个块). 他默认的块大小的计算根据 Politis and White (2003)写到的,但可以被用 户重新选择。如果这个默认值被重新选择,用户可以按“Suggest”按钮保存这个默认值。 Number of Bootstraps – BS 的运行次数被进行。他要求 100 次 BS 运行以确保统计 信息的正确性、稳健性。 对于初步分析,50 次 BS 运行被进行以快速计算解决方案的稳定性。最少也要求 20 次 BS 运行。 最低相关性 R 值 - 最小 Pearson 相关系数将被使用在 BS 运行因子对基础运行因子的分 配中,默认值是 0.6。如果大量的因子未映射,用户可能想要调查降低 R 值的影响。这种变 化应在最终解决方案中报告。 所有的输入参数设定后,BS 运行就可以通过按“Run”按钮。对于 base runs,用户可以 中断运行通过按“Stop”按钮。假如运行中断的话,没有输出将被保存或者覆盖。 5.8.1 Summary of BS Runs(BS 运行总结) 一 个 BS 运 行 总 结 呈 现 在 (Figure 27) , 它 仅 当 BS 运 行 完 出 现 。
前 8 行包含了所有的输入参数与用户在输入屏幕上设定的一样。总结屏幕也包含了几个表 总结 BS 运行结果。第一张表是一个矩阵包含多少 BS 因子与基础因子挈和合。下一张表显 示了这些值 minimum, maximum, median, and 25th and 75 th percentiles of the Q(robust)。总结的其他部分是每一个因子轮廓的变化性,也给出了 the mean, standard deviation, 5thpercentile, 25thpercentile, median, 75thpercentile, and 95thpercentile, 这些值使用公式(5-2)。 每一个轮廓的基础运行包括在第一列作参考,一列表明如果运行轮廓在 BS run profiles 四 分位间距内。 EPA PMF also calculates the Discrete Difference Percentiles (DDP) associated with the BS runs and reports these values in the Base Bootstrap Summary screen. This method estimates the 90th and 95th percentile confidence intervals (CI) around the base run profile, reported as percentages. The DDP is calculated by taking the 90th 。 and 95th percentiles of the absolute differences between the base run and the BS runs for each species in each profile and expressing it as a percentage of the base run value. If the DDP percent is greater than 999, a “+” is displayed on screen. The original value is saved in the output files (*_diag and *_boot). If the base run value for a species is zero, it is not possible to calculate the DDP; in these cases, an
asterisk (*) is displayed. The DDP values can be used for reporting the BS error estimates. EPA PMF 也计算与 BS 运行有关的离散差异百分比(DDP),并在 Base Bootstrap Summary screen 报道这些值。这种方法估计围绕基地运行配置文件的第 90 和 95 个百分 点的可信区间(CI)。DDP 的计算通过在每个轮廓的每个物种的 BS 运行与基础运行之间的 绝对值的第 90 和 95 百分位,如果 DDP 百分数大于 999,“+”显示在屏幕上。初始值保存 在输出文件(*_diag and *_boot).如果一个物种的基础运行 base run 值是 0,就不能计算 DDP;在这些情况下,(*)显示。DDP 值被用来报道 BS 错误估计。 对于这个例子,基础和引导因子是符合的,除了三次运行的三个因子被映射到因子 7。尘土 (因子 4)和机动车(因子 7)包含地壳元素和钢铁源也被映射到 3 个其他源,这可能是因 为 BS 没有创造一个数据集包含所有的样受到高的钢铁产量影响。总的映射因子的数目可能 没有加上 BS 运行的数目,如果 boot factor 运行没有收敛,因子的映射超过 80%表明 BS 不确定度可以被解释,因子运行数目也是合适的。 5.8.2 Base Bootstrap Box Plots BS 的变化性显示在 Base Bootstrap Box Plots screen (Figure 28). 两张图存在:每个物种的百分比变化(Figure 28, 1)和每个物种的浓度变化(Figure 28, 2), 与在 Base Bootstrap Summary screen 中的因子轮廓表相对应。
在两张箱图中,box (Figure 29)显示了 BS 运行的四分位间距(25th–75th percentile)。水 平绿线代表了 BS 运行的中位值,红线代表了四分位间距外的值。基础运行显示为一个绿色 箱子图作为参考。四分位间距之外的值用红线表示。 在屏幕的底部,基础运行数目显示出来,不能选择;然而,对于 bootstrapping 的基础运 行用黄线表示。用户可以选择他们想看的因子,通过单击因子数目在屏幕底部。物种浓度 的变化显示在底部像图中。四分位间距外的 the base run profile value (blue box)的物种 应被解释仅当评估了两个额外的错误估计结果在 PMF。这些物种影响了 BS 观察值基于 base or BS runs,the DISP and BS-DISP 提供了更可靠的错误估计。 5.9 Base Model BS-DISP Error Estimation BS-DISP 估计了随机和旋转歧义的错误,它运行从 the Base Model Runs screen 的错误 估计部分。BS-DISP 可能花费好多个小时去运行,由于被评估的组合的数量。因此他要求 用户第一次评估 BS-DISP 结果少于 100 次运行(建议 50 次);对于最终的 BS-DISP 结果, 使用 100 次 BS 运行。 BS-DISP 是 BS 和 DISP 方法的组合。BS 错误估计必须先于 BS-DISP 运行,因为每次 BS 重新取样经历一个 DISP 分析因此误差限对所有的 F (profile)因子元素 factor elements。 这个过程可能如下:每一次 DISP 定义了旋转跨度无障碍空间。每一次 BS 重取样围绕这个 空间,随及在不同方向。两者合计,旋转空间的所有复制,在随机的位置,代表了随即不 确定性和旋转不确定性。
得到的极限通过代替因子元素包括旋转歧义和变化有输入数据的不确定性引起的。为了加 快 BS-DISP 的运算,建议所有 F 因子的元素只有一小部分被调整。道琼斯指数加权变量创 建了 DISP 计算的一个特殊的问题。如果这个变化被调整,错误间距将会非常大(基于模拟 数据评估)。Downweighted 的错误估计从调整 non-downweighted species 的结果中得 到最好评估 BS-DISP 提供了与替代有关的 Q 值。偶尔,也可看到替代引起 Q 值的显著降低,通常是 10 到数百个单位。如果这个降低出现在 DISP or BS-DISP 中,他就意味着 the base case solution 实际上不是最低,尽管他被假设成那样。与 Q 显著改变有关的值也被评估,但初 始指导是 Q 改变大于 1%被认为是显著的,如果 Q 改变大于 0.5%,建议增加 Base Model runs 的数目到 40 以发现一个最小。 来自 DISP and BS-DISP 分析的一个重要输出是要素交换的程度,通常从“未明确定义”的解 决方案产生的(例如:一个解决方案,其中的因素识别为流体)。BS-DISP 输出的一个样本 显示在 Figure 30, 伴随着解释。从最可能的解决方案开始,因此能够逐步改变该解决方案,在不显著增加 Q 值得情况下,因此因子身份在改变。在极端的情况下,因子可能改变很多以至于他们交换身 份。这称作要素交换。从物理角度来看,有要素交换的解决方案代表了相同的物理模型相对 于原是解决方案。然而,因素交换的存在,意味着所有的中间解决方案也存在并且必须被视 为替代解决方案。 对于一个高的 dQmax,通常可以得到很大的不确定性区间或 CI。该区间越大,它包含 的不确定真值的机会越大 CI 伴随着配置文件值显示在the BS-DISP 箱图选项卡.dQmax 值也被评估,DISP 的dQmax 为 4,BS-DISP 的值为 0.5,为真正的不确定性估算提供下界.如果输入数据的不确定性是合 理的。 小的 dQmax 值使用在 BBS-DISP 与 DISP 中,因为 bootstrapping and DISP 的组合应捕 获解决方案的几乎所有的不确定性。所有的 dQmax 值应该被评估以确定这个解决方案是否 能很好地被定义。 来自 BS-DISP Summary tab 的样本结果如图 30 所示在使用了来自各源的关键物种(硫酸
盐,钾离子,总的硝酸盐,硅,锌,铁,和 EC)。 在图 30 的 BS-DISP 结果显示这个解决方案没有明显的旋转歧义,基础模型和错误估计可 以被解释。没有交换,dQmax 提供信息:解决方案很好的约束和 BBS-DISP 结果可报告。 If factor swaps are produced at dQmax = 0.5, then the number of factors in the solution and BS and DISP results need to be evaluated before reporting the BS-DISP results. Because the BS-DISP is a combination of BS and DISP, it is suggested that the results of each component be evaluated to understand what might be causing the swaps. Steps to reduce the number of swaps include reducing the number of factors and adding constraints.如果因子互换 在 dQmax = 0.5 产生,解决方案中的因子数目和 BS and DISP 结果应该被评估在报道 BS-DISP 结果之前。因为 BS-DISP 是 BS and DISP 的组合,建议各成分的结果应该被评 估以理解什么可能引起交换。降低交换数目的步骤包括降低因子数和增加限制。 4 个文件被输出来自 BS-DISP,一个用于 dQmax;用户提供的输出文件前缀放置在文件名 的开始,并作为(*)标示在用户指导里,(dQmax=0.5, 1, 2, 4; * _BSDISPres1, *_BSDISPres2, * _BSDISPres3, BS-DISP 总结里。在诊断第一行的 5 个值,显示。 1. k, the number of cases in the file. This includes both the full-data case and the accepted (not rejected) resamples; if all bootstrap cases were accepted, this value would be equal to one plus the number of bootstraps (the extra one run is an initialization run). If no cases were excluded, k should be equal to the number of bootstraps times the number of factors times the number of species selected for BS-DISP. 2. Largest decrease of Q. A large value is not necessarily alarming, but it indicates that there was at least one resample where a deeper minimum appeared. A large value for a decrease in Q is approximately 1% or more of Q(robust); more testing is required to provide better guidance on this value. 3. Number of cases with drop of Q. 4. Number of cases with swap in best fit. 5. Number of cases with swap in DISP *_BSDISPres4)。这些包含相同的诊断总结提供在
分享到:
收藏