2016 级数学建模课程论文
论文题目
水果品质综合评价
姓名: 逄誉琛
学号: 20164236 班级:2016 级数学与应用数学
日期:2018 年 11 月 26 日
课程论文成绩:
摘要
水果的品种与水果品质有直接的关系,而外观品质与内在品质又在一定程度上可以
直接反应水果的品质,其中可溶性固形物、可滴定酸、可溶性糖和VC是评价水果内在
品质的直接因素。而我们则需要根据出汁率、可溶性固形物、可滴定酸、可溶性糖、
VC的含量这几个因子来对水果的综合品质进行综合评价。
即,我们须通过研究这五个因子间的内部依赖关系,探求观测数据中得到基本结构,
并尝试用尽可能少的变量来表示他,因此我们尝试使用因子分析法,来找到几个假象变
量来表示他们的基本数据结构。
关于假想变量的选取,我们可以对数据进行标准化后,计算他们的相关系数,再根
据相关系数计算他们的特征值与特征向量已达到求取初等载荷矩阵的目的,有初等载荷
矩阵我们可以计算出各个公共因子的贡献率,并在公共因子中选取主因子。
然后根据回归方法计算各个主因子的得分函数,最后利用各个因子的权值得到权重,
计算最后的综合因子得分公式。
通过该公式我们便可以对各个水果的综合品质进行排序。
摘要:因子分析法 公共因子 主因子 相关系数 初等载荷矩阵 权值
一、 问题的重述
根据水果的出汁率、可溶性固形物、可滴定酸、可溶性糖、VC 的含量这几个公共
因子选出他们的主因子计算各个因子的得分函数来求得因子的综合得分函数。将六种水
果的数据带入后排序得到各个水果的综合品质排序
二、 问题的分析
首先题目中给出了六种水果的五个参数,我们需要对这五个参数进行计算筛选选出
其中的主因子,由标准化之后公共因子计算相关系数,计算特征值与特征向量,求取初
等载荷矩阵,由此矩阵我们可以求得各个公共因子的贡献率,并以累计贡献率≥0.8 为
条件选择主因子,并以贡献率作为权值计算各因子权重,用于单个因子得分函数之后综
合因子得分函数的计算。
三、 符号定义
R:相关系数矩阵
:第 i 个评定对象 i=1,2,3,4,5,6
:第 i 个对象评价对象的第 j 个指标
:第 i 个对象评价对象的第 j 个标准化指标
:第 j 个指标的样本的值
:第 j 个指标的样本的样本标准差。
:标准化指标变量
:第 i 个指标与第 j 个指标的相关系数
:相关系数矩阵 R 的特征值
:相关系数矩阵 R 的特征向量
:初等载荷矩阵
:单个因子因子得分函数
:综合因子得分函数
1:单个因子得分函数系数
四、 模型的建立与求解
可从附录一得到六种水果的出水率,可溶性糖、可滴定酸等数据
试用因子分析法对该六种水果进行综合品质评定。
1)尝试对原始数据进行标准化处理
=16 ;=
样本标准差。
相应的称
,即 ,为第j个指标的样本的值和
通过观察我们可以知道进行因子分析的指标变量一共有5个,分别是1、2、3、4、
5,共有6个评价对象,第i个对象评价对象的第j个指标的取值为,i=1,2,…,6;j=1,2,…,5。
将各指标值转化成标准化指标 ,有
=− ,i=1,2,…,6;j=1,…,5,
=16 (− )2
式中: =16
16−1
=− ,=1,…5
= =16 ∗
6−1 ,i=1,…,5。
相关系数矩阵R=()5∗5,有
式中:=1;=,为第i个指标与第j个指标的相关系数。
计算相关系数矩阵R的特征值1≥…≥5≥0,及对应上午特征向量1,…,5,其中
=[1,…,5]T ,初等载荷矩阵
1=[ 11,22,33,44,55]。
4)选择x个主因子(这里我们取x为3,使累计因子贡献率大于等于80)
为标准化指标变量。
2)计算相关系数矩阵R
3)计算初等载荷矩阵
根据初等载荷矩阵,计算各个公共因子的贡献率,并选择m个主因子。对提取的因
子载荷矩阵进行旋转,得到矩阵Λ2= Λ1(其中Λ1 为Λ1的前m列,T为正交矩阵),
构造因子模型
1 =111+…+1
...
5 =511+…+5
2= 11 ⋯ 1
⋱
⋮
⋮
1 ⋯ 。
式中
则有
且
5}计算因子得分,进行综合评价
用回归方法求单个因子因子得分函数
=11 +22 +33 +44 +55 ,j=1,2,3。
=11 +22 +33 +44 +55 ,i=1,2,…,6;j=1,2,3。
记第i个样点对第j个因子得分的估计值
11 21
15 25 35 −1Λ2
⋮
⋮
=( )6∗5=0−1Λ2,
式中:0=( )6∗5为原始数据标准数据矩阵;R为相关系数矩阵;Λ2为上一步骤中得
31⋮
到的载荷矩阵。
计算得到三个因子的得分函数为
1=−0.10961 +0.12322 +0.00743 −0.45464 +0.61885
2=0.01231 +0.50972 −0.50963 +0.17644 +0.20255
3=0.96481 +0.11822 +0.08723 -0.08234 −0.18025
利用综合得分因子公式
F=34.911+34.812+21.13
90.82
五、 参考文献
[1]司守奎 孙兆亮,数学模型算法与应用,国防工业出版社,2017.9
六、 附录
load aaaaa.txt
n=size(aaaaa,1);
x=aaaaa(:,[1:5]);%提出自变量
x=zscore(x);%数据标准化
r=corrcoef(x);%求相关系数矩阵
[vec1,val,con1]=pcacov(r);%进行主成分分析的相关计算
f1=repmat(sign(sum(vec1)),size(vec1,1),1);
vec2=vec1.*f1;%特征向量正负号转换
f2=repmat(sqrt(val)',size(vec2,1),1);
a=vec2.*f2;%求初等载荷矩阵
num=input('请选择主因子的个数:');%交互式选择主因子个数
am=a(:,[1:num]);%提出 num 个主因子的载荷矩阵
[bm,t]=rotatefactors(am,'method','varimax');%am 旋转变换,bm 为旋转后的载荷矩阵
bt=[bm,a(:,[num+1:end])];%旋转后全部因子的载荷矩阵,前两个旋转,后面不旋转
con2=sum(bt.^2);%计算因子贡献
check=[con1,con2'/sum(con2)*100];
rate=con2(1:num)/sum(con2);%计算因子贡献率
coef=r\bm;%计算得分函数的系数
score=x*coef;%计算各个因子的得分
weight=rate/sum(rate);%计算得分的权重
Tscore=score*weight';%对各个因子的得分进行加权求和,即求各水果综合得分
[STscore,ind]=sort(Tscore,'descend');%对水果进行排序
display=[score(ind,:)';STscore';ind'];%显示排序结果
由图可知,最好的水果品质排序为
水果 4,水果 3,水果 2,水果 1,水果 6,水果 5