Canoco for Windows 4.5
中文简明教程
2009-9
第一章 CANOCO 简介
一 软件功能
Canoco for Windows 是新一代的 CANOCO 软件,是生态学应用软件中用于约束与非约
束排序的最流行工具。Canoco for Windows 整合了排序以及回归和排列方法学,以便得到健
全的生态数据统计模型。Canoco for Windows 包括线性和曲线单峰方法。使用 Canoco for
Windows 进行排序,能够洞察:
● 生物群落结构
● 植物与动物群落以及它们的环境之间的联系
● 一个对环境和(或)其生物群落的假设冲击所能造成的影响
● 在生物群落上进行的复杂生态学和生态毒理学实验的相关处理所能造成的影响
一个排序被计算出来后,排序图可以立即显示在显示器上。Canoco 具体独特的能力,可
以说明用协变量表示的背景变异,而用它的扩展工具来进行排列测试,包括测试的互动效果。
这些独特的特性使得 Canoco for Windows 能特别有效的解决应用研究方面的问题。
二 软件模块
The Canoco for Windows 软件包主要包含以下几个模块:
● Canoco for Windows:软件包的核心,用来指定要分析的数据和排序模型,排序方法
以及分析结果的查看等基本操作命令均被集中在该模块的对话框中
● WcanoImp:将以电子表格形式(Excel 等)保存的外部数据转化为 CANOCO 识别的
形式
● CanoDraw 4.0 for Windows:用来绘制各种类型的排序图,同时也可以生成多种等值
线和回归模型图,并进一步深层次发掘排序结果,该模块可以直接从主程序界面工
具栏激活
● CanoMerge:合并 Canoco 识别的 dta 类型数据文件,并可以将数据文件以带制表分
隔符的文本形式输出(基本常用统计软件均兼容该类型文件),同时该模块具有滤掉
低频率物种的功能
● PrCoord:对特定数据集进行主坐标分析以及冗余分析
三 统计方法
这里只简要阐述 CANOCO 具有的统计分析方法,不做赘述,后面章节将详细论述操作
步骤。主要分析方法有以下四大类型:
A 非约束型排序方法(Unconstrained ordination methods)
主成分分析 (Principal components analysis,PCA)
对应分析 (Correspondence analysis,CA)
降趋对应分析(去趋势对应分析)(Detrended correspondence analysis,DCA)
主坐标分析 (Principal coordinates analysis,PCoA 或 PCO)
B 约束性排序方法(Constrained ordination methods)
冗余分析 (Redundancy analysis,RDA)
典型对应分析(典范对应分析)(Canonical correspondence analysis,CCA)
降趋典范对应分析 (Detrended canonical correspondence analysis,DCCA)
典型变量分析 (Canonical variate analysis,CVA)
distance-based redundancy analysis (db-RDA)
C 非约束性偏分析法(Partial methods of unconstrained ordination)
partial PCA、 partial CA、 partial DCA
2
D 约束性偏分析法(Partial methods of constrained ordination)
partial RDA 、partial CCA 、partial DCCA 、partial CVA
四 软件模块界面介绍
Canoco for Windows 模块 进入软件后会出现图 1-1 界面,红色矩形所标记部分为快捷
工具栏,鼠标做短暂停留会有英文提示出现,不再赘述。左侧的 Project View 窗口是数据指
定,分类类型选择等一系列功能设置的引导窗口,按步骤操作即可;右边 Log View 窗口用来
记录分析过程和部分统计结果(如四个排序轴统计结果、轴与环境因子的相关性 、蒙特卡罗
检验结果等),其他一些分析结果(如物种、环境因子及样方坐标等)均保存在相应的*.sol
文件中,该文件可以用记事本打开。
图 1-1 Canoco for Windows 模块界面窗口
WCanolmp 模块 该模块在核心模块中没有快捷激活命令,必须常规方式打开。进入
后界面如图 1-2,上边红色框标记部分是关于如何使用该模块的简短说明,下面部分是可选框。
一般情况下在 Excel 中组织原数据时,以行代表样方,以列代表变量,这时第一个选择框就
不需选择;Excel 中组织数据时如果没有将第一行第一列作为样方名行和变量名列,则需要选
择第二和第三选择框,这样该模块会自动为导入的数据添加样方名和变量名;最后一个选择
框可以不用理会,采用默认的不选择状态。设置完成后点击保存按钮,在弹出的对话框中命
名并选择存放位置,即可将剪贴板中的数据文件(从 excel 中复制的)转化为 Canoco 能识别
的类型(*.dta)。
样方名和变量名命名规则:字符不得超过 8 个,字符类型可以为数字、字母、点、连接
符和空格;超过 8 位的,在导入数据时 Wcanolmp 会默认的只保留前八位,并且以点取代不符
合规定的字符
3
图 1-2 WCanolmp 模块界面
CanoDraw 模块 此模块可以在核心模块中快速激活(Project>Run CanoDraw),激活后
界面如图 1-3 所示。此模块这里不做介绍,后面章节有详细介绍。
图 1-3 CanoDraw 模块界面
CanoMerge 模块 核心模块无快捷激活命令,需常规方式打开。进入后界面如图 1-4
所示。“Add file”用来添加文件,需要合并的文件全部在显示框中排列出来后点击“Merge”
按钮,在弹出的对话框中命名并选择存放位置即可。
对话框下部第一个对话框可以用来滤掉一些低频率的物种,框中数字代表包含某一个物
4
种的样方如果少于 X 个,该物种将被剔除。
图 1-4 CanoMerge 模块界面
五 说明
1 本教程只是个人能力范围之内的简明教程,侧重于介绍“是什么”,难免有错误,难免有
地方过于“简”使人看后也没有“明”,因此建议遇到具体问题或对“为什么”有强烈需求的
人一定要参考相关书籍。
2 CANOCO 就像 Excel,不但界面人性易上手,最主要的是能深能浅,但问题是我们不一
定玩的很转,有多少懂 Excel 的人敢说自己真正发挥了其数据处理的高效性?所以学习
CANOCO 也要多练习多总结。
3 目前你所看到的只是一时心血来潮的初稿,内容基本来自于 Multivariate Analysis of
Ecological Data using CANOCO 一书,才疏学浅,至今原版书还有内容尚未看懂,欢迎交流促
进初稿的完善。
5
第二章 CANOCO 基础
一 专业名词(CANOCO 体系中)
解释变量(explanatory variables):相当于自变量,又称预测变量,经常分为主环境变量
(主变量)和协环境变量(协同变量)
响应变量(response variable):相当于因变量,又称物种数据
梯度分析(gradient analysis):即通常所说的排序分析,是揭示物种组成数据和实测或潜
在的环境因子之间关系的方法的总称,或者称为依据出现的物种及其丰富度,将样方依次排
列的多元统计技术的总称,有约束性排序(直接梯度分析)和非约束性排序(间接梯度梯度
分析)之分
约束性排序(constrained ordination):在特定的梯度(排序轴)上探讨物种的变化情况,
冗余分析(RDA)、典型对应分析(CCA)等均属于该范畴
非约束性排序(unstrained ordiantion):在潜在的(或虚拟的)梯度上寻求代表最优的解
释变量来拟合物种的回归模型,主成分分析(PCA)、成分分析(CA)等均属于该范畴
混合排序分析(hybrid ordination analysis):前面若干排序轴采用约束排序,而剩下的轴
是非约束排序的梯度分析方法
偏分析(partical analysis):预先剔除物种变化中由协同变量产生的那部分影响,再通过
排序展示剩下的变化量的排序方法,约束排序和非约束排序均有相应的偏分析方法
物种响应环境梯度模型:所有排序方法都是基于一定的模型之上,这些反应物种和环境
之间关系的以及在某一环境梯度上的种间关系的模型最常用的有两种:线性模型(linear
model)和单峰模型(unimodal model),如图 2-1 所示。
图 2-1 线性模型和单峰模型
二 利用 CANOCO 分析数据典型流程图
利用 CANOCO 分析多元数据的一般流程如图 2-2 所示,图中前两步在上一章中已经介绍,
这里主要以后面三步主要内容进行介绍:
A 排序模型的决定
在 Canoco for Windows 的分析过程中,按照操作步骤会出现一个关于模型的选择窗口,
如图 2-3 所示,究竟是选择线性模型还是单峰模型这里有一个比较简单的判断方法:先对物
种数据进行 DCA 分析,分析完成后在“Log View”窗口中,各特征值分布部分找到“Lengths
of gradient”信息,这一信息代表的是每个排序轴的梯度长度。如果四个轴中梯度最大值超过
4,选择单峰模型比较合适;如果小于 3,线性模型比较合适;介于 3—4 之间,两种模型均
适合。
6
注意:物种数据的量纲不同时不适合做单峰模型排序,即便梯度长度大于 4;有空样方
出现的数据不能顺利进行单峰排序分析,非要采用单峰分析,需要把空样方剔除
图 2-2 CANOCO 分析数据的一般流程
图 2-3 分析模型选择窗口
B 具体排序方法的选择
排序模型确定后需要考虑的是选择何种排序方法,为了选择更合适的排序方法,你尽可
能将各种方法都尝试,选择一个你最想要的分析结果和排序图。各种排序方法的具体的特征
和操作方法将在接下来的章节详细介绍,基本的排序方法和排序模型对照表如表 2-1 所示
直接梯度分析(约束性排排序)
间接梯度分析(非约束性排序)
线性模型
RDA
PCA
单峰模型
CCA
CA、DCA
表 2-1 基本排序方法和排序模型对照表
C CanoDraw 做图
在介绍如何使用 CanoDraw 做图之前,必须考虑以下两点:
★ 明确环境因子里面是否有定性变量,这些变量必须预先选出来,然后才能用于生成排
序图,预选方法:Project>Nominal variables······
7
★ 对于分量很小,于排序图的解释没有多少参考价值的稀有种,可以将这些物种不在排
序图中展示出来。一般可以通过两个标准来选择保留的物种:物种适合度(species fit)和
物种的权重(species weight)。前者表示每个物种变化被排序空间所能展示的百分比;后者
等于某物种在所在样方内多度之和与所有物种多度之和的比,且仅仅在单峰排序里面有应用
价值,你可以自行设置权重值,只有高于该值的物种才能纳入排序图里面。两个标准实现方
法:Project>Setting>Inclusion Rules······
利用 CanoDraw 制作排序图具体操作步骤如下:
1 直接在 Canoco for Windows 窗口中“Project View”对话框点击右侧“CanoDraw”或
通过“Project>Run CanoDraw”命令激活 CanoDraw 程序,出现如下对话框,作用是用来保
存 CanoDraw project 文件(*.cdw)
图 2-4 CanoDraw 模块文件保存窗口
2 环境变量中如果有形式变量,在生成排序图之前可以通过以下命令对其进行相关设置:
Project>Nominal variables>Environmental variables,打开如下对话框后,利用中间的“Select”
将左侧环境变量列表中的形式标量筛选到右侧即可
3 根据自己试验数据,没有其他特别需要的话,接下来就可以生成排序图了,通过 Create
菜单下的子菜单可以生成不同类型的排序图,这里我们以 Biplots and joint Plots>Species and
evi. Variables 命令为例,生成 2-5 排序图。
4 如果对排序图标记符号、文字等不太满意还可以进行设置。首先利用鼠标(左键单击)
选定你希望改变的对象(文字或线条等),之后利用 F5 键激活属性窗口,如图 2-6,在该窗口
你可以对标记符号、文字、线条等进行相关设置。如果你需要改动的地方比较多,可以在选
定一个对象后点击鼠标右键,弹出图 2-7 快捷菜单后利用 Selec Suchlike 命令选定所有类似的
对象,再利用上述方法对所有对象进行属性更改。当然,你也可以通过 View > Visual Attributes
命令激活图 2-8 对话框进行相关设置,这里不再赘述。
修改美化完成后的属性图可以保存为*.cdg 类型文件,或直接输出为 bmp、png 等类型的
图像文件。
注意:关于排序图的解读这里不做叙述,后面有专门章节对其进行重点介绍
8