人工神经网络操作手册
——SAS-EM
上海新致软件有限公司 2008.12
1. 前言
本文适用于 SAS 9.1.3
本文用于描述用 SAS 的 EM 模块,使用人工神经网络功能的操作和使用。
阅读的人员的基础:了解简单统计知识和人工神经网络的基本原理,能读懂基本的统计
英语,熟练操作办公软件如 word、Excel。
本文包括的内容: SAS 软件 EM 模块的设计及应用,EM 模块各选择项的描述,人工
神经网络实例验证。
2. SAS-EM简介
数据挖掘就是从海量的数据库中选择、探索、识别出有效的、新颖的、具有潜在效用的
乃至最终可以理解的模式以获得商业利益的非平凡的过程。
SAS-EM 将统计分析系统和图形化界面集成在一起,并与 SAS 协会定义了的一种比较
合理的流程——SEMMA,即抽样(Sample)、探索(Explore)、修改(Modify)、建模(Model)、
评估(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户
也可以理解和使用。
Enterprise Miner 简称 EM,它的运行方式是通过在一个工作空间(workspace)中按照
一定的顺序添加各种可以实现不同功能的节点,然后对不同节点进行相应的设置,最后运行
整个工作流程(workflow),便可以得到相应的结果。
3. 建立工程和流程图
3.1. 启动SAS-EM
启动 SAS 有两种方法:
1. 当桌面上有快捷方式图标时,我们双击图标
即可打开 SAS 工具;
2. 当 没 有 快 捷 方 式 图 标 时 , 我 们 需 要 找 到 SAS9.1.3 的 安 装 目 录 x:\Program
Files\SAS\SAS 9.1(x 是磁盘盘符)下的 sas.exe 文件,双击亦可启动 SAS 程序,运
行后的界面见下图.
观察各窗体的标题即知道其功能,启动 SAS-EM 有以下几种方法:
1. 命令方式:在命令行输入 miner 然后回车;
2. 菜单方式:在菜单栏依次选择解决方案——>分析——>企业数据挖掘(见下图)
这两种方法均可启动 SAS-EM 模块。默认情况下,显示的是上次运行过的项目和
流程图,若是第一次使用,项目名是计算机的用户名,流程图名是显示 Untitled。界面
见下图:
3.2. 新建项目和流程图
在菜单栏依次选择文件——>新建——>项目,即出现设置对话框:
分别要求输入项目名和存储路径,默认情况下是安装 SAS 时选择的路径,我们根据自
, 设 置 自 己 的 路 径 C:\Documents and
己 需 要 先 设 置 存 储 路 径 , 点 击
Settings\Administrator\ 桌 面 , 然 后 在 Name 下 面 的 设 置 自 己 的 项 目 名 为 Predict , 点 击
,就创建了我们的项目;选定工程名 Predict 下面的流程图,可以给自己的流程
图重命名,由于我们使用的是人工神经网络模型,所以命名为 Ann,注意 SAS 文件命名规
则,可以是字母、数字、下划线等,但是开头必须是字母。此时我们的项目及流程图变为如
下所示:
3.3. 设计流程图
整个 SAS-EM 过程遵循 SEMMA 步骤,即抽样——探索——转换——建模——评估。
给流程图添加节点的方法有如下几种:
1) 按住工具栏(如下图)上的节点,将其拖到工作区域;
2) 点击流程图区域
选择需要的节点拖到工作区;
下方的 tools 选项卡,展开树形结构,
3) 在工作区点右键选择 Add node…或者双击工作区,在出现的 Node types 中选择对
应的节点。
我们本次操作需要的流程图大致如下图:
首先解释一下各个节点:
Input Data Source :输入数据,设置输入变量和目标变量;
Transform Variables:转换数据,对数据进行归一化,标准化等;
Data Partition:对数据进行分层,本模型需要将输入数据分为训练集、生效集、测试集;
Neural Network:人工神经网络节点,本模型选择此节点;
Score:得分节点,整个模型运行的代码和过程存储在此节点;
Insight:用于显示程序运行的结果。
4. 设置流程图节点参数
4.1. Input Data Source
输入数据前,我们首先将自己的数据导入 SAS 逻辑库,通常有两种办法:写代码和手
工导入,前一种用于数据较规则,数据量少的情况;后一种比较简单,特别适用于大量数据
的导入,我们此次采取后种。
我们要导入文件“test”中的表“输入训练 1”如图:
首先打开 SAS 资源管理器中的逻辑库,如下左图,出现结果如下右图:
除临时逻辑库 work 外,其它均为永久逻辑库,(Course 是自己新建的)点右键新建出
现对话框,如下图:
输入逻辑库名称 course,点击浏览选择保存路径(本次选择的路径是 C:\Documents and
Settings\Administrator\桌面),选中复选框启动时启用,可以保证每次运行 SAS 时在逻辑库
能看到自己新建的逻辑库。点击确定即可看到刚建的逻辑库 course。打开此逻辑库,发现什
么都没有,因为我们还没有存放任何数据集。
导入数据(导入数据前不要打开数据源,以免不能导入最新的数据)依次选择菜单栏 文
件——>导入数据(见下图),之后出现对话框:
点击下拉列表框,选择如图示所示(本次选择从 excel 表格中导入),如果有其他格式
的数据,我们可以按要求选择。点击 Next,出现如对话框:
点击浏览,选择我们需要导入数据源的路径,点击 OK,选择需要导入的表,如图: