logo资料库

SAS_EM实现神经网络.pdf

第1页 / 共34页
第2页 / 共34页
第3页 / 共34页
第4页 / 共34页
第5页 / 共34页
第6页 / 共34页
第7页 / 共34页
第8页 / 共34页
资料共34页,剩余部分请下载后查看
1. 前言
2. SAS-EM简介
3. 建立工程和流程图
3.1. 启动SAS-EM
3.2. 新建项目和流程图
3.3. 设计流程图
4. 设置流程图节点参数
4.1. Input Data Source
4.2. Transform Variables
4.3. Data Partition
4.4. Neural Network
4.5. Score
4.6. Insight
5. 结果处理
5.1. 拟合与预测
5.2. 权重处理
6. 附录
6.1. 误差处理模板
人工神经网络操作手册 ——SAS-EM 上海新致软件有限公司 2008.12 1. 前言 本文适用于 SAS 9.1.3 本文用于描述用 SAS 的 EM 模块,使用人工神经网络功能的操作和使用。 阅读的人员的基础:了解简单统计知识和人工神经网络的基本原理,能读懂基本的统计 英语,熟练操作办公软件如 word、Excel。 本文包括的内容: SAS 软件 EM 模块的设计及应用,EM 模块各选择项的描述,人工 神经网络实例验证。 2. SAS-EM简介 数据挖掘就是从海量的数据库中选择、探索、识别出有效的、新颖的、具有潜在效用的 乃至最终可以理解的模式以获得商业利益的非平凡的过程。 SAS-EM 将统计分析系统和图形化界面集成在一起,并与 SAS 协会定义了的一种比较 合理的流程——SEMMA,即抽样(Sample)、探索(Explore)、修改(Modify)、建模(Model)、 评估(Assess)紧密结合,对用户友好、直观、灵活、适用方便,使对统计学无经验的用户 也可以理解和使用。 Enterprise Miner 简称 EM,它的运行方式是通过在一个工作空间(workspace)中按照 一定的顺序添加各种可以实现不同功能的节点,然后对不同节点进行相应的设置,最后运行 整个工作流程(workflow),便可以得到相应的结果。 3. 建立工程和流程图 3.1. 启动SAS-EM 启动 SAS 有两种方法: 1. 当桌面上有快捷方式图标时,我们双击图标 即可打开 SAS 工具; 2. 当 没 有 快 捷 方 式 图 标 时 , 我 们 需 要 找 到 SAS9.1.3 的 安 装 目 录 x:\Program Files\SAS\SAS 9.1(x 是磁盘盘符)下的 sas.exe 文件,双击亦可启动 SAS 程序,运 行后的界面见下图.
观察各窗体的标题即知道其功能,启动 SAS-EM 有以下几种方法: 1. 命令方式:在命令行输入 miner 然后回车; 2. 菜单方式:在菜单栏依次选择解决方案——>分析——>企业数据挖掘(见下图) 这两种方法均可启动 SAS-EM 模块。默认情况下,显示的是上次运行过的项目和 流程图,若是第一次使用,项目名是计算机的用户名,流程图名是显示 Untitled。界面 见下图:
3.2. 新建项目和流程图 在菜单栏依次选择文件——>新建——>项目,即出现设置对话框:
分别要求输入项目名和存储路径,默认情况下是安装 SAS 时选择的路径,我们根据自 , 设 置 自 己 的 路 径 C:\Documents and 己 需 要 先 设 置 存 储 路 径 , 点 击 Settings\Administrator\ 桌 面 , 然 后 在 Name 下 面 的 设 置 自 己 的 项 目 名 为 Predict , 点 击 ,就创建了我们的项目;选定工程名 Predict 下面的流程图,可以给自己的流程 图重命名,由于我们使用的是人工神经网络模型,所以命名为 Ann,注意 SAS 文件命名规 则,可以是字母、数字、下划线等,但是开头必须是字母。此时我们的项目及流程图变为如 下所示: 3.3. 设计流程图 整个 SAS-EM 过程遵循 SEMMA 步骤,即抽样——探索——转换——建模——评估。 给流程图添加节点的方法有如下几种: 1) 按住工具栏(如下图)上的节点,将其拖到工作区域;
2) 点击流程图区域 选择需要的节点拖到工作区; 下方的 tools 选项卡,展开树形结构, 3) 在工作区点右键选择 Add node…或者双击工作区,在出现的 Node types 中选择对 应的节点。 我们本次操作需要的流程图大致如下图: 首先解释一下各个节点: Input Data Source :输入数据,设置输入变量和目标变量; Transform Variables:转换数据,对数据进行归一化,标准化等; Data Partition:对数据进行分层,本模型需要将输入数据分为训练集、生效集、测试集; Neural Network:人工神经网络节点,本模型选择此节点; Score:得分节点,整个模型运行的代码和过程存储在此节点; Insight:用于显示程序运行的结果。 4. 设置流程图节点参数 4.1. Input Data Source 输入数据前,我们首先将自己的数据导入 SAS 逻辑库,通常有两种办法:写代码和手 工导入,前一种用于数据较规则,数据量少的情况;后一种比较简单,特别适用于大量数据 的导入,我们此次采取后种。
我们要导入文件“test”中的表“输入训练 1”如图: 首先打开 SAS 资源管理器中的逻辑库,如下左图,出现结果如下右图: 除临时逻辑库 work 外,其它均为永久逻辑库,(Course 是自己新建的)点右键新建出 现对话框,如下图:
输入逻辑库名称 course,点击浏览选择保存路径(本次选择的路径是 C:\Documents and Settings\Administrator\桌面),选中复选框启动时启用,可以保证每次运行 SAS 时在逻辑库 能看到自己新建的逻辑库。点击确定即可看到刚建的逻辑库 course。打开此逻辑库,发现什 么都没有,因为我们还没有存放任何数据集。 导入数据(导入数据前不要打开数据源,以免不能导入最新的数据)依次选择菜单栏 文 件——>导入数据(见下图),之后出现对话框:
点击下拉列表框,选择如图示所示(本次选择从 excel 表格中导入),如果有其他格式 的数据,我们可以按要求选择。点击 Next,出现如对话框: 点击浏览,选择我们需要导入数据源的路径,点击 OK,选择需要导入的表,如图:
分享到:
收藏