logo资料库

数据仓库与数据挖掘课程实验.pdf

第1页 / 共13页
第2页 / 共13页
第3页 / 共13页
第4页 / 共13页
第5页 / 共13页
第6页 / 共13页
第7页 / 共13页
第8页 / 共13页
资料共13页,剩余部分请下载后查看
Data mining and Data warehouse ©2007 成都信息工程学院电子商务系 赵卓宁 编写
数据仓库与数据挖掘课程实验 本实验是《数据仓库与数据挖掘》课程的验证性实验环节。 课程共计 8 学时。 ·实验目标: 1、 掌握建立和配置数据仓库的基本操作技能。主要包括数据仓库系统的安装。 2、 掌握数据仓库中数据的处理技术。主要包括数据仓库的建模、事务数据的转换、 3、 掌握基于数据仓库的自动数据分析技术的基本操作技能。包括多维数据分析和 备份数据的恢复。 数据挖掘。 4、 掌握一种专用数据挖掘软件,用以分析处理文本或电子表格的数据。 实验环境: l Microsoft SQLServer2000 l Microsoft SQLServer2000 Analysis Servce l DBMiner2.0 l Microsoft SQLServer2000 PACK4 l JAVA 运行时环境:JRE5.0 l WEKA3.55 实验项目: l 实验 1:安装数据仓库系统平台 l 实验 2:构建数据仓库数据环境 l 实验 3:多维数据分析 l 实验 4:基于数据仓库的数据挖掘实验 l 实验 5:数据挖掘平台应用实验 1.5 学时 1.5 学时 1.5 学时 2.0 学时 1.5 学时
实验 1:安装数据仓库系统平台 l 实验任务: 1.掌握 Microsoft Server2000 数据仓库系统的安装与配置 2.安装实验分析环境: 1)安装 Microsoft Server2000 analysis Service 2)安装 DBMiner2.0 3) 安装 Java 运行时环境 JRE5.0 4)安装 WEKA l 实验准备: 请从黑板或网上获取安装文件所在的网络地址。并记在下面: 网络资料的地址是:_____________________________________________ 本实验不得超过 1.5 学时。 l 实验指导: Lab1.1 检查并安装 Microsoft Server2000 单元目标: 确保完整正确的数据仓库实验环境 工作步骤: 1.检查你所使用的电脑上是否有 Microsoft Server2000 。如果有,启动并检 查 Microsoft Server2000 是否安装了 Server Pack3 以上的补丁文件。 2.如果以上都没问题,则本实验结束。 3.下载相应的系统文件安装。先安装 Microsoft Server2000, 再安装 Server Pack3 或 Server Pack4。 Lab1.2 检查并安装数据分析环境 单元目标: 确保安装了相应的数据分析软件 工作步骤: 1. 检 查 你 所 使 用的 电 脑 是 否 安 装 了 Microsoft Server2000 analysis Service,DBMiner2.0, JRE5.0, WEKA3.5.5 。如果都已安装且能正常 运行,则本实验结束。否则进入以下步骤。 2. 如果没有安装以上软件。请按以下次序从网络资料地址上下载软件完成 安装。 完成 Lab1.1 和 Lab1,2 后,本实验结束。
实验 2:构建数据仓库数据环境 l 实验任务: 本实验主要验证 ETL 的数据处理过程。主要实验任务有: 1.构建数据仓库模型,并在数据仓库系统中生成相应的数据表。 2.将事务数据库中的数据转入数据仓库中。 3.还原备份和还原的数据仓库中的数据。 l 实验准备: 请从黑板或网上获取数据文件所在的网络地址。并记在下面: 数据文件的地址是:_____________________________________________ 本实验不得超过 1.5 学时。 本实验将使用 Microsoft SQLserver 的示例数据库:Northwind,这是一个商贸公司 的销售数据库。我们将这个事务型的数据导入到分析型的数据仓库中去。 l 实验指导: Lab2.1 用 caseStudio2.15 建立数据仓库的星型模型 单元目标: 建立 Northwind_DW 的数据仓库模型。如下图所示。并根据该模型生成相应 的数据仓库的维表和事实表的结构。 工作步骤: 1. 按下图样式建立 Northwind_DW 的昨型数据模型,请根据原事务数据库中 相应字段的数据类型和宽度,对应地设计相应字段的数据类型和宽度。
2. 安装并启动 CaseStudio2.15,设计以上模型。 3. 运行生成脚本(Generate script)生成相应的 SQL 代码。 Lab2.2 将事务型数据加载到分析数据环境中 单元目标: 根据以上实验单元建立的数据模型,在 MicrosoftSQL2000 中建立相应的物理 数据仓库。 工作步骤: 1. 请从教师课件中“数据仓库与数据挖掘”目录下的 Lab2008 中下载文档 “多维数据分析操作演练.pdf ” 2. 用 Adobe reader 打开该文档。 3. 在数据仓库创建部分,可以使用 Lab2.1 中的模型进行创建和转化。 4. 按照上面所列步骤进行操作。最终完成事实表和维表的数据转移。 1.将已生成的数据仓库的数据进行备份。 Lab2.3 数据仓库中数据的备份与恢复 单元目标: 2.利用备份文件向新的数据库中还原数据仓库的数据。 工作步骤: 1、备份 打开 Sqlserver 企业管理器,在需要备份的数据库上点鼠标右键,所有任务中 选备份数据库。 再从 Sqlserver 安装目录中的 Data 目录下,拷贝出要备份的数据库文件 *.mdf,*.ldf,并备份这两个文件 2、还原 将要还原的数据库文件*.mdf,*.ldf 拷贝到 Sqlserver 安装目录下的 Data 目录 下。打开 Sqlserver 企业管理器,新建一个数据库,在数据库这一项上点鼠标 右键,在所有任务中选导入数据库,以拷贝到 Data 目录下的 mdf 恢复数据库。 还原过程中,如果有什么异常,请参考“数据仓库与数据挖掘技术\上机\”目 录下的“数据仓库实习指导.pdf ”中的还原部分的内容。
实验 3:多维数据分析 l 实验任务: 本实验主要验证 OLAP 多维分析的过程。主要包括完成 OLAP 数据库的创建,多 维数据集的创建。存储和处理多维数据,浏览多维数据集等实验任务。 l 实验准备: 本实验使用的操作参考为 Lab2.2 中下载的文档,“多维数据分析操作演练.pdf ”。 本实验不得超过 1.5 学时。 l 实验指导: Lab3.1 多维数据分析实验 单元目标: 2.在使用过程中熟悉和理解相应的概念。 工作步骤: 1.掌握 Microsoft analysis Service 的中对 OALP 数据库的操作步骤 1. 在“多维数据分析操作演练.pdf ”中从 P85 开始进行相应的操作演练。 2. 在实验过程中,如果对相应的操作还不是很理解,请在” 数据仓库 与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档,解 压后,有详细的帮助和演练信息。
实验 4:基于数据仓库的数据挖掘实验 l 实验任务: 1. 基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘模型对数据 仓库中的数据进行决策树分析和聚类分析; 2. 使用 DBMiner2.0 对数据仓库中的数据进行聚类、关联分析; 3. 使用 DBMiner2.0 对数据仓库的数据分析进行可视化。 l 实验准备: 本实验的实验指导参考资料在网上,请下载参考。 本实验不得超过 1.5 学时。 l 实验指导: Lab4.1 基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘 单元目标: 掌握 Microsoft SQLserver2000 Analyses Service的数据挖掘模型的使用步骤 工作步骤: 请在” 数据仓库与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档, 解压后,按下图所指,完成“数据挖掘”的演练。 Lab4.2 基于 DBMiner2.0 的数据挖掘 (选做) 单元目标: 掌握 DBminer2.0 对数据仓库中的数据进行可视化分类、聚类、关联分析 由于时间有限,指导教师将进行一些现场的演练指导。
1. 在” 数据 仓库 与数据挖 掘 技术 \Lab2008\” 目录 下下载 相应的操 作手册 “DBMinerManual.pdf ”文档,阅读第一、二章。 2. 对多维数据集进行可视化分析。(chapter 4) 3. 对多维数据集进行关联分析。(chapter 6) 4. 对多维数据集进行分类挖掘。(chapter 7) 5. 对多维数据集进行聚类分析。(chapter 8) 工作步骤:
分享到:
收藏