Data mining and Data warehouse
©2007 成都信息工程学院电子商务系 赵卓宁 编写
数据仓库与数据挖掘课程实验
本实验是《数据仓库与数据挖掘》课程的验证性实验环节。
课程共计 8 学时。
·实验目标:
1、 掌握建立和配置数据仓库的基本操作技能。主要包括数据仓库系统的安装。
2、 掌握数据仓库中数据的处理技术。主要包括数据仓库的建模、事务数据的转换、
3、 掌握基于数据仓库的自动数据分析技术的基本操作技能。包括多维数据分析和
备份数据的恢复。
数据挖掘。
4、 掌握一种专用数据挖掘软件,用以分析处理文本或电子表格的数据。
实验环境:
l Microsoft SQLServer2000
l Microsoft SQLServer2000 Analysis Servce
l DBMiner2.0
l Microsoft SQLServer2000 PACK4
l JAVA 运行时环境:JRE5.0
l WEKA3.55
实验项目:
l 实验 1:安装数据仓库系统平台
l 实验 2:构建数据仓库数据环境
l 实验 3:多维数据分析
l 实验 4:基于数据仓库的数据挖掘实验
l 实验 5:数据挖掘平台应用实验
1.5 学时
1.5 学时
1.5 学时
2.0 学时
1.5 学时
实验 1:安装数据仓库系统平台
l 实验任务:
1.掌握 Microsoft Server2000 数据仓库系统的安装与配置
2.安装实验分析环境:
1)安装 Microsoft Server2000 analysis Service
2)安装 DBMiner2.0
3) 安装 Java 运行时环境 JRE5.0
4)安装 WEKA
l 实验准备:
请从黑板或网上获取安装文件所在的网络地址。并记在下面:
网络资料的地址是:_____________________________________________
本实验不得超过 1.5 学时。
l 实验指导:
Lab1.1 检查并安装 Microsoft Server2000
单元目标:
确保完整正确的数据仓库实验环境
工作步骤:
1.检查你所使用的电脑上是否有 Microsoft Server2000 。如果有,启动并检
查 Microsoft Server2000 是否安装了 Server Pack3 以上的补丁文件。
2.如果以上都没问题,则本实验结束。
3.下载相应的系统文件安装。先安装 Microsoft Server2000, 再安装 Server
Pack3 或 Server Pack4。
Lab1.2 检查并安装数据分析环境
单元目标:
确保安装了相应的数据分析软件
工作步骤:
1. 检 查 你 所 使 用的 电 脑 是 否 安 装 了 Microsoft Server2000 analysis
Service,DBMiner2.0, JRE5.0, WEKA3.5.5 。如果都已安装且能正常
运行,则本实验结束。否则进入以下步骤。
2. 如果没有安装以上软件。请按以下次序从网络资料地址上下载软件完成
安装。
完成 Lab1.1 和 Lab1,2 后,本实验结束。
实验 2:构建数据仓库数据环境
l 实验任务:
本实验主要验证 ETL 的数据处理过程。主要实验任务有:
1.构建数据仓库模型,并在数据仓库系统中生成相应的数据表。
2.将事务数据库中的数据转入数据仓库中。
3.还原备份和还原的数据仓库中的数据。
l 实验准备:
请从黑板或网上获取数据文件所在的网络地址。并记在下面:
数据文件的地址是:_____________________________________________
本实验不得超过 1.5 学时。
本实验将使用 Microsoft SQLserver 的示例数据库:Northwind,这是一个商贸公司
的销售数据库。我们将这个事务型的数据导入到分析型的数据仓库中去。
l 实验指导:
Lab2.1 用 caseStudio2.15 建立数据仓库的星型模型
单元目标:
建立 Northwind_DW 的数据仓库模型。如下图所示。并根据该模型生成相应
的数据仓库的维表和事实表的结构。
工作步骤:
1. 按下图样式建立 Northwind_DW 的昨型数据模型,请根据原事务数据库中
相应字段的数据类型和宽度,对应地设计相应字段的数据类型和宽度。
2. 安装并启动 CaseStudio2.15,设计以上模型。
3. 运行生成脚本(Generate script)生成相应的 SQL 代码。
Lab2.2 将事务型数据加载到分析数据环境中
单元目标:
根据以上实验单元建立的数据模型,在 MicrosoftSQL2000 中建立相应的物理
数据仓库。
工作步骤:
1. 请从教师课件中“数据仓库与数据挖掘”目录下的 Lab2008 中下载文档
“多维数据分析操作演练.pdf ”
2. 用 Adobe reader 打开该文档。
3. 在数据仓库创建部分,可以使用 Lab2.1 中的模型进行创建和转化。
4. 按照上面所列步骤进行操作。最终完成事实表和维表的数据转移。
1.将已生成的数据仓库的数据进行备份。
Lab2.3 数据仓库中数据的备份与恢复
单元目标:
2.利用备份文件向新的数据库中还原数据仓库的数据。
工作步骤:
1、备份
打开 Sqlserver 企业管理器,在需要备份的数据库上点鼠标右键,所有任务中
选备份数据库。
再从 Sqlserver 安装目录中的 Data 目录下,拷贝出要备份的数据库文件
*.mdf,*.ldf,并备份这两个文件
2、还原
将要还原的数据库文件*.mdf,*.ldf 拷贝到 Sqlserver 安装目录下的 Data 目录
下。打开 Sqlserver 企业管理器,新建一个数据库,在数据库这一项上点鼠标
右键,在所有任务中选导入数据库,以拷贝到 Data 目录下的 mdf 恢复数据库。
还原过程中,如果有什么异常,请参考“数据仓库与数据挖掘技术\上机\”目
录下的“数据仓库实习指导.pdf ”中的还原部分的内容。
实验 3:多维数据分析
l 实验任务:
本实验主要验证 OLAP 多维分析的过程。主要包括完成 OLAP 数据库的创建,多
维数据集的创建。存储和处理多维数据,浏览多维数据集等实验任务。
l 实验准备:
本实验使用的操作参考为 Lab2.2 中下载的文档,“多维数据分析操作演练.pdf ”。
本实验不得超过 1.5 学时。
l 实验指导:
Lab3.1 多维数据分析实验
单元目标:
2.在使用过程中熟悉和理解相应的概念。
工作步骤:
1.掌握 Microsoft analysis Service 的中对 OALP 数据库的操作步骤
1. 在“多维数据分析操作演练.pdf ”中从 P85 开始进行相应的操作演练。
2. 在实验过程中,如果对相应的操作还不是很理解,请在” 数据仓库
与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档,解
压后,有详细的帮助和演练信息。
实验 4:基于数据仓库的数据挖掘实验
l 实验任务:
1. 基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘模型对数据
仓库中的数据进行决策树分析和聚类分析;
2. 使用 DBMiner2.0 对数据仓库中的数据进行聚类、关联分析;
3. 使用 DBMiner2.0 对数据仓库的数据分析进行可视化。
l 实验准备:
本实验的实验指导参考资料在网上,请下载参考。
本实验不得超过 1.5 学时。
l 实验指导:
Lab4.1 基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘
单元目标:
掌握 Microsoft SQLserver2000 Analyses Service的数据挖掘模型的使用步骤
工作步骤:
请在” 数据仓库与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档,
解压后,按下图所指,完成“数据挖掘”的演练。
Lab4.2 基于 DBMiner2.0 的数据挖掘 (选做)
单元目标:
掌握 DBminer2.0 对数据仓库中的数据进行可视化分类、聚类、关联分析
由于时间有限,指导教师将进行一些现场的演练指导。
1. 在” 数据 仓库 与数据挖 掘 技术 \Lab2008\” 目录 下下载 相应的操 作手册
“DBMinerManual.pdf ”文档,阅读第一、二章。
2. 对多维数据集进行可视化分析。(chapter 4)
3. 对多维数据集进行关联分析。(chapter 6)
4. 对多维数据集进行分类挖掘。(chapter 7)
5. 对多维数据集进行聚类分析。(chapter 8)
工作步骤: