Data mining and Data warehouse   
©2007 成都信息工程学院电子商务系  赵卓宁 编写     
 
数据仓库与数据挖掘课程实验 
 
本实验是《数据仓库与数据挖掘》课程的验证性实验环节。 
课程共计 8 学时。 
 
 
·实验目标: 
1、 掌握建立和配置数据仓库的基本操作技能。主要包括数据仓库系统的安装。 
2、 掌握数据仓库中数据的处理技术。主要包括数据仓库的建模、事务数据的转换、
3、 掌握基于数据仓库的自动数据分析技术的基本操作技能。包括多维数据分析和
备份数据的恢复。 
数据挖掘。 
4、 掌握一种专用数据挖掘软件,用以分析处理文本或电子表格的数据。 
 
实验环境: 
l Microsoft SQLServer2000   
l Microsoft SQLServer2000 Analysis Servce 
l DBMiner2.0 
l Microsoft SQLServer2000 PACK4 
l JAVA 运行时环境:JRE5.0 
l WEKA3.55 
 
实验项目: 
 
l  实验 1:安装数据仓库系统平台   
 
l  实验 2:构建数据仓库数据环境  
l  实验 3:多维数据分析   
 
 
l  实验 4:基于数据仓库的数据挖掘实验   
l  实验 5:数据挖掘平台应用实验  
 
 
1.5 学时 
1.5 学时 
1.5 学时 
2.0 学时 
1.5 学时 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
实验 1:安装数据仓库系统平台 
 
l  实验任务: 
1.掌握 Microsoft Server2000  数据仓库系统的安装与配置 
2.安装实验分析环境: 
 
1)安装 Microsoft Server2000 analysis Service 
2)安装 DBMiner2.0 
3)  安装 Java 运行时环境 JRE5.0 
4)安装 WEKA 
 
l  实验准备: 
请从黑板或网上获取安装文件所在的网络地址。并记在下面: 
网络资料的地址是:_____________________________________________ 
本实验不得超过 1.5 学时。 
 
l  实验指导: 
Lab1.1   检查并安装 Microsoft Server2000           
单元目标: 
  确保完整正确的数据仓库实验环境 
 
工作步骤: 
      1.检查你所使用的电脑上是否有 Microsoft Server2000 。如果有,启动并检
查 Microsoft Server2000  是否安装了 Server Pack3 以上的补丁文件。 
 
2.如果以上都没问题,则本实验结束。 
3.下载相应的系统文件安装。先安装 Microsoft Server2000, 再安装 Server 
Pack3 或 Server Pack4。 
 
Lab1.2   检查并安装数据分析环境                       
单元目标: 
  确保安装了相应的数据分析软件 
 
工作步骤: 
1.  检 查 你 所 使 用的 电 脑 是 否 安 装 了 Microsoft Server2000 analysis 
Service,DBMiner2.0, JRE5.0, WEKA3.5.5 。如果都已安装且能正常
运行,则本实验结束。否则进入以下步骤。 
2.  如果没有安装以上软件。请按以下次序从网络资料地址上下载软件完成
安装。 
完成 Lab1.1  和 Lab1,2 后,本实验结束。 
 
 
实验 2:构建数据仓库数据环境 
 
l  实验任务: 
本实验主要验证 ETL 的数据处理过程。主要实验任务有: 
1.构建数据仓库模型,并在数据仓库系统中生成相应的数据表。 
2.将事务数据库中的数据转入数据仓库中。 
3.还原备份和还原的数据仓库中的数据。 
 
 
l  实验准备: 
请从黑板或网上获取数据文件所在的网络地址。并记在下面: 
数据文件的地址是:_____________________________________________ 
本实验不得超过 1.5 学时。 
本实验将使用 Microsoft SQLserver 的示例数据库:Northwind,这是一个商贸公司
的销售数据库。我们将这个事务型的数据导入到分析型的数据仓库中去。 
 
l  实验指导: 
Lab2.1  用 caseStudio2.15  建立数据仓库的星型模型                         
单元目标: 
建立 Northwind_DW 的数据仓库模型。如下图所示。并根据该模型生成相应
的数据仓库的维表和事实表的结构。 
 
工作步骤: 
1.  按下图样式建立 Northwind_DW 的昨型数据模型,请根据原事务数据库中
相应字段的数据类型和宽度,对应地设计相应字段的数据类型和宽度。 
 
2.  安装并启动 CaseStudio2.15,设计以上模型。 
3.  运行生成脚本(Generate script)生成相应的 SQL 代码。 
 
Lab2.2  将事务型数据加载到分析数据环境中                        
单元目标: 
  根据以上实验单元建立的数据模型,在 MicrosoftSQL2000 中建立相应的物理
数据仓库。 
 
工作步骤: 
1.  请从教师课件中“数据仓库与数据挖掘”目录下的 Lab2008 中下载文档
 
 
“多维数据分析操作演练.pdf ” 
2.  用 Adobe reader 打开该文档。 
3.  在数据仓库创建部分,可以使用 Lab2.1 中的模型进行创建和转化。 
4.  按照上面所列步骤进行操作。最终完成事实表和维表的数据转移。 
1.将已生成的数据仓库的数据进行备份。 
 
Lab2.3  数据仓库中数据的备份与恢复                       
单元目标: 
 
        2.利用备份文件向新的数据库中还原数据仓库的数据。 
 
工作步骤: 
1、备份 
打开 Sqlserver 企业管理器,在需要备份的数据库上点鼠标右键,所有任务中
选备份数据库。 
再从 Sqlserver 安装目录中的 Data 目录下,拷贝出要备份的数据库文件
*.mdf,*.ldf,并备份这两个文件 
2、还原 
将要还原的数据库文件*.mdf,*.ldf 拷贝到 Sqlserver 安装目录下的 Data 目录
下。打开 Sqlserver 企业管理器,新建一个数据库,在数据库这一项上点鼠标
右键,在所有任务中选导入数据库,以拷贝到 Data 目录下的 mdf 恢复数据库。 
还原过程中,如果有什么异常,请参考“数据仓库与数据挖掘技术\上机\”目
录下的“数据仓库实习指导.pdf ”中的还原部分的内容。 
 
实验 3:多维数据分析 
 
 
l  实验任务: 
本实验主要验证 OLAP 多维分析的过程。主要包括完成 OLAP 数据库的创建,多
维数据集的创建。存储和处理多维数据,浏览多维数据集等实验任务。 
 
l  实验准备: 
本实验使用的操作参考为 Lab2.2 中下载的文档,“多维数据分析操作演练.pdf ”。 
本实验不得超过 1.5 学时。 
 
 
l  实验指导: 
 
Lab3.1    多维数据分析实验                       
单元目标: 
 
        2.在使用过程中熟悉和理解相应的概念。 
工作步骤: 
1.掌握 Microsoft analysis Service 的中对 OALP 数据库的操作步骤 
1.  在“多维数据分析操作演练.pdf ”中从 P85 开始进行相应的操作演练。 
2.  在实验过程中,如果对相应的操作还不是很理解,请在”  数据仓库
与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档,解
压后,有详细的帮助和演练信息。 
 
 
 
 
 
实验 4:基于数据仓库的数据挖掘实验 
 
 
l  实验任务: 
1.  基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘模型对数据
仓库中的数据进行决策树分析和聚类分析; 
2.  使用 DBMiner2.0 对数据仓库中的数据进行聚类、关联分析; 
3.  使用 DBMiner2.0 对数据仓库的数据分析进行可视化。 
 
l  实验准备: 
本实验的实验指导参考资料在网上,请下载参考。 
本实验不得超过 1.5 学时。 
 
l  实验指导: 
Lab4.1    基于 Microsoft SQLserver2000 Analyses Service 的数据挖掘                         
单元目标: 
  掌握 Microsoft SQLserver2000 Analyses Service的数据挖掘模型的使用步骤 
工作步骤: 
      请在”  数据仓库与数据挖掘技术\上机\”目录下有“Sqlserver 数据分析.rar ”文档,
解压后,按下图所指,完成“数据挖掘”的演练。 
 
Lab4.2    基于 DBMiner2.0 的数据挖掘  (选做)                   
 
单元目标: 
  掌握 DBminer2.0 对数据仓库中的数据进行可视化分类、聚类、关联分析 
        由于时间有限,指导教师将进行一些现场的演练指导。 
 
1.  在”  数据 仓库 与数据挖 掘 技术 \Lab2008\” 目录 下下载 相应的操 作手册
“DBMinerManual.pdf   ”文档,阅读第一、二章。 
2.  对多维数据集进行可视化分析。(chapter 4) 
3.  对多维数据集进行关联分析。(chapter 6) 
4.  对多维数据集进行分类挖掘。(chapter 7) 
5.  对多维数据集进行聚类分析。(chapter 8) 
工作步骤: