数据挖掘基本知识及
RapidMiner工具介绍
RapidMiner 开源数据挖掘工具 第1课
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
RapidMiner工具简介
RapidMiner 官网地址:
www.rapidminer.com
RapidMiner 插件下载地址:
http://marketplace.rapid-i.com/UpdateServer/
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
RapidMiner简介
图片引用地址:
http://www.kdnuggets.com/2014/06/kdnu
ggets-annual-software-poll-
rapidminer-continues-lead.html
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
RapidMiner 各周课程内容:
1. 数据挖掘基本知识、RapidMiner工具介绍、软件安装、数据导入与导出方法
2. 数据预处理:条件过滤、处理缺失值、采样、分割、合并、排序数据集、正则表达式的用法等。
3. 宏、循环、分支判断、异常处理,执行: sql、预定义流程、脚本、程序
4. 关联分析、关联规则
5. K-Means 聚类、辨别分析
6. 线性回归、逻辑回归
7. 决策树、神经网络
8. 模型评估-交叉验证、模型优化
9. 文本挖掘
10. WEB挖掘(上)- 网站信息爬取
11. WEB挖掘(下)- 网页元素值获取、数据入库
12. 协同过滤、推荐
13. 时间序列分析
14. 异常检测(离群点分析)、RapidminerServer使用介绍、命令行执行流程、源码调试启动
RapidMiner
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
本节课学习目标
理解数据挖掘基本概念、术语含义
了解常用挖掘算法种类及应用场景
理解数据挖掘的流程
熟悉RapidMiner工具平台界面功能组成
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
什么是数据挖掘?
数据挖掘 (从数据中发现知识)
– 从大量的数据中挖掘哪些令人感兴趣的、隐含的、先前未知的和可能有
用的模式或知识
– 挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用词)
数据挖掘的替换词
– 数据库中的知识挖掘(KDD)
– 知识提炼
– 数据/模式分析
– 数据考古
– 数据捕捞、信息收获等等。
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区
数据挖掘: 数据库中的知识挖掘(KDD)
数据挖掘的核心 –– 知识挖掘
模式评估
数据挖掘
任务相关数据
数据仓库
选择
数据清理
数据集成
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
数据库
DATAGURU专业数据分析社区
数据挖掘的作用
作为一门学科,数据挖掘对于世人来说在很大程度上是透明的。我们
在大多数时间都从未注意到它的发生。但每当我们办理商店购物卡、
使用信用卡购物或在网上冲浪时,都在创建数据。这些数据以大数据
集形式存储在我们每天与之打交道的公司所拥有的功能强大的计算机
上。 存在于这些数据集之内的便是模式 - 表明我们的兴趣、习惯和行
为。数据挖掘可让人们找到并解读这些模式,从而帮助人们作出更明
智的决策,并更好地为客户服务。
数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报
检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸
多方法来实现上述目标。
RapidMiner 开源数据挖掘工具 讲师 郭振未 15901239872 QQ:47647730
DATAGURU专业数据分析社区