数据挖掘技术及应用
最全面理论+最佳实践
目录
n 理论:南航李静教授
n 实践:广东移动案例
(仅供学习交流,如需引用,请注明以上来源单位,谢谢!)
内容提纲
1. 概述
2. 数据仓库与OLAP技术
3. 数据挖掘技术
4. 数据挖掘在电信领域的应用
5. 数据挖掘工具
6. 数据挖掘实例
内容提纲
n 数据挖掘介绍
n 数据挖掘系统
n 数据挖掘算法
n 国际会议和期刊
n 课后研读的论文
n 主要参考资料
I. 数据挖掘介绍
A. 数据挖掘的由来
B. 数据挖掘的应用
C. 基本概念区分
D. 数据挖掘基本内容
E. 数据挖掘基本特征
F. 数据挖掘的其他主题
A. 数据挖掘的由来
n 背景
n 网络之后的下一个技术热点
n 数据爆炸但知识贫乏
n 从商业数据到商业信息的进化
1. 背景
n 人类已进入一个崭新的信息时代
n 数据库中存储的数据量急剧膨胀
n 二十世纪末以来,全球信息量以惊人的速度急剧增长—据估计,
每二十个月将增加一倍。许多组织机构的IT系统中都收集了大量的数
据(信息)。
n 目前的数据库系统虽然可以高效地实现数据的录入、查询、统计等功
能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测
未来的发展趋势。为了充分利用现有信息资源,从海量数据中找出隐
藏的知识,数据挖掘技术应运而生并显示出强大的生命力。
n 产生了一个新的研究方向:基于数据库的知识发现(Knowledge
Discovery in Database),以及相应的数据挖掘(Data Mining)理论和
技术的研究
n 随着大数据库的建立和海量数据的不断涌现,必
然提出对强有力的数据分析工具的迫切需求。但
现实情况往往是“数据十分丰富,而信息相当贫
乏。”
n 快速增长的海量数据收集、存放在大型数据库中,
没有强有力的工具,理解它们已经远远超出人的
能力。因此,有人称之为:“数据坟墓”。
n 由于专家系统工具过分依赖用户或专家人工地将
知识输入知识库中,而且分析结果往往带有偏差
和错误,再加上耗时、费用高,故不可行。
数据矿山
数据挖掘工具
信息金块