logo资料库

数据挖掘技术:市场营销、销售与客户关系管.pdf

第1页 / 共434页
第2页 / 共434页
第3页 / 共434页
第4页 / 共434页
第5页 / 共434页
第6页 / 共434页
第7页 / 共434页
第8页 / 共434页
资料共434页,剩余部分请下载后查看
封面
书名
版权
前言
目录
第1章 数据挖掘的缘起和内容
1.1 分析客户关系管理系统
1.1.1 交易处理系统的作用
1.1.2 数据仓库的作用
1.1.3 数据挖掘的作用
1.1.4 客户关系管理策略的作用
1.2 什么是数据挖掘
1.3 数据挖掘可以完成哪些工作
1.3.1 分类
1.3.2 估计
1.3.3 预测
1.3.4 关联分组或关联规则
1.3.5 聚类
1.3.6 建立简档
1.4 为什么现在研究
1.4.1 数据正在生成
1.4.2 数据正在形成数据仓库
1.4.3 计算能力足以承受
1.4.4 客户关系管理的兴趣增强
1.4.5 商业数据挖掘软件产品已经易于使用
1.5 目前如何使用数据挖掘
1.5.1 超级市场成为信息经纪人
1.5.2 基于推荐的商业
1.5.3 交叉销售
1.5.4 抓住好的客户
1.5.5 淘汰差的客户
1.5.6 变革一个行业
1.5.7 其他
1.6 小结
第2章 数据挖掘的良性循环
2.1 商业数据挖掘案例研究
2.1.1 识别商务挑战
2.1.2 应用数据挖掘
2.1.3 按照结果采取行动
2.1.4 测试效果
2.2 何谓良性循环
2.2.1 识别商业机会
2.2.2 挖掘数据
2.2.3 采取行动
2.2.4 测试结果
2.3 良性循环环境下的数据挖掘
2.4 移动通信公司建立恰当的联系
2.4.1 机会
2.4.2 如何应用数据挖掘
2.4.3 处理行动
2.4.4 完成循环
2.5 神经网络和决策树驱动SUV的销售
2.5.1 最初的挑战
2.5.2 如何应用数据挖掘
2.5.3 最终措施
2.5.4 完成循环
2.6 小结
第3章 数据挖掘方法论和最佳实践
3.1 为什么需要方法论
3.1.1 获取不真实的知识
3.1.2 获取真实但无用的知识
3.2 假设测试
3.3 模型、建立简档和预测
3.3.1 建立简档
3.3.2 预测
3.4 方法论
3.4.1 第一步:将商业问题转换为数据挖掘问题
3.4.2 第二步:选取合适数据
3.4.3 第三步:设法理解数据
3.4.4 第四步:创建模型集
3.4.5 第五步:修复数据问题
3.4.6 第六步:变换数据,获取信息
3.4.7 第七步:建立模型
3.4.8 第八步:评估模型
3.4.9 第九步:部署模型
3.4.10 第十步:评估结果
3.9.11 第十一步:重新开始
3.5 小结
第4章 数据挖掘在市场营销和客户关系管理中的应用
4.1 寻找潜在客户
4.1.1 识别好的潜在客户
4.1.2 选择沟通渠道
4.1.3 遴选适当的信息
4.2 为选择正确的广告场所进行数据挖掘
4.2.1 谁匹配简档
4.2.2 测量读者群组的匹配度
4.3 通过数据挖掘改进定向市场营销活动
4.3.1 响应建模
4.3.2 优化固定预算的响应率
4.3.3 优化营销活动收益
4.3.4 接触那些受相关信息影响最大的人们
4.3.5 差别响应分析
4.4 使用当前客户来了解潜在客户
4.4.1 在他们成为客户前就开始跟踪客户
4.4.2 从新客户那里收集信息
4.4.3 获取时间变量可预测未来结果
4.5 客户关系管理数据挖掘
4.5.1 按客户需求策划营销活动
4.5.2 划分客户群体
4.5.3 减少信用风险
4.5.4 决定客户价值
4.5.5 交叉销售、提升销售和销售推荐
4.6 保持和流失
4.6.1 识别流失
4.6.2 流失为什么重要
4.6.3 不同类型的流失
4.6.4 不同类型的流失模型
4.7 小结
第5章 统计学的魅力:数据挖掘常用的工具
5.1 Occam的剃刀
5.1.1 原假设
5.1.2 p值
5.2 观察数据
5.2.1 观察离散数值
5.2.2 观察连续变量
5.2.3 另一对统计概念
5.3 测定响应
5.3.1 比例标准误差
5.3.2 使用置信界限比较结果
5.3.3 使用比例差值比较结果
5.3.4 样本大小
5.3.5 置信区间的真正含义
5.3.6 实验的测试群组和对照群组大小
5.4 多重比较
5.4.1 多重比较下的置信层次
5.4.2 Bonferroni修正
5.5 卡方检验
5.5.1 期望值
5.5.2 卡方值
5.5.3 卡方与比例差值的比较
5.6 示例:区域和起点的卡方
5.7 数据挖掘和统计学异同
5.7.1 原始数据中没有测量误差
5.7.2 有大量的数据
5.7.3 时间从属性随处出现
5.7.4 试验是艰难的
5.7.5 数据审查和截取
5.8 小结
第6章 决策树
6.1 什么是决策树
6.1.1 分类
6.1.2 评分
6.1.3 估计
6.1.4 树以多种形态生长
6.2 决策树是如何长成的
6.2.1 发现拆分
6.2.2 生成完全树
6.2.3 度量决策树的有效性
6.3 选择最佳拆分的测试
6.3.1 纯度和发散性
6.3.2 基尼或总体发散性
6.3.3 熵归约或信息增益
6.3.4 信息增益比率
6.3.5 卡方检验
6.3.6 方差归约
6.3.7 F测试
6.4 修剪
6.4.1 CART修剪算法
6.4.2 C5修剪算法
6.4.3 基于稳定性的修剪
6.5 从树中提炼规则
6.6 考虑成本
6.7 决策树方法的进一步修正
6.7.1 每次使用多于一个字段
6.7.2 倾斜超平面
6.7.3 神经树
6.7.4 使用树分段回归
6.8 决策树的替代表示法
6.8.1 方格图
6.8.2 树年轮图
6.9 实际应用中的决策树
6.9.1 决策树作为数据探查工具
6.9.2 把决策树方法应用于顺序事件
6.9.3 模拟未来
6.10 小结
第7章 人工神经网络
7.1 历史回眸
7.2 房地产评估
7.3 用于定向数据挖掘的神经网络
7.4 神经网络是什么
7.4.1 神经网络的单元是什么
7.4.2 前馈神经网络
7.4.3 神经网络如何使用反向传播学习
7.4.4 前馈网络和反向传播网络的启发
7.5 选择训练集
7.5.1 覆盖所有特征值
7.5.2 特征数目
7.5.3 训练集的大小
7.5.4 输出数目
7.6 准备数据
7.6.1 具有连续数值的特征
7.6.2 具有有序、离散(整数)数值的特征
7.6.3 具有分类数值的特征
7.6.4 其他类型的特征
7.7 解释结果
7.8 时间序列神经网络
7.9 如何了解在神经网络内部正在运行的事情
7.10 自组织映像
7.10.1 什么是自组织映像
7.10.2 实例:发现簇
7.11 小结
第8章 最近邻方法:基于存储的推理和协同过滤
8.1 基于存储的推理
8.2 MBR面临的挑战
8.2.1 选择一组平衡的历史记录
8.2.2 表示训练数据
8.2.3 确定距离函数、组合函数和邻居的数目
8.3 案例研究:分类新闻报导
8.3.1 什么是代码
8.3.2 应用MBR
8.3.3 结果
8.4 测量距离
8.4.1 什么是距离函数
8.4.2 每次每个字段只建立一个距离函数
8.4.3 其他数据类型的距离函数
8.4.4 当距离度量已经存在时
8.5 组合函数:向邻居求答案
8.5.1 基本的方法:民主
8.5.2 加权投票
8.6 协同过滤:可以做出推荐的最近邻方法
8.6.1 建立简档
8.6.2 比较简档
8.6.3 做出预测
8.7 小结
第9章 购物篮分析和关联规则
9.1 定义购物篮分析
9.1.1 购物篮数据的三个层次
9.1.2 订单特征
9.1.3 项流行性
9.1.4 跟踪市场干预
9.1.5 按用途聚类产品
9.2 关联规则
9.2.1 可操作的规则
9.2.2 平凡的规则
9.2.3 费解的规则
9.3 一个关联规则有多好
9.4 建立关联规则
9.4.1 选择恰当的项集
9.4.2 从所有这些数据中生成规则
9.4.3 克服实际局限
9.4.4 大数据的问题
9.5 扩展思想
9.5.1 使用关联规则比较店铺
9.5.2 无关规则
9.6 使用关联规则的顺序分析
9.7 小结
第10章 链接分析
10.1 图论基础
10.1.1 哥尼斯堡七桥问题
10.1.2 旅行推销员问题
10.1.3 有向图
10.1.4 检测图中的环
10.2 链接分析的一个熟悉的应用
10.2.1 Kleinberg算法
10.2.2 细节:查找网络中心和权威
10.2.3 实践中的网络中心和权威
10.3 案例研究:谁在家中使用传真机
10.3.1 为什么发现传真机是有用的
10.3.2 用数据画图
10.3.3 方法
10.3.4 一些结果
10.4 案例研究:分段移动电话客户
10.4.1 数据
10.4.2 不使用图论的分析
10.4.3 两位客户的对比
10.4.4 链接分析的力量
10.5 小结
第11章 自动聚类探测
11.1 搜索单纯岛状片段
11.1.1 星光与星的亮度
11.1.2 适应多维情况
11.2 K平均聚类
11.2.1 K平均算法的三个步骤
11.2.2 K的意义
11.3 相似性和距离
11.3.1 相似性度量与变量类型
11.3.2 相似性的常规度量
11.4 聚类过程的数据准备
11.4.1 利用比例缩放使变量相对一致
11.4.2 使用权重编码外部信息
11.5 聚类探测的其他途径
11.5.1 高斯混合模型
11.5.2 凝聚聚类
11.5.3 分裂聚类
11.5.4 自组织映像
11.6 评价簇
11.6.1 在簇内部
11.6.2 在簇之外
11.7 案例研究:聚类城镇
11.7.1 创造城镇特征
11.7.2 创建簇
11.7.3 利用主题簇调整区域边界
11.8 小结
第12章 市场营销中的风险函数和生存分析
12.1 客户保持
12.1.1 计算保持
12.1.2 保持曲线揭示的内容
12.1.3 从保持曲线找出平均保有期
12.1.4 把客户保持看做衰变
12.2 风险
12.2.1 基本思想
12.2.2 风险函数示例
12.2.3 审查
12.2.4 其他类型的审查
12.3 从风险到生存
12.3.1 保持
12.3.2 生存
12.4 比例风险
12.4.1 比例风险实例
12.4.2 分层:测量生存的初始结果
12.4.3 Cox比例风险
12.4.4 比例风险的局限性
12.5 生存分析实践
12.5.1 处理不同的流失类型
12.5.2 客户何时会回来
12.5.3 预测
12.5.4 风险随时间变化
12.6 小结
第13章 遗传算法
13.1 遗传算法如何工作
13.1.1 计算机上的遗传学
13.1.2 表示数据
13.2 案例研究:使用遗传算法进行资源优化
13.3 模式:遗传算法为什么起作用
13.4 遗传算法的更多应用
13.4.1 在神经网络方面的应用
13.4.2 案例研究:为响应建模完善一个解决方案
13.5 超越简单算法
13.6 小结
第14章 数据挖掘贯穿客户生存周期
14.1 客户关系层次
14.1.1 深度亲密
14.1.2 大众亲密
14.1.3 中间关系
14.1.4 间接关系
14.2 客户生存周期
14.2.1 客户生存周期:生存阶段
14.2.2 客户生存周期
14.2.3 基于订阅关系和基于事件关系的比较
14.3 围绕客户生存周期组织商业过程
14.3.1 客户获取
14.3.2 客户激活
14.3.3 关系管理
14.3.4 保持
14.3.5 赢回
14.4 小结
第15章 数据仓库、OLAP和数据挖掘
15.1 数据结构
15.1.1 交易数据——基础层
15.1.2 操作汇总数据
15.1.3 决策支持汇总数据
15.1.4 数据库模式
15.1.5 元数据
15.1.6 商业规则
15.2 数据仓库的大致结构
15.2.1 源系统
15.2.2 提取、转化和加载
15.2.3 中央储存库
15.2.4 元数据储存库
15.2.5 数据集市
15.2.6 操作反馈
15.2.7 最终用户和桌面工具
15.3 OLAP适用于何处
15.3.1 立方体中的内容
15.3.2 星形模式
15.3.3 OLAP和数据挖掘
15.4 数据挖掘在哪里切入数据仓库
15.4.1 大量数据
15.4.2 一致的、清洁的数据
15.4.3 假设测试和测量
15.4.4 可升级硬件及RDBMS支持
15.5 小结
第16章 构造数据挖掘环境
16.1 以客户为中心的组织
16.2 理想的数据挖掘环境
16.2.1 确定什么数据可用的能力
16.2.2 将数据转化为可操作信息的技巧
16.2.3 所有必需的工具
16.3 返回现实世界
16.3.1 建立以客户为中心的组织
16.3.2 创建单个客户视图
16.3.3 定义以客户为中心的度量标准
16.3.4 收集正确的数据
16.3.5 从客户交互到学习机会
16.3.6 挖掘客户数据
16.4 数据挖掘组
16.4.1 外包数据挖掘
16.4.2 内部数据挖掘
16.4.3 数据挖掘组成员需要具备的条件
16.5 数据挖掘基础设施
16.5.1 挖掘平台
16.5.2 评分平台
16.5.3 一个产品数据挖掘结构实例
16.6 数据挖掘软件
16.6.1 所应用的技术范围
16.6.2 可扩展性
16.6.3 评分支持
16.6.4 用户界面的多种层次
16.6.5 可理解的输出
16.6.6 处理各种数据类型的能力
16.6.7 文档及简单使用
16.6.8 对新手和高级用户的培训、咨询和支持
16.6.9 卖方可信度
16.7 小结
第17章 为挖掘准备数据
17.1 数据应该像什么
17.1.1 客户特征标识
17.1.2 列
17.1.3 模型在建模中的角色
17.1.4 变量度量
17.1.5 用于数据挖掘的数据
17.2 构建客户特征标识
17.2.1 编写数据目录
17.2.2 识别客户
17.2.3 第一次尝试
17.2.4 取得进展
17.2.5 实际的问题
17.3 探查变量
17.3.1 直方图分布
17.3.2 随时间变化
17.3.3 交叉表
17.4 衍生变量
17.4.1 提取来自单个数值的特征
17.4.2 在记录内合并数值
17.4.3 查找辅助信息
17.4.4 转轴正则时间序列
17.4.5 汇总交易记录
17.4.6 汇总跨越模型集的字段
17.5 基于行为变量的例子
17.5.1 购买频率
17.5.2 衰减使用
17.5.3 旋转者、交易商和便利用户:定义客户行为
17.6 数据的黑暗面
17.6.1 缺失值
17.6.2 脏数据
17.6.3 不一致数值
17.7 计算问题
17.7.1 源系统
17.7.2 提取工具
17.7.3 专用代码
17.7.4 数据挖掘工具
17.8 小结
第18章 应用数据挖掘
18.1 开始
18.1.1 从概念验证方案中能期待什么
18.1.2 识别概念验证方案
18.1.3 实现概念验证方案
18.2 选择数据挖掘技术
18.2.1 将商务目标转换为数据挖掘任务
18.2.2 决定数据的相关特性
18.2.3 考虑混合方法
18.3 公司如何开展数据挖掘
18.3.1 保持的对照实验
18.3.2 数据
18.3.3 一些发现
18.3.4 实践出真知
18.4 小结
2012-10-12
分享到:
收藏