logo资料库

数据仓库建立-江苏电信模拟.pdf

第1页 / 共4页
第2页 / 共4页
第3页 / 共4页
第4页 / 共4页
资料共4页,全文预览结束
1.业务分析
1)套餐制定决策
2)服务项目定价决策
3)客户群体分析
2.维度建模
1)公共维度提取
2)公共维度表
3)事实表和多维建模
3.纬度建模总结
江苏电信小公司, 数据仓库建立 1.业务分析 1)套餐制定决策 目标:分析套餐使用情况,设置合适的套餐提高营业额。 涉及流程:新卡套餐选择,套餐更换,停机,套餐宣传,选择、更改、取消渠道,使用记录 分析对象:数量:通过新卡选择套餐和套餐更换选择套餐的数量,选择或更换套餐渠道,套餐使用时间, 套餐不使用数量(更或和停机);收入:套餐消费额 2)服务项目定价决策 目标:分析消费记录,设置合适的服务项目和价格。 涉及流程:订购渠道,取消渠道,使用记录,服务宣传 分析对象:数量:和套餐绑定选择,增值服务选择,通过店面、手机客户端、pc 网站渠道,操作方式订 购/取消,使用记录 收入:使用消费额 3)客户群体分析 目标:分析中心转向客户,建立以客户为中心的分析应用 步骤:客户数据集成,客户信息分析和挖掘 2.维度建模 1)公共维度提取 预定义公共维度:时间维,地域维,服务项目维,店面,套餐维度,客户,购买渠道,宣传渠道,人口 支架维度 套餐 客户 购买渠道 宣传渠道 人口支架 是 是 是 是 时间 地域 服务项目 店面 主题\维 度 套餐制定 决策 服务项目 定价决策 客户群体 分析 总线矩阵说明:三个主题都是用到的维度:时间、客户、购买渠道可以确定为公共维度, 是 是 是 是 是 是 是 是 是 是 是 是 有两个主题用到的维度,服务项目,宣传渠道,这两个维度都是事实表的维度,而客户群体分析,是对
客户维度的统计分析,所以可以看作是事实表的公共维度。 因而选取的公共维度为:时间,服务项目,客户,购买渠道,宣传渠道,其中在服务项目中设置空项目, 表示有客户但为止客户要求服务或客户暂时没有购买服务。 2)公共维度表 时间维表,分为表示最小单位为日的日期维度和每一日具体时间最小单为日的时间维度;数据来源:日 历和财政计划中时间划分 日期 星期 日期关键 字 具体到秒的日期维度,维成员太多,一般分析最多关心某时间段情况,所以将时间维度作为退化维度集 成到事实表中。 财政年月 节假日指 日期完整 描述符 周日指示 符 日历月 日历年 示符 服务项目维表//服务类别里没有多余属性就不需要建立雪花模型,数据来源:操作型数据库,服务表 服务关键字 小类描述 价格 属性“小类描述”,“大类描述”,“部门描述”没有采用规范化处理,来降低维度结构复杂度 大类描述 部门描述 服务描述 客户维度表;数据来源,操作型数据库,用户注册,初步的客户维度表 姓 称呼 正式 问候 称呼 客户 关键 字 渠道维表;数据来源:操作型数据库,购买登记记录,取消,更改记录 民族 头衔 生活 地域 后缀 称谓 年龄 信用等级 活动状态 购买渠道属性是有限的,有店面,手机客户端,pc 网站,人工服务,其中店面又有具体的店面属性,而其他 的没有要分析的属性,所以将购买渠道设维杂项维度中,在这个多维模型中不关注具体店面设置,使用 店面名称而不扩展出店面维度。 杂项关键字 设置某一店面关键字对应空店面,关联购买渠道非店面。 购买渠道 店面名称 宣传渠道维表。数据来源,实际 宣传计划 宣传渠道关键字 名称 其中开始日期是日期维表的宣传开始日期视图,结束日期是日期维表的宣传结束日期视图,设计思想节 省存储空间 开始日期 结束日期 媒体 描述 3)事实表和多维建模 1)套餐消费事实表 套餐消费事实表,选定维度日期维度,服务项目维度,客户维度,渠道维度,套餐维度, 套餐维度设计:数据来源:套餐设计
套餐名称 服务项目 关键字 1 套餐维度 关键字 套餐消费事实表,是用户的单条消费金额和套餐选择有关;数据来源:操作型数据库,套餐订购,服务 项目消费统计 服务项目 关键字 4 服务项目 关键字 2 服务项目 关键字 3 服务项目 关键字 5 宣传渠道关键字 套餐订购 关键字 客户关键 字 套餐关键 字 开始日期 日期视图 关键字 结束日期 日期视图 关键字 购买渠道 渠道关键 字 取消渠道 渠道关键 字 当前套餐 使用情况 描述 消费总金 额 使用雪花型模型的原因:套餐维度需要项目维度的信息。 2)服务项目消费事实表 选择维度:选定维度日期维度,服务项目维度,客户维度 服务项目消费事实表属性,开始时间,结束时间,流量,其他项目记录信息,消费金额,建立雪花型模 型;数据来源:操作型数据库消费记录 服务项目消费 关键字 客户关键字 服务项目 关键字 开始时间 日期视图 关键字 结束时间 日期视图 关键字 流量 信息 消费金额 其它项目 使用信息 描述 对于服务项目的具体记录方式,因服务的不同而不同,又由于记录的数值取值范围组合太多,所以不宜 组合成为杂项,使用互斥的几个列来保存记录信息:开始时间和结束时间保存,语音、视频通话和上网 时间,信息保存是否是信息类型服务,其他项目使用信息描述在记录可能的增值服务消费记录。 表之间关系简单,采用星型模型。 3)客户关系管理表 维度选择:时间维度,地域支架维度,购买渠道,人口支架维度 维表建立: 地域支架维度,数据来源:地图统计 地域维度关键 字 洲 国家 省 城市 县/区 邮编 人口支架维度:数据来源:相关统计信息 县人口 统计关 键字 (PK) 总人口 5 岁以 下人口 5 岁以 下人口 比率 18 岁以 下人口 18 岁以 下人口 比率 65 岁以 下人口 65 岁以 下人口 比率 女性人 口 女性人 口比率 高中毕 业人数 大学毕 业人数 住房拥 有比率 客户属性:登记时间 ,登记渠道,性别,名族,年龄(分级),收入(分级),状况,崭新程度,频率 与强度,违约数,区/道,门牌号; 信息来源,用户注册和使用记录统计 客户维度表
客户 关键 字 地域 维度 关键 字 人口 支架 维度 登记 时间 日期 视图 维度 登记 渠道 第一 次购 买渠 道 性别 年龄 收入 区/道 门牌 号 状况 崭新 程度 违约 数 频率 与强 度 结构为:雪花模型 3.纬度建模总结 综合每一个主题的分析情况,总体使用雪花模型,
分享到:
收藏