logo资料库

数据挖掘课程报告.doc

第1页 / 共11页
第2页 / 共11页
第3页 / 共11页
第4页 / 共11页
第5页 / 共11页
第6页 / 共11页
第7页 / 共11页
第8页 / 共11页
资料共11页,剩余部分请下载后查看
基于客户点评的电子商务客户满意度研究 信管 1 班 包琼琼 20101307004 摘要:针对电子商务环境下顾客需求的新特点,分析了顾客满意度评价项目的设 计要求,在此采用 k-均值聚类描述,并采用 AHP 方法分析,通过随机在卓越亚马 逊和当当网上选取的客户购买和评价数据进行聚类和层次分析,得出**网站的客 户满意度更高一些。 关键词: 卓越亚马逊、当当网、点评均分、购买金额、K-均值聚类 E-commerce customer satisfaction based on customer reviews BaoQiongqiong Abstract : The new characteristics of customer demand for the e-commerce environment, the design requirements of the customer satisfaction evaluation project, in this description, and k-means clustering using AHP analysis by randomly selected in the Amazon and Dangdang online customers to buyclustering and hierarchical analysis and evaluation of data obtained ** website customer satisfaction higher. Keywords :Amazon, Dangdang, Reviews equipartition purchase amount, K-means clustering 1 研究的目的和意义 随着互联网的普及,我们进入了网络时代。有利益存在的地方就有竞争,传 统零售业已达到白热化程度,一些商家进军电子商务市场领域。不管是传统还是 网络,客户量仍是制约企业发展的一大因素。客户满意度决定着客户量,进而决 定企业兴衰。因而电子商务客户的满意度必然成为我们新的研究热点,目前对电 子商务客户消费心理和电子商务客户的行为特征研究的较多,在电子商务客户满 意度方面研究还比较有限,本文采用层次分析法,针对电子商务中产品和服务类 型较为相似的卓越亚马逊和当当网进行客户点评分数的比较分析,其重要意义在 于给大众提供较为简单的方法进行网站比较,更合理的选择消费平台,同时也给 网站运运营管理者以相互借鉴改进提供放向。 2 研究对象简介
当当网是全球最大的综合性中文网上购物商城,由国内著名出版机构科文公 司、美国老虎基金、美国 IDG 集团、卢森堡剑桥集团、亚洲创业投资基金(原 名软银中国创业基金)共同投资成立。 1999 年 11 月,当当网正式开通。成立十年来,当当网销售业绩增加了 400 倍。当当网在线销售的商品包括了家居百货、化妆品、数码、家电、图书、音像、 服装及母婴等几十个大类,逾百万种商品,在库图书达到 60 万种。目前每年有 近千万顾客成为当当网新增注册用户,遍及全国 32 个省、市、自治区和直辖市。 每天有上万人在当当网买东西,每月有 3000 万人在当当网浏览各类信息,当当 网每月销售商品超过 2000 万件。 当当网的使命是坚持“更多选择、更多低价”让越来越多的顾客享购网上购物 带来的方便和实惠。 亚马逊中国是全球最大的电子商务公司亚马逊在中国的网站。一直都秉承 “以客户为中心”的理念,亚马逊中国承诺“天天低价,正品行货”,致力于从低价、 选品、便利三个方面为消费者打造一个可信赖的网上购物环境。 马逊中国,原名卓越亚马逊,是一家 B2C 电子商务网站,前身为卓越网,2004 年 8 月 19 日亚马逊公司宣布以 7500 万美元收购雷军和陈年创办的卓越网,将 卓越网收归为亚马逊中国全资子公司,使亚马逊全球领先的网上零售专长与卓越 网深厚的中国市场经验相结合,进一步提升了客户体验,并促进了中国电子商务 的成长。2007 年将其中国子公司改名为卓越亚马逊。2011 年 10 月 27 日亚马逊 正式宣布将他在中国的子公司“卓越亚马逊”改名为“亚马逊中国”,并宣布启动短 域名(z)。 亚马逊中国经营图书、音像、软件、图书 、影视等。卓越网创立于 2000 年,为客户提供各类图书、音像、软件、玩具礼品、百货等商品。至今已经成为 中国网上零售的领先者。 通过“货到付款”等多种支付方式,为中国消费者提供便利、快捷的网购体验。 3 研究方法 此次调查采用个案随机抽取数据,在卓越和当当上随机选择用户进行数据采 集,每个网站共选取 200 条数据,数据内容包含用户名、评价次数、评价均分、
购买总金额、网址链接。 K-means 算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价 指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠 近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。 k 个初始类聚类中心点的选取对聚类结果具有较大的 V  k   i 1   S x j 2  u i 公式  x j i 影响,因为在该算法第一步中是随机的选取任意 k 个对象作为初始聚类的中心, 初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与 各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一 次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J 的值没有 发生变化,说明算法已经收敛。 算法过程如下: 1)从 N 个文档随机选取 K 个文档作为质心 2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的 类 3)重新计算已经得到的各个类的质心 4)迭代 2~3 步直至新的质心与原质心相等或小于指定阈值,算法结束 具体如下: 输入:k, data[n]; 1) 选择 k 个初始中心点,例如 c[0]=data[0],…c[k-1]=data[k-1]; 2) 对于 data[0]….data[n],分别与 c[0]…c[k-1]比较,假定与 c[i]差值最少, 就标记为 i; 3) 对于所有标记为 i 点,重新计算 c[i]={ 所有标记为 i 的 data[j]之和}/标 记为 i 的个数; 4) 重复(2)(3),直到所有 c[i]值的变化小于给定阈值。 层次分析法:AHP 层次分析法是把复杂问题分解成各个组成因素,又将这些因素按支配关系分 组形成递阶层次结构。通过两两比较的方式确定各个因素相对重要性,然后综合
决策者的判断,确定决策方案相对重要性的总排序。运用层次分析法进行系统分 析、设计、决策时,可分为四个步骤进行。 1)分析系统中各因素之间的关系,建立系统的递阶层次结构; 2)对同一层次的各元素关于上一层中某一准则的重要性进行两两比较,构 造两两比较的判断矩阵; 3)由判断矩阵计算被比较元素对于该准则的相对权重; 4)计算各层元素对系统目标的合成权重,并进行排序。 4 实证研究 步骤 1 绘制散点图观察用户分布 卓越数据散点图 当当数据散点图
步骤 2 用 SPSS 进行 k-均值聚类分析,找到聚类中心 卓越数据 k-均值聚类 初始聚类中心 聚类 1 2 3 4 点评分数的平均分 4.00 4.50 5.00 4.00 购买商品总金额 3613.90 1445.70 6.00 5823.00 迭代历史记录a 聚类中心内的更改 迭代 1 2 3 4 1 2 283.175 220.694 166.386 .000 .000 .000 .000 .000 a. 由于聚类中心内没有改动或改动较小而达到收敛。 任何中心的最大绝对坐标更改为 .000。当前迭代为 2。 初始中心间的最小距离为 1439.700。
最终聚类中心 聚类 1 2 3 4 点评分数的平均分 4.35 4.21 4.17 4.00 购买商品总金额 3330.73 1225.01 172.38 5823.00 每个聚类中的案例数 聚类 1 2 3 4 有效 缺失 4.000 14.000 181.000 1.000 200.000 .000 当当数据 k-均值聚类 初始聚类中心 聚类 1 2 3 4 点评分数的平均分 5.00 4.93 4.92 5.00 购买商品总金额 24.50 1526.20 4193.10 2263.00 迭代历史记录a 聚类中心内的更改 迭代 1 2 3 4 1 2 3 4 5 6 186.312 362.409 .000 118.250 12.037 145.943 .000 267.970 15.936 143.929 .000 139.955 10.084 98.303 10.709 57.515 5.668 37.733 .000 .000 .000 97.752 35.348 33.956
7 8 9 1.756 1.724 .000 7.561 7.366 .000 .000 .000 .000 .000 .000 .000 a. 由于聚类中心内没有改动或改动较小而达到收 敛。任何中心的最大绝对坐标更改为 .000。当前迭 代为 9。初始中心间的最小距离为 736.800。 最终聚类中心 聚类 1 2 3 4 点评分数的平均分 4.77 4.71 4.92 4.71 购买商品总金额 152.90 665.44 4193.10 1569.77 每个聚类中的案例数 聚类 1 151.000 2 3 4 有效 缺失 35.000 1.000 13.000 200.000 .000 比较两个网站的最终聚类中心,可以看出当当网的每类客户评价相对卓越的要高 一些,尤其在购买金额最高的一类,平均评价竟有 4.92 分之高,远高于卓越的 4.35 分,这就说明当当的满意度更好一些。 步骤 3:AHP 分析 目标层 准则层 O(满意度比较) C1 购买数量 C2 点评分数的平均 C3 购买商品总金额 设要比较各准则 C1,C2,… , Cn 对目标 O 的重要性 )( aA  nnij  , a ij  ,0 a ji  1 a ij
CC : i j a ij A= 5 1 3 1   5/1 2   12/13/1       .0 .0 .0 640 206 154           =w1 列 向 量 归 一 化 .0 .0 .0 652 131 217      .0 .0 .0 769 154 077 5.0 333 .0 .0 167      求 行 和 归 一 化 Aw= Aw=w = 1 3 .0( .0 641 640  .0 .0 344 206  .0 .0 301 154 .1)  542 641   344   301  .0 .0 .0      w= 0.640 0.206 0.154] [ T =1.542 2 个网站关于 3 个标准的判断矩阵分别为: 购买次数 点评分数的平均 购买商品总金额    2/11 2 1       11 11    2 1 12/1       由此可求得各属性的最大特征值和相应的特征向量 各属性的最大特征值 特征值 购买次数 点评分数的平均 购买商品总金额  2 1 3 2 3      w2= 1 2 1 2 2 3 1 3      2 2 均通过一致性检验 从而有 w=w2w1=      1 3 2 3 1 2 1 2 2 3 1 3           .0 .0 .0 640 206 154      =    .0 .0 419 581    在两个网站中,当当网的客户满意相对卓越更高一些。 其次用 AHP 层次分析法计算出各个客户的权重
分享到:
收藏