基于客户点评的电子商务客户满意度研究
信管 1 班 包琼琼 20101307004
摘要:针对电子商务环境下顾客需求的新特点,分析了顾客满意度评价项目的设
计要求,在此采用 k-均值聚类描述,并采用 AHP 方法分析,通过随机在卓越亚马
逊和当当网上选取的客户购买和评价数据进行聚类和层次分析,得出**网站的客
户满意度更高一些。
关键词: 卓越亚马逊、当当网、点评均分、购买金额、K-均值聚类
E-commerce customer satisfaction based on customer reviews
BaoQiongqiong
Abstract : The new characteristics of customer demand for the e-commerce
environment, the design requirements of the customer satisfaction evaluation project,
in this description, and k-means clustering using AHP analysis by randomly selected
in the Amazon and Dangdang online customers to buyclustering and hierarchical
analysis and evaluation of data obtained ** website customer satisfaction higher.
Keywords :Amazon, Dangdang, Reviews equipartition purchase amount, K-means
clustering
1 研究的目的和意义
随着互联网的普及,我们进入了网络时代。有利益存在的地方就有竞争,传
统零售业已达到白热化程度,一些商家进军电子商务市场领域。不管是传统还是
网络,客户量仍是制约企业发展的一大因素。客户满意度决定着客户量,进而决
定企业兴衰。因而电子商务客户的满意度必然成为我们新的研究热点,目前对电
子商务客户消费心理和电子商务客户的行为特征研究的较多,在电子商务客户满
意度方面研究还比较有限,本文采用层次分析法,针对电子商务中产品和服务类
型较为相似的卓越亚马逊和当当网进行客户点评分数的比较分析,其重要意义在
于给大众提供较为简单的方法进行网站比较,更合理的选择消费平台,同时也给
网站运运营管理者以相互借鉴改进提供放向。
2 研究对象简介
当当网是全球最大的综合性中文网上购物商城,由国内著名出版机构科文公
司、美国老虎基金、美国 IDG 集团、卢森堡剑桥集团、亚洲创业投资基金(原
名软银中国创业基金)共同投资成立。
1999 年 11 月,当当网正式开通。成立十年来,当当网销售业绩增加了 400
倍。当当网在线销售的商品包括了家居百货、化妆品、数码、家电、图书、音像、
服装及母婴等几十个大类,逾百万种商品,在库图书达到 60 万种。目前每年有
近千万顾客成为当当网新增注册用户,遍及全国 32 个省、市、自治区和直辖市。
每天有上万人在当当网买东西,每月有 3000 万人在当当网浏览各类信息,当当
网每月销售商品超过 2000 万件。
当当网的使命是坚持“更多选择、更多低价”让越来越多的顾客享购网上购物
带来的方便和实惠。
亚马逊中国是全球最大的电子商务公司亚马逊在中国的网站。一直都秉承
“以客户为中心”的理念,亚马逊中国承诺“天天低价,正品行货”,致力于从低价、
选品、便利三个方面为消费者打造一个可信赖的网上购物环境。
马逊中国,原名卓越亚马逊,是一家 B2C 电子商务网站,前身为卓越网,2004
年 8 月 19 日亚马逊公司宣布以 7500 万美元收购雷军和陈年创办的卓越网,将
卓越网收归为亚马逊中国全资子公司,使亚马逊全球领先的网上零售专长与卓越
网深厚的中国市场经验相结合,进一步提升了客户体验,并促进了中国电子商务
的成长。2007 年将其中国子公司改名为卓越亚马逊。2011 年 10 月 27 日亚马逊
正式宣布将他在中国的子公司“卓越亚马逊”改名为“亚马逊中国”,并宣布启动短
域名(z)。
亚马逊中国经营图书、音像、软件、图书 、影视等。卓越网创立于 2000
年,为客户提供各类图书、音像、软件、玩具礼品、百货等商品。至今已经成为
中国网上零售的领先者。
通过“货到付款”等多种支付方式,为中国消费者提供便利、快捷的网购体验。
3 研究方法
此次调查采用个案随机抽取数据,在卓越和当当上随机选择用户进行数据采
集,每个网站共选取 200 条数据,数据内容包含用户名、评价次数、评价均分、
购买总金额、网址链接。
K-means 算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价
指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠
近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。
k 个初始类聚类中心点的选取对聚类结果具有较大的
V
k
i
1
S
x
j
2
u
i
公式
x
j
i
影响,因为在该算法第一步中是随机的选取任意 k 个对象作为初始聚类的中心,
初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象,根据其与
各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后,一
次迭代运算完成,新的聚类中心被计算出来。如果在一次迭代前后,J 的值没有
发生变化,说明算法已经收敛。
算法过程如下:
1)从 N 个文档随机选取 K 个文档作为质心
2)对剩余的每个文档测量其到每个质心的距离,并把它归到最近的质心的
类
3)重新计算已经得到的各个类的质心
4)迭代 2~3 步直至新的质心与原质心相等或小于指定阈值,算法结束
具体如下:
输入:k, data[n];
1) 选择 k 个初始中心点,例如 c[0]=data[0],…c[k-1]=data[k-1];
2) 对于 data[0]….data[n],分别与 c[0]…c[k-1]比较,假定与 c[i]差值最少,
就标记为 i;
3) 对于所有标记为 i 点,重新计算 c[i]={ 所有标记为 i 的 data[j]之和}/标
记为 i 的个数;
4) 重复(2)(3),直到所有 c[i]值的变化小于给定阈值。
层次分析法:AHP
层次分析法是把复杂问题分解成各个组成因素,又将这些因素按支配关系分
组形成递阶层次结构。通过两两比较的方式确定各个因素相对重要性,然后综合
决策者的判断,确定决策方案相对重要性的总排序。运用层次分析法进行系统分
析、设计、决策时,可分为四个步骤进行。
1)分析系统中各因素之间的关系,建立系统的递阶层次结构;
2)对同一层次的各元素关于上一层中某一准则的重要性进行两两比较,构
造两两比较的判断矩阵;
3)由判断矩阵计算被比较元素对于该准则的相对权重;
4)计算各层元素对系统目标的合成权重,并进行排序。
4 实证研究
步骤 1 绘制散点图观察用户分布
卓越数据散点图
当当数据散点图
步骤 2 用 SPSS 进行 k-均值聚类分析,找到聚类中心
卓越数据 k-均值聚类
初始聚类中心
聚类
1
2
3
4
点评分数的平均分 4.00
4.50
5.00
4.00
购买商品总金额
3613.90
1445.70
6.00
5823.00
迭代历史记录a
聚类中心内的更改
迭代
1
2
3
4
1
2
283.175
220.694
166.386
.000
.000
.000
.000
.000
a. 由于聚类中心内没有改动或改动较小而达到收敛。
任何中心的最大绝对坐标更改为 .000。当前迭代为 2。
初始中心间的最小距离为 1439.700。
最终聚类中心
聚类
1
2
3
4
点评分数的平均分
4.35
4.21
4.17
4.00
购买商品总金额
3330.73
1225.01
172.38
5823.00
每个聚类中的案例数
聚类 1
2
3
4
有效
缺失
4.000
14.000
181.000
1.000
200.000
.000
当当数据 k-均值聚类
初始聚类中心
聚类
1
2
3
4
点评分数的平均分
5.00
4.93
4.92
5.00
购买商品总金额
24.50
1526.20
4193.10
2263.00
迭代历史记录a
聚类中心内的更改
迭代
1
2
3
4
1
2
3
4
5
6
186.312
362.409
.000
118.250
12.037
145.943
.000
267.970
15.936
143.929
.000
139.955
10.084
98.303
10.709
57.515
5.668
37.733
.000
.000
.000
97.752
35.348
33.956
7
8
9
1.756
1.724
.000
7.561
7.366
.000
.000
.000
.000
.000
.000
.000
a. 由于聚类中心内没有改动或改动较小而达到收
敛。任何中心的最大绝对坐标更改为 .000。当前迭
代为 9。初始中心间的最小距离为 736.800。
最终聚类中心
聚类
1
2
3
4
点评分数的平均分
4.77
4.71
4.92
4.71
购买商品总金额
152.90
665.44
4193.10
1569.77
每个聚类中的案例数
聚类 1
151.000
2
3
4
有效
缺失
35.000
1.000
13.000
200.000
.000
比较两个网站的最终聚类中心,可以看出当当网的每类客户评价相对卓越的要高
一些,尤其在购买金额最高的一类,平均评价竟有 4.92 分之高,远高于卓越的
4.35 分,这就说明当当的满意度更好一些。
步骤 3:AHP 分析
目标层
准则层
O(满意度比较)
C1 购买数量
C2 点评分数的平均
C3 购买商品总金额
设要比较各准则 C1,C2,… , Cn 对目标 O 的重要性
)(
aA
nnij
,
a
ij
,0
a
ji
1
a
ij
CC :
i
j
a
ij
A=
5
1
3
1
5/1
2
12/13/1
.0
.0
.0
640
206
154
=w1
列 向 量 归 一 化
.0
.0
.0
652
131
217
.0
.0
.0
769
154
077
5.0
333
.0
.0
167
求 行 和 归 一 化
Aw=
Aw=w =
1
3
.0(
.0
641
640
.0
.0
344
206
.0
.0
301
154
.1)
542
641
344
301
.0
.0
.0
w=
0.640
0.206
0.154]
[
T
=1.542
2 个网站关于 3 个标准的判断矩阵分别为:
购买次数
点评分数的平均
购买商品总金额
2/11
2
1
11
11
2
1
12/1
由此可求得各属性的最大特征值和相应的特征向量
各属性的最大特征值
特征值 购买次数
点评分数的平均
购买商品总金额
2
1
3
2
3
w2=
1
2
1
2
2
3
1
3
2
2
均通过一致性检验
从而有 w=w2w1=
1
3
2
3
1
2
1
2
2
3
1
3
.0
.0
.0
640
206
154
=
.0
.0
419
581
在两个网站中,当当网的客户满意相对卓越更高一些。
其次用 AHP 层次分析法计算出各个客户的权重