数据挖掘课程报告.doc-资料库

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第1页.png

第1页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第2页.png

第2页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第3页.png

第3页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第4页.png

第4页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第5页.png

第5页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第6页.png

第6页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第7页.png

第7页 / 共11页

1ab3b786-e1e0-4b23-b5d5-cf0f981a8eeb.doc.pdf-第8页.png

第8页 / 共11页

基于客户点评的电子商务客户满意度研究信管 1 班包琼琼 20101307004 摘要：针对电子商务环境下顾客需求的新特点,分析了顾客满意度评价项目的设计要求,在此采用 k-均值聚类描述，并采用 AHP 方法分析，通过随机在卓越亚马逊和当当网上选取的客户购买和评价数据进行聚类和层次分析，得出**网站的客户满意度更高一些。关键词: 卓越亚马逊、当当网、点评均分、购买金额、K-均值聚类 E-commerce customer satisfaction based on customer reviews BaoQiongqiong Abstract ： The new characteristics of customer demand for the e-commerce environment, the design requirements of the customer satisfaction evaluation project, in this description, and k-means clustering using AHP analysis by randomly selected in the Amazon and Dangdang online customers to buyclustering and hierarchical analysis and evaluation of data obtained ** website customer satisfaction higher. Keywords ：Amazon, Dangdang, Reviews equipartition purchase amount, K-means clustering 1 研究的目的和意义随着互联网的普及，我们进入了网络时代。有利益存在的地方就有竞争，传统零售业已达到白热化程度，一些商家进军电子商务市场领域。不管是传统还是网络，客户量仍是制约企业发展的一大因素。客户满意度决定着客户量，进而决定企业兴衰。因而电子商务客户的满意度必然成为我们新的研究热点，目前对电子商务客户消费心理和电子商务客户的行为特征研究的较多，在电子商务客户满意度方面研究还比较有限，本文采用层次分析法，针对电子商务中产品和服务类型较为相似的卓越亚马逊和当当网进行客户点评分数的比较分析，其重要意义在于给大众提供较为简单的方法进行网站比较，更合理的选择消费平台，同时也给网站运运营管理者以相互借鉴改进提供放向。 2 研究对象简介

当当网是全球最大的综合性中文网上购物商城，由国内著名出版机构科文公司、美国老虎基金、美国 IDG 集团、卢森堡剑桥集团、亚洲创业投资基金（原名软银中国创业基金）共同投资成立。 1999 年 11 月，当当网正式开通。成立十年来，当当网销售业绩增加了 400 倍。当当网在线销售的商品包括了家居百货、化妆品、数码、家电、图书、音像、服装及母婴等几十个大类，逾百万种商品，在库图书达到 60 万种。目前每年有近千万顾客成为当当网新增注册用户，遍及全国 32 个省、市、自治区和直辖市。每天有上万人在当当网买东西，每月有 3000 万人在当当网浏览各类信息，当当网每月销售商品超过 2000 万件。当当网的使命是坚持“更多选择、更多低价”让越来越多的顾客享购网上购物带来的方便和实惠。亚马逊中国是全球最大的电子商务公司亚马逊在中国的网站。一直都秉承 “以客户为中心”的理念，亚马逊中国承诺“天天低价，正品行货”，致力于从低价、选品、便利三个方面为消费者打造一个可信赖的网上购物环境。马逊中国，原名卓越亚马逊，是一家 B2C 电子商务网站，前身为卓越网，2004 年 8 月 19 日亚马逊公司宣布以 7500 万美元收购雷军和陈年创办的卓越网，将卓越网收归为亚马逊中国全资子公司，使亚马逊全球领先的网上零售专长与卓越网深厚的中国市场经验相结合，进一步提升了客户体验，并促进了中国电子商务的成长。2007 年将其中国子公司改名为卓越亚马逊。2011 年 10 月 27 日亚马逊正式宣布将他在中国的子公司“卓越亚马逊”改名为“亚马逊中国”，并宣布启动短域名(z)。亚马逊中国经营图书、音像、软件、图书、影视等。卓越网创立于 2000 年，为客户提供各类图书、音像、软件、玩具礼品、百货等商品。至今已经成为中国网上零售的领先者。通过“货到付款”等多种支付方式，为中国消费者提供便利、快捷的网购体验。 3 研究方法此次调查采用个案随机抽取数据，在卓越和当当上随机选择用户进行数据采集，每个网站共选取 200 条数据，数据内容包含用户名、评价次数、评价均分、

购买总金额、网址链接。 K-means 算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。 k 个初始类聚类中心点的选取对聚类结果具有较大的 V  k   i 1   S x j 2  u i 公式  x j i 影响，因为在该算法第一步中是随机的选取任意 k 个对象作为初始聚类的中心，初始地代表一个簇。该算法在每次迭代中对数据集中剩余的每个对象，根据其与各个簇中心的距离将每个对象重新赋给最近的簇。当考察完所有数据对象后，一次迭代运算完成，新的聚类中心被计算出来。如果在一次迭代前后，J 的值没有发生变化，说明算法已经收敛。算法过程如下： 1）从 N 个文档随机选取 K 个文档作为质心 2）对剩余的每个文档测量其到每个质心的距离，并把它归到最近的质心的类 3）重新计算已经得到的各个类的质心 4）迭代 2～3 步直至新的质心与原质心相等或小于指定阈值，算法结束具体如下：输入：k, data[n]; 1）选择 k 个初始中心点，例如 c[0]=data[0],…c[k-1]=data[k-1]； 2）对于 data[0]….data[n]，分别与 c[0]…c[k-1]比较，假定与 c[i]差值最少，就标记为 i； 3）对于所有标记为 i 点，重新计算 c[i]={ 所有标记为 i 的 data[j]之和}/标记为 i 的个数； 4）重复(2)(3)，直到所有 c[i]值的变化小于给定阈值。层次分析法：AHP 层次分析法是把复杂问题分解成各个组成因素，又将这些因素按支配关系分组形成递阶层次结构。通过两两比较的方式确定各个因素相对重要性，然后综合

决策者的判断，确定决策方案相对重要性的总排序。运用层次分析法进行系统分析、设计、决策时，可分为四个步骤进行。 1）分析系统中各因素之间的关系，建立系统的递阶层次结构； 2）对同一层次的各元素关于上一层中某一准则的重要性进行两两比较，构造两两比较的判断矩阵； 3）由判断矩阵计算被比较元素对于该准则的相对权重； 4）计算各层元素对系统目标的合成权重，并进行排序。 4 实证研究步骤 1 绘制散点图观察用户分布卓越数据散点图当当数据散点图

步骤 2 用 SPSS 进行 k-均值聚类分析，找到聚类中心卓越数据 k-均值聚类初始聚类中心聚类 1 2 3 4 点评分数的平均分 4.00 4.50 5.00 4.00 购买商品总金额 3613.90 1445.70 6.00 5823.00 迭代历史记录a 聚类中心内的更改迭代 1 2 3 4 1 2 283.175 220.694 166.386 .000 .000 .000 .000 .000 a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 2。初始中心间的最小距离为 1439.700。

最终聚类中心聚类 1 2 3 4 点评分数的平均分 4.35 4.21 4.17 4.00 购买商品总金额 3330.73 1225.01 172.38 5823.00 每个聚类中的案例数聚类 1 2 3 4 有效缺失 4.000 14.000 181.000 1.000 200.000 .000 当当数据 k-均值聚类初始聚类中心聚类 1 2 3 4 点评分数的平均分 5.00 4.93 4.92 5.00 购买商品总金额 24.50 1526.20 4193.10 2263.00 迭代历史记录a 聚类中心内的更改迭代 1 2 3 4 1 2 3 4 5 6 186.312 362.409 .000 118.250 12.037 145.943 .000 267.970 15.936 143.929 .000 139.955 10.084 98.303 10.709 57.515 5.668 37.733 .000 .000 .000 97.752 35.348 33.956

7 8 9 1.756 1.724 .000 7.561 7.366 .000 .000 .000 .000 .000 .000 .000 a. 由于聚类中心内没有改动或改动较小而达到收敛。任何中心的最大绝对坐标更改为 .000。当前迭代为 9。初始中心间的最小距离为 736.800。最终聚类中心聚类 1 2 3 4 点评分数的平均分 4.77 4.71 4.92 4.71 购买商品总金额 152.90 665.44 4193.10 1569.77 每个聚类中的案例数聚类 1 151.000 2 3 4 有效缺失 35.000 1.000 13.000 200.000 .000 比较两个网站的最终聚类中心，可以看出当当网的每类客户评价相对卓越的要高一些，尤其在购买金额最高的一类，平均评价竟有 4.92 分之高，远高于卓越的 4.35 分，这就说明当当的满意度更好一些。步骤 3：AHP 分析目标层准则层 O（满意度比较） C1 购买数量 C2 点评分数的平均 C3 购买商品总金额设要比较各准则 C1,C2,… , Cn 对目标 O 的重要性 )( aA  nnij  , a ij  ,0 a ji  1 a ij

CC : i j a ij A= 5 1 3 1   5/1 2   12/13/1       .0 .0 .0 640 206 154           =w1 列向量归一化 .0 .0 .0 652 131 217      .0 .0 .0 769 154 077 5.0 333 .0 .0 167      求行和归一化 Aw= Aw=w = 1 3 .0( .0 641 640  .0 .0 344 206  .0 .0 301 154 .1)  542 641   344   301  .0 .0 .0      w= 0.640 0.206 0.154] [ T =1.542 2 个网站关于 3 个标准的判断矩阵分别为：购买次数点评分数的平均购买商品总金额    2/11 2 1       11 11    2 1 12/1       由此可求得各属性的最大特征值和相应的特征向量各属性的最大特征值特征值购买次数点评分数的平均购买商品总金额  2 1 3 2 3      w2= 1 2 1 2 2 3 1 3      2 2 均通过一致性检验从而有 w=w2w1=      1 3 2 3 1 2 1 2 2 3 1 3           .0 .0 .0 640 206 154      =    .0 .0 419 581    在两个网站中，当当网的客户满意相对卓越更高一些。其次用 AHP 层次分析法计算出各个客户的权重

资料库

数据挖掘课程报告.doc

相关推荐

大数据

热门标签

最新资料