logo资料库

基于Logistic、Gompertz 及Bass模型的中国互联网扩散的研究及模型对比.pdf

第1页 / 共6页
第2页 / 共6页
第3页 / 共6页
第4页 / 共6页
第5页 / 共6页
第6页 / 共6页
资料共6页,全文预览结束
中国科技论文在线 http://www.paper.edu.cn 基于 Logistic、Gompertz 及 Bass 模型的中 国互联网扩散的研究及模型对比 5 10 伍凌,贾怀京** (北京邮电大学经济管理学院,北京 100876) 摘要:利用技术扩散符合 S 型曲线之规律,对中国互联网扩散进行了曲线拟合,发现其未来饱和渗透率为 61%左右。2013~2014 年间,中国互联网正处于高速增长阶段。在 2025 年前后,中国的互联网渗透将逐渐 趋于一个稳定的水平(61.07%)。另外,失去起初阶段的扩散数据后,Logistic 曲线拟合结果存在过份乐观 的倾向。同时对比了中国互联网扩散基于 Logistic、Gompertz 及 Bass 模型的三种拟合结果,发现 Logistic 曲线拟合是三者中最优的预测模型。 关键词:技术扩散;互联网;Logistic 模型;Bass 模型;Gompertz 模型 中图分类号:F224-3 15 The Forecast of Internet Diffusion Research bassed on Logistic, Gompertz and Bass model and model comparison (Economics and Management School, Beijing University of Posts and Telecommunications, WU Ling, JIA Huaijing Beijing 100876) 20 25 Abstract: As the technology diffusion follow the law of the S-shaped curve, the China’s Internet diffusion curve fitting result shows that the Internet saturation penetration rate in the future is 61%. 2013 to 2014, China's Internet is in a stage of rapid growth. In 2025, China's Internet penetration will gradually tend to a stable level (61.07%). In addition, when diffusion data lost the first stage, Logistic curve fitting results have the too optimistic tendencies. Compared the results of China’s Internet diffusion based on the Logistic, Gompertz and Bass model, Logistic model is the optimal forecasting model. Key words: Technology Diffusion; Internet; Logistic Model;Bass Model; Gompertz Model 0 引言 30 对于技术扩散进程的研究早已为前人重视,而大量地出现在文献之中。根据统计数据, 我们可以明显看到不同的国家技术扩散在某一个确定的时点,总是呈现不同扩散程度。本文 针对一种特定技术——互联网在扩散进程中出现的差异进行了研究,以期望可以发现产生这 些差异背后的规律。 由是,我们尝试用不同模型对中国互联网当前和未来的扩散的内在规律性进行探索。在 35 第一部分,本文利用技术扩散的 S 曲线规律,对互联网扩散进行了 Logistic 曲线拟合,预测 了互联网的未来发展的趋势。在第二部分,我们利用 Gompertz 模型 及 Bass 模型进行的互 联网扩散的曲线拟合,结合第一部分,探讨了三种模型的拟合结果的优劣。 1 国内外互联网扩散研究综述 40 关于国外的互联网扩散研究,Sangmoon Kim(2010)[1]利用美国 1994-2007 年的数据,对 互联网扩散进程进行了分析,发现互联网使用数据很好的拟合了 Logistic S 曲线,并且在计 作者简介:伍凌(1989-),男,硕士研究生,企业管理 通信联系人:贾怀京(1962-),男,副教授,企业管理(市场营销、金融学、公司治理等). E-mail: jhjia001@tom.com - 1 -
中国科技论文在线 http://www.paper.edu.cn 45 50 算 机 图 形 界 面 操 作 系 统 引 入 之 后 开 始 迅 速 扩 散 。 Luis Andres, David Cuberes, Mame Diouf(2010) [2]研究了 214 个国家在 1990-2004 年间的互联网扩散情况,发现各组数据都有 S 型 曲线的 特点。 此外,有 很多学 者研究 了技术扩 散符合 S 曲线的 事实。 这 包括了 Griliches(1957) [3], Gort,Klepper(1982) [4]等的实证研究以及 Jovanovic and Lach(1989) [5]等的 理论模型。Sangmoon Kim(2010) [1]也研究了互联网扩散的趋势,发现了美国互联网普及的过 程很好的符合了 Logistic S 曲线。Luis Andres, David Cuberes, Mame Diouf(2010) [2]也验证了 互联网符合 S 型曲线的假设,也表明不同国家的收入水平也对互联网扩散有显著影响。 国内互联网扩散的研究相对滞后。张彬等[6](2002)根据所统计的 Internet 上网用户数, 对 Internet 采用者扩散过程进行了模型参数的估计,建立了 Internet 采用者扩散模型,并对今后 几年 Internet 产品扩散过程进行了预测和展望。程鹏飞,金兼斌,吴科特[7](2006)研究采用基 尼系数概念来描述互联网发展的地区不平衡,并通过回归方法分析影响互联网扩散的关键因 素。程淑娜[8](2011)利用技术创新时空扩散模型,对互联网在我国大陆总体及各区域的扩 散过程进行了研究。 本文希望可以填补文献中以下两个空白。首先,基于包含有最初扩散时点数据的扩散数 55 据,本文对中国互联网扩散进行 Logistic 函数的 S 型曲线拟合,验证了国外学者的假设(事 实上,本文使用的数据涵盖中国互联网扩散的早年数据,而这点对于拟合研究的准确性是有 重大影响的)。其次,通过不同模型的拟合结果的对比,找到较为合适的曲线拟合方法。 2 分析 2.1 基于 Logistic 函数扩散趋势分析 60 参考美国墨西哥大学教授罗杰斯的创新扩散理论,创新技术扩散的发展通常呈现 S 形, 当普及率在 10%~20%之间时,扩散过程会加快,直至达到一定数量之后才会慢下来1。美国 和韩国的互联网网民普及率的增长趋势符合创新扩散理论2。为了知晓中国互联网扩散的基 本情况,本文首先将要对 2000 年-2011 年的互联网普及率进行分析研究。前面提到 Jovanovic 和 Lach(1989)曾利用实证研究验证了新技术扩散在很大程度上符合 S 型曲线或是 Logistic 65 曲线的假设。本文在此处有两个贡献:首先我们验证了中国的互联网扩散符合 S 型曲线;其 次我们在验证中使用了更加完整的数据,这包含了中国互联网普及的最初年份的宝贵数据, 这可以在很大程度上解决由于最初数据缺乏而导致的拟合之 S 型曲线增长过快的问题3。 为了更好地拟合互联网普及进程,本文采用了 Logistic 函数(其他还有 S 型曲线函数还 有 Bass 函数和 Gompertz 函数)。由于其简便性,这个函数经常被用拟合 S 型的扩散进程。 70 拟合过程中使用的 Logistic 函数表达式为: (1) 1 《创新的扩散》,Everett M. Rogers,中央编译出版社,2002 年 6 月。 2 美国 1998 年的互联网普及率是 18.6%,1999 年即快速增长到 26.2% ;韩国 1999 年的互联网普及率 是 22.4%,2000 年则跃升至 33%,网民规模从 943 万快速增加至 1393 万 。 3 详见 Comin , D.,& Hobijn, B.(2004) - 2 - etcbaY*1
中国科技论文在线 http://www.paper.edu.cn 表达式中,Y 表示被拟合的中国互联网渗透率4,t 表示时间即 1997~2011 年,ε 表示其 他因素导致的误差项。式子共有三个参数 a、b、c,其中 a 表示长远状态下互联网的扩散水 75 平,即是当 t 趋于无穷时,Y 的极限;b 是拟合过程中同 t 规模相关的一个常数;而 c 反映 了扩散的速度。上式的拟合使用了非线性回归拟合方法(这是一种利用迭代方法得到最小平 方差,而求得最优解的方法)。 根据收集得到的 1997~2011 的实际数据,按照上述方法进行拟合。表一给了逻辑曲线拟 合的结果,其 R2 为 0.9936,这表明曲线拟合的结果很好。在结果中我们看到,中国互联网 渗透率的长期极限值为 0.6107,也就是 61.07%。 80 由于最初数据的缺乏,会导致的拟合之 S 型曲线增长过快。关于初始年份的数据的重要 性,文献综述中 Luis Andres, David Cuberes, Mame Diouf(2010)也进行了实证研究,结果发现 没有最初数据而得到的 Logistic 曲线会变得陡峭。为了在这方面提供中国互联网相关的实证 研究,我们去除 1997~2000 的这段中国互联发展起初阶段的扩散数据,仅仅对 2001 年到 2011 85 年间的互联网渗透率进行 Logistic 函数拟合。结果表一所示。对比之前的结果,同时结合图 一,我们可以发现: 1)缺乏初始数据的拟合曲线 a 值比包含全部数据的拟合曲线之 a 值大(见拟合结果)。 这验证了‘在无限制样本中,s 型曲线拟合结果存在过份乐观的倾向’的假设。 2)缺乏初始数据的拟合曲线 c 值比包含全部数据的拟合曲线之 c 值小。由于 c 反映了 90 互联网扩散的速度,这就意味着包含全部数据的拟合曲线可以在更加短暂的时间里面达到极 限水平,即是在更短的时间内达到长期扩散的极限值。 3)缺乏初始数据的拟合曲线比包含全部数据的拟合曲线更加陡峭。这验证了‘在忽略 初始数据的情况下,s 型拟合曲线的斜率会变得更加陡峭’的假设。 最后,根据图一,我们还发现在基于 1997~2011 的实际数据的得到拟合曲线在 2025 年 95 左右就十分接近于极限值 0.6107 了,这表明在 2025 年前后,中国的互联网渗透将逐渐趋于 一个稳定的水平(61.07%)。另外值得注意的是,该拟合曲线在 2013~2014 年间斜率达到 了最大值,即是说实现了互联网的快速扩散,故我们认为中国互联网目前(2013 年)已经 达到了关键多数5 (critical mass),正处于正处于快速增长阶段。 100 表 1 基于 1997~2011 年和 2001~2011 年和中国互联网渗透率的 Logistic 曲线拟合结果 Tab. 1 China's Internet penetration logistic curve fitting results based on data 1997-2011 and 2001-2011 标准差 拟合优度 R2 参数 估计值 标准差 拟合优度 R2 参数 0.9936 (1997~2011 年) a b c 估计值 0.6107 0.27 0.991 773.0123 79.543 (2001~2011 0.385 0.04 年) a b c 0.62395 0.518 760.136 105.271 0.37825 0.053 4本文的互联网渗透率数据是通过 CNNIC 互联网调查和国家统计公报之数据间接获取的,其计算公式 为:t 年互联网渗透率=100%*t 年底网民总人数/(t-1)年底人口总数。 5关键多数指创新体系中接受某一创新的人数达到某个数量,其后该创新就会自行扩散出去 (self-sustaining) (Rogers, 2003)。 - 3 -
中国科技论文在线 http://www.paper.edu.cn 图 1 基于 Logistic 函数拟合中国互联网渗透率之结果 Fig. 1 Fitting Results of Internet Penetration in China based on Logistic 105 2.2 基于 Gompertz 及 Bass 模型扩散趋势分析 Gompertz 曲线即是龚伯茨模型,是由英国统计学家和数学家 Gompertz 提出的,是一种生 长曲线,其基本数学式为: (2) 110 式中,a、b、k 均为常数;t 为时间序列;y 为对应时间的预测值。该模型在图形上呈现反 S 形分布特征,并具有良好的适用性和成长曲线的一般特点,与 Logistic 曲线有着相似的特征。 在诸多扩散模型中, Bass 模型及其后来的扩展型是其中最重要的组成部分,特别是用于 实证分析的应用模型,几乎都是以 Bass 模型为基础展开研究的。1969 年, Frank M. Bass 融合 了 Fourt 和 Wood-lock 与 Mansfield 提出的 2 种模式,并假设新产品的潜在采用者会受到 2 种 115 传 播 方 式 的 影 响 : 一 是 潜 在 采 用 者 会 受 到 大 众 媒 体 的 影 响 , 又 称 为 外 部 影 响 (External Influence),此类的采用者称为创新者(Innovator);二是潜在采用者会受到口头传播的影响,又称 为内部影响(Internal Influence),此类的采用者称为模仿者(Imitator) ,通过对 11 个耐用品的市 场扩散研究,提出了耐用品的一次购买模型,简称 Bass 模型。其形式为: 120 f(t)/[1-F(t)]=p=qF(t) f(t)为在第 t 时刻采用者的采用速度(非累计采用者比例),F(t)为在第 t 时间累积采用者占 全部采用者的比率,令 mf(t)=n(t),F(0)=0,其中 m 表示潜在的采纳者总数(即市场的最大潜力), 则累积采纳者人数为 N(t)=mF(t),因此可得 Bass 基本模型的累积采用者 S 型曲线 N(t): (3) Bass 将 p 视为创新系数,q 视为模仿系数。Bass 模型需要估计的参数为最大市场潜力 m, - 4 - abktyt)(eetqptqppqmtN)()(11)(
中国科技论文在线 125 外部影响系数 p 和内部影响系数 q。 http://www.paper.edu.cn 最大市场潜力 m:产品扩散在成熟期以前,一般以专家预测法来预测最大市场潜力 m 的数 值。外部影响系数 p 和内部影响系数 q:关于 Bass 模型中参数 p 和 q 的估计,人们已经提出了 很多方法。 130 根据收集得到的 1997~2011 的实际数据,按照上述方法进行拟合6。表 2 给出了 Gompertz 及 Bass 模型的曲线拟合结果,其中 Gompertz 模型的拟合优度 R2 为 0.9912,这表明曲线拟 合的结果很好。但是同时我们也看到,Bass 模型拟合优度 R2 为 0.9152,结果不尽如人意。 而且在结果中我们看到,龚伯茨模型中国互联网渗透率的长期极限值 k 超过了极限值 1,另 外,Bass 模型的 m、p 参数估计值都没有在 0~1 的正常范围之内。 表 2 1997~2011 年中国互联网渗透率基于 Gompertz 及 Bass 模型之曲线拟合结果 135 Tab. 2 China's Internet penetration curve fitting results based on Gompertz and Bass model in 1997-2011 拟合优度 R2 参数 估计值 拟合优度 R2 参数 0.9912 (Gompertz 模型) k a b 2.60 0.09 2017.76 0.9152 (Bass 模型) m p q 估计值 -0.02 -5.69E-21 0.02 2.3 Logistic、 Gompertz 及 Bass 模型的拟合结果对比 本文将三者的参数估计值代入各自模型的函数表达式,求得了 Logistic、 Gompertz 及 Bass 模型各自的拟合曲线的结果,如表 3 所示。 140 Tab. 3 Comparison of China's Internet penetration curve fitting results based on Three model 表 3 Logistic、 Gompertz 及 Bass 模型的拟合曲线预测结果对比表 年份 实际值 y Logistic 模 Gompertz 模 Bass 模型预 型预测值 型预测值 测值 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 0.000502 0.004967 0.002532 0.001683 0.00727 0.004696 0.007076 0.010622 0.008244 0.017888 0.015478 0.013764 0.026589 0.022473 0.021955 0.049039 0.052861 0.057228 0.062264 0.068133 0.046307 0.032456 0.033593 0.07506 0.06189 0.046523 0.04949 0.07274 0.06599 0.070436 0.085392 0.092272 0.097144 0.104775 0.126588 0.130198 0.159759 0.169494 0.170006 0.225537 0.220324 0.216771 0.289152 0.276832 0.270483 0.342614 0.335382 0.330914 0.382651 0.391784 0.397639 0.083357 0.093471 0.106072 0.122198 0.143566 0.173218 0.217121 0.288773 0.426593 由表中数据可以明显的看到 Logistic、 Gompertz 模型的预测值,明显优于 Bass 模型。 同时考虑到龚伯茨模型的 k 值大于 1,不符合其自身模型的假设。所以本文认为,逻辑曲线 拟合是三者中最优的模型预测结果。 6 这里采用的算法是迭代算法,其具体优化算法是准牛顿法(BFGS) - 5 -
中国科技论文在线 http://www.paper.edu.cn 3 结论 145 本文利用技术扩散的 S 曲线规律,对互联网扩散进行了 logistic 曲线拟合,预测互联网 的未来饱和渗透率为 61%左右。2010~2012 年间,中国互联网正处于正处于高速增长阶段。 在 2025 年前后,中国的互联网渗透将逐渐趋于一个稳定的水平(61.07%)。另外值得注意 的是,该拟合曲线在 2013~2014 年间斜率达到了最大值,即是说实现了互联网的快速扩散, 故我们认为中国互联网目前(2013 年)已经达到了关键多数(critical mass),正处于正处于 150 快速增长阶段。另外,在失去起初阶段的扩散数据后,S 型曲线拟合结果确实存在过份乐观 的倾向。 同时,本文基于 Gompertz 及 Bass 模型对互联网扩散趋势进行了分析,发现 Logistic、 Gompertz 模型的预测值,明显优于 Bass 模型。同时考虑到 Gompertz 模型的参数 k 估计值 大于 1,不符合其自身模型的假设。所以本文认为,在中国互联网扩散的 S 型曲线拟合中, 155 Logistic 曲线拟合是三者中最优的预测模型。 [参考文献] (References) 160 165 170 [1] Sangmoon Kim. The diffusion of the Internet: Trend and cause[J]. Social Science Research,2011,(40): 602-613. [2] Luis Andres, David Cuberes, Mame Diouf, Tomas Serebrisky. The diffusion of the Internet: A cross-country analysis[J]. Telecommunications Policy,2010,(34):323-340. [3] Griliches, Z. Hybridcorn: An exploration in the economics of technological change. Econometrica[J], 1957, 25, 501-522 [4] Gort, M., &Klepper,S. Time paths in the diffusion of product innovations. The Economic Journal[J], 1982, 92, 630-653. [5] Jovanovic, B.,&Lach,S.Entry, exit, and diffusion with learning by doing. American Economic Review[J], 1989, 79, 690-699 [6] 张彬,杨国英,荣国辉. 产品扩散模型在 Internet 采用者分析中的应用[J]. 中国管理科学. 2002(02) [7] 金兼斌,吴科特. 我国互联网扩散之地区差异的影响因素探究[J]. 南京邮电大学学报(社会科学版). 2006(04) [8] 程淑娜. 技术创新时空扩散模型在我国互联网扩散中的应用研究[D]. 重庆:重庆师范大学, 2011. - 6 -
分享到:
收藏