logo资料库

经典的云计算入门教材:云里雾里的云计算.pdf

第1页 / 共92页
第2页 / 共92页
第3页 / 共92页
第4页 / 共92页
第5页 / 共92页
第6页 / 共92页
第7页 / 共92页
第8页 / 共92页
资料共92页,剩余部分请下载后查看
            云里雾里的云计算(外一篇)         发表 by 邓侃cchere.com2009.01 整理by许栋2009.09  
目  录   第 1 章 云里雾里的云计算 ........................................................................................3 序 ................................................................................................................................................ 3 1.1云计算要解决什么问题? ............................................................................................... 3 1.2从 Google 集群到云计算,云计算的商业模式.......................................................... 4 1.3Google 云计算的矛头指向谁? .................................................................................... 8 1.4云计算大战,Google 出招 ..........................................................................................13 1.5是云计算,还是云存储? .............................................................................................18 1.6安全性的难题,有解还是无解?.................................................................................23 1.7天上究竟会有几朵云?..................................................................................................30 1.8云中说禅...........................................................................................................................34 1.9赚钱才是硬道理 ..............................................................................................................39 1.10结束语 ............................................................................................................................43 1.11补 1:赚点钱不容易....................................................................................................45 1.12补 2:云计算经济学之一现金流.............................................................................47 1.13补 3:云计算经济学之二时间成本.........................................................................50 1.14补 4:云计算经济学之三声誉成本.........................................................................53 1.15补 5:商机与商战之一...............................................................................................56 1.16补 6:商机与商战之二...............................................................................................60 1.17补 7:商机与商战之三...............................................................................................62 1.18补结束语.......................................................................................................................66 第 I 页 共 93 页
第 2 章 外一篇:闲话 Google 集群....................................................................... 67 2.1引子...................................................................................................................................67 2.2存在的理由 ......................................................................................................................70 2.3布局...................................................................................................................................73 2.4数据流和控制流的分离..................................................................................................77 2.5同步的诀窍 ......................................................................................................................81 2.6同步的苦恼 ......................................................................................................................86 第 3 章 相关论文资料 ............................................................................................ 91 第 II 页 共 93 页
 第1章 云里雾里的云计算  序  有一次去开会,台上的人在讲云计算。我问身边的听众,“听懂了吗?感觉 如何?” 听众答,“云里雾里,感觉特神秘。” 我说,“这说明讲员讲得好。有没有注意到寺庙里的气氛也很神秘?不神秘, 就没有崇拜。不崇拜,你怎么肯掏钱买香火?” 1.1 云计算要解决什么问题?  1997 年,Google 的两位创始人,Larry Page 和 Sergey Brin,找 Andy Bechtolsheim 募集投资。 Andy 问,“你们打算做什么?” Larry 和 Sergey 答,“打算把互联网上所有网页都下载,然后建一个搜索引 擎。” Andy 说,"把互联网上所有网页统统下载?!需要多大空间?几个 Giga 不 行吧,几个 Tera 也不行吧,几个 Peta,几个 Zetta?。。。嗯,我看几个 Googol 也许才能撑得住。知道 Googol 吗?就是 10 的 100 次方,就是一个 1 后面拖 100 个 0!" 估计是 Andy 觉得这个项目不太靠谱,所以给的钱不多,只有 1 百万美元。 只有这么一点钱,如果去买高端的存储系统,显然是不够的。走投无路的情况下, 第 3 页 共 93 页
Larry 和 Sergey 决定用 PC 之类便宜的机器,组建一个机器集群。先凑合着用, 等以后数据量增加以后,再购买更多的 PCs,扩大集群的容量。 这个故事的真实性,有待考证。但是从中可以看到 Google 集群,也就是 Google 云计算的核心,要解决的四个问题。 1.大规模的存储空间,用于存储海量的数据。 2.随着业务的发展,新的数据源源不断地增加,存储空间需要相应扩大。用 术语讲,这叫可扩展性,scalability。 3.系统的硬件设备必须便宜,通常使用大宗产品(commodity),譬如 PC, 或者价格便宜,中等性能的 Dellserver。 4.便宜的硬件设备,经常死机。所以在设计这个集群的时候,必须保证不能 因为个别机器死机,导致整个系统的崩溃。也就是系统的稳定性要好,reliability。 1.2 从 Google 集群到云计算,云计算的商业模式  起初 Google 集群是供内部使用的系统。Google 为什么要开放这个系统, 包装成云计算平台,给外界使用呢? 这要从 Google 的商业模式说起。Google 的绝大多数收入来自于广告,其 它产品和服务的收入十分有限。其它产品包括 Google 盒子,这是给企业内部网 用的搜索引擎。把 Google 盒子安装到企业内部网,企业员工就可以搜索企业内 部的文档,包括可以公开的文档,也包括仅供企业内部查阅的资料。虽然技术很 新颖,但是卖得并不好。据 ZDNet 的报道,2008 年度,Google 盒子的收益, 占 Google 总利润的份额,不到 2%。 第 4 页 共 93 页
 Googlesearchappliance,俗称 Google 盒子。 单一的收入来源,抗风险的能力差。譬如经济危机一来,各个企业的广告预 算缩减,势必影响到 Google 的利润。怎么办?挖掘自身的优势,发现更多卖点, 搞多种经营。 Google 的技术优势在哪里?有人说,Google 的搜索结果精确,所以 PageRanking 算 法 是 其 精 髓 。 其 实 , 算 法 容 易 模 仿 复 制 , 即 使 几 年 前 PageRanking 是 Google 的独家秘籍,但是今日各大搜索引擎,都有类似算法。 让 Google 独步天下的是它的集群。2006 年,Google 集群的规模 是 45 万台机器。两年过去了,有人推测现在的规模又翻了一番。由于 Google 从不公 布准确数字,所以大家只能靠 Google 给硬件厂商下的订单推测。 推测虽然不准确,但是即便是 10 万台机器的规模,在历史上也是从无古人 的,在当代也是独一无二的。而且,更重要的,是这个超大规模的集群系统经历 了 10 年的实际运行,被实践证明是可靠的,是可扩展的,每台机器的价格也是 低廉的。完全符合上一节列举的四个要求。 但是如何依靠这个独门神器挣钱呢?思路有两条。 第 5 页 共 93 页
1.做 hosting,数据托管。其它企业不用建自己的数据中心了,把数据存在 Google 的集群里得了,每个月交点托管费。 2.不少 Google 的应用服务很有人气,譬如 Gmail,Gtalk,Reader,Online docs,Picasa,Google earth 还有 YouTube 等等。这些服务对于个人用户而 言,完全是免费的。但是 Google 从来没有说给企业用户使用,也是免费的。譬 如某家商店,开了一个网站,网站上需要贴很多照片,还要给个地图给顾客引路。 这个商店不需要自己动手建照片存储中心,也不需要开发技术难度更高的地图软 件,只要调用Google 提供的相关服务就好。对于这种服务,Google 当然是要 收钱的。 第二个思路还有个副产品,那就是给 Google 创造更高的流量。流量越大, 说明观众越多。对于广告商来说,哪里观众多,就愿意在哪里投放广告。所以, 如果第二个思路能给 Google 带来更高流量,那么会吸引更多的广告,给 Google 带来更多的广告收入。 Google 的高管们一合计,觉得有钱途。于是乎,大张旗鼓地开始制造舆论, educatethemarket。 造舆论,讲究的是措辞的简练,气势的磅礴。这个新的服务叫什么?用工程 师的语言,准确地定义,应当是“超大规模的,可扩展的,低成本但是高可靠性 的服务器集群系统”。Google 市场部的人一听,头摇得像拨浪鼓。不行不行, 既不简练,又没有气势。 研究来研究去。于是乎,“云计算 cloud computing” 这个概念粉墨登场 了。  第 6 页 共 93 页
关于云计算概念如何粉墨登场,我们再详尽地八卦一下。 Google 对外推出云计算这个概念有偶然因素,一个叫做 Christophe Bisciglia的Google工程师在自己的母校(UniversityofWashington,坐落 于微软的大本营附近)开了两门课讲 GFS和MapReduce,告诉学生们微软落 后啦,未来都是服务器端的应用,Google 已经为此开发出服务器端的存储(GFS) 和计算方法(MapReduce),所以同学们今后可以考虑用这些技术来对整个互 联网进行计算操作,学生们很兴奋,Christophe 也看到自己的机会。 他的技术水准也到不了哪里去,但是能忽悠,回到公司一报告,使得 Google 的 CEO 等人觉得:对啊,如果大学生们都只会学单机上的 OS 和编程,以后他 们即使有好的互联网方面的想法,也只会是 Google 的敌人,何不趁此机会,推 广一下自己的 infrastructure,让孩子们有了想法都直接在Google 平台上实现, 岂不化敌为友,还将微软一军? 然后,高管们就开始运作铺天盖地的“云计算”概念。 在 Christophe 的课程中,一位大二女孩子的小项目吸引了一位 idea 满天 飞的朋友。女孩子的项目简单到有点可笑,她就是把世界上主要报纸的内容爬下 来放在 GFS 里,然后根据新闻的发生地用 MapReduce 聚类,把同一地区的新 闻标注在GoogleMaps 相应的位置上。 这也太简单了吧,杀鸡何用牛刀,几个 scripts 和一个硬盘就搞定的事何必 用云计算呢?非也。我和那位拥有无数狂野 ideas 的朋友聊到这个小事——这 发生在“云计算”进入公众视野之初,绝大多数人还云里雾里的时候。朋友想想 说:不错,这样一来,互联网对我来说就透明了,原来掌握在少数公司手里的资 源现在我这等人也可以拿到了,只要有想法,钱还不花花的。 第 7 页 共 93 页
分享到:
收藏