您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 阿里分类信息网,免费分类信息发布

阿里云的这群疯子

2022/6/13 23:47:59发布61次查看
世事安稳,岁月静好。
电影里才有疯子。麦克墨菲在疯人院里带领一群精神病人揭竿而起,怼天怼地;饿了三天的黑皮为了抢一口面包被店主追上高架桥,末路狂奔;杰克和泰勒在午夜的搏击俱乐部里挥拳相向,鲜血淋漓。屏幕对面,我们把爆米花塞进嘴里,哭成狗或者笑成狗。电影散场,各自回家。
真正的疯子,从来不看电影。
他们把别人的目光变成聚光灯,把自己的生活变成真人秀,手提钢刀用肉身串演一个浓重的角色。他们的人生结局无外乎两种:黄袍加身,或者玉石俱焚。
阿里云这群疯子,就用56度的荷尔蒙,在横跨十年的悠长画布上涂抹了这样一个故事。
(1)一个大问题
2008年9月,王坚加入阿里巴巴。
马云把他从微软亚洲研究院常务副院长的位置挖来,是因为阿里巴巴面临一个重大的危机——公司的“脑力”快不够用了。
阿里巴巴的“脑力”,其实就是“计算力”。
几亿用户无论是在淘宝剁手,还是支付宝上转账,这一切都要靠巨大的计算力来思考、记忆。
恰恰和人一样:
如果这个“大脑”记忆被填满,就没办法储存新的商品和交易记录。
如果这个“大脑”思维速度跟不上,就没有办法让用户及时下单、付款。
2008年,中国虽然已经加入 wto,还把国际友人请来热热闹闹地开了一次奥运会,但在科技领域仍然是个标准的“三无”国家:没有自己的操作系统,没有自己的芯片,同样没有自己的计算力系统。所以,购买国外成熟的设备和系统,几乎是 bat 和所有大国企的唯一选择。
国外的东西,无外乎“ioe”这三样标配:
i(ibm,服务器提供商,他们提供的服务器俗称“小型机”)
o(oracle,数据库提供商,他们的软件是著名的“甲骨文商业数据库”)
e(emc,存储设备提供商,他们提供的是“集中式存储”)。
鲜有人知,那时的阿里像依赖氧气一样依赖 ioe。
一个支付宝的同事给了我翻出了当年的数据:2008年,在阿里的it架构中,淘宝和支付宝使用的绝大部分都是 ibm 小型机、oracle 商业数据库以及 emc 集中式存储。
当年用户激增,数据越来越多,每天早上八点到九点半之间,服务器的处理器使用率都会飙升到 98%。离爆棚就差两个百分点。
阿里巴巴就像赛道上的跑车:速度飞快,但引擎已经发红,再踩几脚油估计就要冒烟,后果不堪设想。
可能连马云自己都没有想到,阻碍阿里巴巴增长最迫切的阻力不是商场上的博弈、不是政策的变化,而居然是 it 基础设施的瓶颈。
怎么办?花钱继续买服务器和软件啊!
这话听上去没错。但是有两个小问题:
一个问题是太贵。
那时候小型机价格大概是从几十万到百万人民币;商业数据库软件费用差不多几千万,外加一大笔维护费。王坚 08 年刚来阿里时就给马云算了算,按照这样的速度“剁手”,光是买机器和软件就足够让阿里破产。阿里得找到一种成本更低的技术架构。
另一个问题是不好用。
阿里在08-09年的时候,业务增长速度实在太快。每年都是十几二十倍,ioe 虽然都是美国公司,但事实证明美国的月亮也不会更圆。它们的系统并没有经受过服务几亿人这么大规模的考验,此时已经变得非常难用了。
2008 年中旬,马云召开了内部会议。事情已经刻不容缓,要研发一套新的技术架构来换掉阿里巴巴的旧引擎。
这个新的计算架构应该是什么样呢?
首先,它要便宜。
就像一日和三餐一样,无论去哪家餐厅,都不如自己做饭更实惠。长远来看,自己开发一套计算架构显然是最经济的。
其次,它要好用。
为了满足阿里巴巴庞大的计算任务,这套系统至少要比 ioe 表现更好,能同时调度数千台计算机,组成一个巨大无比的“大脑”。
于是,“阿里云”这个词,第一次出现在公司高层的话语里。而王坚,加盟阿里巴巴之后的职务恰恰是“首席架构师”,他的使命就是从零开始建立这个云计算系统。
王坚王坚是个理想主义者。
在他丰满的理想中,这个新架构的每一行代码都要自己来写。但现实骨感:环顾四周,他身边除了几位从微软带来的旧部,几乎一无所有。
2008年10月,这个想象中属于中国的云计算系统被团队定名为“飞天”,源自中国神话中的形象。
后来人们说,阿里云是技术驱动型的企业。不过在我看来,最初阿里云应该是起名驱动型的企业。名字倒是起得不错,但作为“三无”国家,底层科技起步较晚的中国在对美国的复杂计算机系统的战争中,几十年都未尝胜绩。
中国人研究的云计算,会“飞天”还是“坠毁”,旁人心里多多少少是有判断的,只是不便明说。
说回这个疯狂的计划。
飞天相当于一个发动机的,而时间紧迫,阿里巴巴准备同时做两件事:一边制造发动机,一边为自己的主力业务淘宝网顺便造一个整车出来。
当时,淘宝网在计算力方面的主要需求就是“大规模数据计算”。所以,用飞天为淘宝造“大规模数据计算”制造整车的计划就被定名为“云梯计划”。
实际上,“云梯计划”关乎阿里的生死,不是儿戏。思来想去,公司内部还是做了两手准备:
1)用一些已有的开源软件为基础,研发一个数据计算系统,这是“云梯1”计划。
2)而以“飞天”为基础,纯自研一套数据计算系统,被定为“云梯2”计划。
彼时绝没人想到,五年后的那个下午,这两座通向顶峰的云梯会用怎样的姿态占据画面的中心。千军万马雄列两旁,目睹荣耀的火焰和退潮的海水。
历史就这样以汹涌的姿态,向那些准备好的和没准备好的人敞开。
2009年阿里云成立(2)招兵买马
满弓是阿里云的第六位工程师。
招他进来的,是王坚在微软的旧部,阿里云的第一技术负责人林晨曦。面试结束时,林晨曦歪嘴一笑,提醒满弓:“你加入阿里云之后,要做好随时出差的准备。”
果然,满弓签完入职合同当天下午,就被“附赠”了一张火车票。他要去天津帮助招聘。
满弓这样回忆十年前的那个下午:
“阿里研发院” 2008年10月才成立,已经错过了招聘季的黄金时期。但是我们又确实太需要人才了,于是刻不容缓,要再扫荡一下那些大学,把“漏网之鱼”打捞回来。
2009年阿里云的招聘海报跟着阿里云的招聘队伍,满弓跑遍了全国主要的几大城市十几个学校。每到一个学校,只呆三天。
第一天做宣讲,然后马上笔试;第二天统一面试;第三天发 offer。
彼时的阿里巴巴已经很有名气了。很多错过招聘季的同学喜出望外,一时间各大学校风起云涌奔走相告齐来应聘,虽然从招聘者到应聘者,都没见过云计算长什么样子。
由于招聘人手实在太少,面对堆积如山的笔试试卷,满弓他们根本判不过来。焦头烂额的满弓擦汗时一回头,看到了同行的 hr 小姐姐。满弓两眼放光,二话不说把她们揪过来,一晚上就教会了她们如何判卷。
当时判卷的场景经过这样“连滚带爬”的招聘,到了2008年年底,阿里云凑够了了三十位工程师。
话分两头。
下有林晨曦招兵买马,上有王坚每天“画饼”。
马云深受王坚鼓舞。虽然不懂技术,但是他逐渐发现,云计算这件事情的价值比一开始想象中的要大得多。
这是因为云计算系统会制造出一种具有极强弹性的计算力。这样的计算力一方面可以为阿里巴巴添置家当,另一方面还可以“批发零售”给无数中小企业,为未来世界建设了一整套“基础设施”。
这样来看,就把“独善其身的工具”变成了“兼济天下的生意”,这不正是马云创建阿里巴巴的基本信念吗?
从这一刻开始,马云就对阿里云寄予重望。只要有空,就到阿里云的团队里和林晨曦、满弓这些工程师们一起聊天讨论。
马云、王坚和工程师们的合影然而,事情发展到这里,就开始有些错位了。
阿里的很多的业务部门希望的是稳定地在现有系统上加以改进,最好别冒太大风险;
但飞天团队却黄巾高擎赤膊上阵左右开弓,想依靠一己之力,开发出一套改写世界历史,可以让中国人扬眉吐气的完美云计算系统。
刚才我说阿里云是“起名驱动型的公司”,你看看这帮疯子给飞天内部模块的命名,就知道他们心里在想什么了:
分布式存储的系统,就像大地一样承载万物,那就叫“盘古”。
调度系统,需要“能掐会算”,就用懂得阴阳八卦的“伏羲”命名。
结构化存储系统,就用会盖房子的“有巢”。
网络通信,就用追日的“夸父”。
等等。
飞天团队一片斗志昂扬。
其他部门的很多领导层,用半信半疑外加慈爱的眼光看着他们。
(3)淘宝的一场战争
时间不等人,转眼到了2009年。
在隔壁淘宝网的普通员工中,有人在“隔江犹唱后庭花”,有人却已经感到“山雨欲来风满楼”。
2009年,小邪刚刚加入阿里一年,在淘宝网参与系统研发。当时他和同事都感觉到,淘宝网面临的矛盾非常明显:
业务并不赚钱,09年只有一个季度勉强盈利。而赚来的这点钱,眼看都要填进去购买服务器和软件产品,入不敷出。
小邪记得很清楚,他昨天刚听说隔壁阿里云准备搞云计算,今天就迎来了一个“特殊的客人”。
林晨曦走到淘宝网技术团队面前,搬个板凳兀自坐下:“你们淘宝的大数据系统用我们的阿里云架构吧。”
“代码已经写了多少?”小邪问。
“几行吧。”林晨曦说。
事情就这样定下来了。
云梯1、云梯2,两套系统一边搭建,一边在淘宝内部实验,一边承担部分计算任务以缓解现有系统不足的压力。
当时淘宝技术保障数据库管理员的负责人是后羿。他几次欲言又止,还是硬着头皮在内部会议上宣布了这个消息:淘宝要放弃 oracle,转投自研的数据库架构了。
结果,八十多个 oracle 工程师把他堵在会议室里。“你再说一句试试?”
他们的愤怒完全合情合理。“如果上边铁了心要干,兄弟们的前途在哪里?”
最终,一场恶斗转化成了几十个工程师坐在会议室促膝谈心。技术人是讲理的:淘宝已经这么大了,如果现在不刮骨疗毒,自己砸自己的饭碗,将来整个淘宝都会命悬一线,到时候大家还不是沦落天涯。想通了这些,工程师们也冷静多了。
这八十多个工程师里,包括后来的阿里技术保障部负责人振飞。振飞站出来说:“好,让我们学新技术可以,但是咱们拿事实说话。你后羿敢不敢跟我打个赌?以三年为限,用新技术的淘宝核心交易系统必须达到零故障!”
后羿咬咬牙,敢!
但后羿一个人的分量还远远不够重。毕竟淘宝上有这么多业务,这么多买家,这么多卖家,万一数据迁移失败,谁来负责?时任淘宝技术总架构师行癫(现任阿里巴巴 cto)见状,把心一横,宣布自己和部门也愿意站出来,共同承担技术风险:“干好了我们大家荣誉等身,干坏了要杀要剐我来扛!”
看到行癫都赌上了自己的身家性命,也就没人再说什么了。
2009年秋天,轰轰烈烈的 it 架构升级项目在淘宝网正式启动。一群 oracle 工程师,就这样含着泪,一点一点亲手拆毁自己安身立命的系统。
(4)荒野求生
林晨曦用来“忽悠”淘宝网的“几行代码”,是在北京写出来的。
2009年春节上班第一天,在北京上地的汇众大厦203这间连暖气都没有的办公室里,一帮工程师一边口呼白气,一边敲出了“飞天”的第一行代码。
飞天的第一行代码说起来,这个地方算是阿里云最早的办公室,但是门口也没个牌子。直到半年后他们搬出大厦,保安都不知道这帮神神叨叨的人究竟是干什么的。(不过十年后的今天,他们的手机里的很多 app 也许都跑在阿里云的服务上。)
每天,工程师们除了噼里啪啦写代码,还得顺便“荒岛求生”——自己订水、买垃圾桶、修桌椅板凳、修无线网,连茶叶和咖啡都是从自己家带来的。
不过,他们坚信自己在做的事情还是挺伟大的。“没准将来我们成功了,我们写的飞天第一行代码还能印在t恤上呢!”角落里有人瑟瑟发抖地说。
那个时候的他们,看上去和一帮戴着眼镜的教徒无异。
时间马上又到了夏天。北京的夏天,你懂的。当时测试系统的服务器就架在办公室里,这就是个巨大的火炉。大厦的空调不行,还没到七月份,程序员就热得撑不住了。为了降温,每天上午他们都叫冰场送两大块冰来。
有一次周六,马云来北京,专门到阿里云的办公室去看看。林晨曦赶紧想打开电脑给马老师展示一下自己团队的成果。结果按了半天开关,机器都没反应。他才发现大厦停电。。。马云就这样坐在办公室等了半个小时,直到物业恢复供电才一睹阿里云飞天系统最初的芳容。
王坚跟马云说,这帮人很能干,每天晚上都加班。马云惊了,在这种地方还能加班??没过几天,阿里云就搬出了这幢大楼,进入了有空调的办公室。
同事们往办公室里运冰(5)神坑,阿里云
金融大咖胡晓明,2005 年加入阿里,以办事雷厉风行闻名全集团。
2009年6月,马云找到胡晓明,准备交给他�...
阿里分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录