在互联网高速的发展下,虽然硬件能力发展速度也很快,相同的成本下每18-24个月翻一番的增长(也被称为摩尔定律),而数据的发展速度远远的高于硬件,为互联网公司造成了很大的挑战。
阿里巴巴早期使用Oracle数据库进行数据存储。这种互联网1.0时代的数据库架构很快就难以承受住电商数据的爆发式增长。阿里巴巴不得不彻底换血,重金打造和使用自己研发的数据库。
京东在2013年以前经常因访问量暴增而造成服务器瘫痪,不得不更新后台架构,用java技术取代.net技术。
我们感受最深的应该还是前几年的12306网站的购票灾难。过年要回家,这是我们中国人的传统。为了方便购票,铁道部对购票系统进行信息化升级,12306网站上线。不过当时并没有料到互联网带来的数据挑战是什么。本想方便群众购票,却首先创造了不方便,上亿人同时查询、购买车票的行为 让服务器迅速卡死。很多批评声音出现,认为程序员无能,认为换上电商工程师就能解决这个问题。
但真正关键的因素还是处理能力跟不上数据发展。有人专门比较了电商网站与12306网站。“双十一”时,淘宝等电商网站虽然也承受了海量人群的下单行为,但是这些单子被分布到数量巨大的商品上,彼此之间相关度很低,计算量也被服务器分摊了。火车票则不同,全国班次就那么多,而火车票的抢购中,每一趟火车的千余个座位很可能面临数万升至数十万人的抢购,火力及其集中。每发生一次购买行为,出飘系统不但要分析该车次所有站点的数据,还要计算数十倍于车次出票的抢票顺序数据,并实时更新沿线车站可售票数,可以说是牵一票而动全身。数据和计算量呈几何式增长,而且一切还要在瞬间完成,即便不计成本投入更多服务器也难以解决。这种难题是大电商也没有遇到过的,之后后来探索出新的计算架构和方法,才得以缓解。
BAT中最早面临大数据冲击的还有百度,“百度一下,你就知道”,全民搜索行为将海量数据发向百度服务器。日夜增长的网络信息也让百度内容爬虫疲于奔命。后来通过预搜索方式下,才得以解决。
留言与评论(共有 0 条评论) |