导读:全文将围绕以下三方面内容介绍阿里云Elasticsearch技术。
01
阿里云Elasticsearch业务
1. 业务规模
阿里云Elasticsearch业务(简称ES),从2017年至今已经服务了几千个客户,数据规模达20PB,在公共云上拥有10000+集群,10W+节点规模,是一个成熟的云原生服务。
2. Elasticsearch在日志场景通常会遇到的问题
在企业的数字化转型过程中会生成大量日志数据,企业通过Elasticsearch满足日志检索、存储、归档审计的需求,而这些需求归根结底都会落到成本的增加,体现在以下三个方面:
3. 风险解读
在正常情况下,流量到ES协调节点,然后将数据写入Data Node;当流量变成正常情况的10倍时,对ES集群的压力就变得很大,一系列问题会接踵而来。
这种情况可以通过集群扩容的方式进行缓解,但扩容的同时又会产生新的问题:
① 稳定性风险
② 运维复杂度风险
③ 成本风险
--
02
阿里云Elasticsearch日志Serverless服务
1. 日志Serverless服务能力解读
基于上述问题和风险,阿里云引入了两个新功能:
① Indexing Service
Indexing Service是一个超大的ES集群阵列,专做Indexing Build,每个客户可灵活使用,它具有以下特性:
图中灰色虚线内是用户的ES集群,当流量洪峰到来时,用户可以将流量转发至Indexing Service的SLB中进行build index,然后通过segment merge的方式,回到用户ES集群的Data Node。这样通过外部的云上弹性服务,减轻了用户ES集群压力,实现秒级弹性扩缩容的需求。
② 智能海量存储引擎
智能海量存储引擎服务化,多级存储及索引调度能力,无需关注存储介质。服务化能力指用户无需为ES数据节点预留空间,可以做到按需存储数据,以解决资源冗余的问题,进而降低成本,它具有以下特性:
2. 日志Serverless服务价值解读
① Serverless日志写入服务:Indexing Service
通过读写分离架构,ES集群的数据写入在云端服务进行托管加速,为用户实例和云端服务搭建桥梁,依托云端弹性计算能力,突破本地集群的物理资源限制。
对比开源ELK生态:
② Serverless日志存储服务:智能海量存储引擎
基于计算存储分离架构及多层存储介质混合,提供可靠的海量弹性低成本存储并保证查询性能,无须提前预留集群存储容量,根据实际数据的存储量按量计费。
3. Elasticsearch日志Serverless服务发布
全球范围内首个在云上提供Serverless能力的云原生Elasticsearch服务,其核心价值体现在三个方面:
4. 真实案例收益
①客户场景描述
汽车行业的IT系统,大多是分批建设,技术架构及系统复杂有历史包袱,IDC、多云架构比较普遍。新兴的业务部门,一方面需要满足政策合规要求,一方面希望对整体日志数据进行价值挖掘,通常会遇到如下问题:
②方案构架及价值点
--
03
阿里云Elasticsearch技术演进之路
阿里云Elasticsearch技术演进图
Elasticsearch未来的发展会继续在云原生Serverless上进行演进和迭代,在日志场景下优化成本,通过服务化的能力提升日志场景中的ES产品的易用性,帮助客户解决日志场景下前置日志链路上的问题。
同时,与ES社区就Elasticsearch TSDB时序引擎进行共建,相信很快可以在未来的ES新版本中推出TSDB能力。
今天的分享就到这里,谢谢大家。
阅读更多技术干货文章、下载讲师PPT,请关注微信公众号“DataFunSummit”。
分享嘉宾:赵弘扬 阿里云 高级产品专家
出品平台:DataFunTalk
01/分享嘉宾
02/报名看直播 免费领PPT
04/关于我们
DataFun:专注于大数据、人工智能技术应用的分享与交流。发起于2017年,在北京、上海、深圳、杭州等城市举办超过100+线下和100+线上沙龙、论坛及峰会,已邀请超过2000位专家和学者参与分享。其公众号 DataFunTalk 累计生产原创文章700+,百万+阅读,14万+精准粉丝。
欢迎转载分享评论,转载请私信。
留言与评论(共有 0 条评论) “” |