要实现网络运维自动化和网络可视化分析,高效准确的网络遥测是必不可少的条件之一,目前带内网络遥测(INT,In-band Network Telemetry)技术已成为了当代大型数据中心运营的关键组成部分。
如图为新华社的网络遥测,提供一个实时化的网络状态信息
一、带内网络遥测 VS传统网络运维
1、传统网络——基于CLI、SNMP机制的被动运维模式
在INT技术出现之前,数据中心多采用SNMP、NetFlow、sFlow之类的协议进行网络数据的采集监控,
(1、SNMP(Simple Network Management Protocol,简单网络管理协议) :可以采集到网络设备的CPU、内存、日志等信息,但缺点是无法采集到网络数据流量,无法判断链路拥塞情况。这种Pull拉取式的模式已无法满足当今云数据中心需求。SNMP本质是工作在设备内部的一个 server,snmp 的 客户端要定期地到这个 server 里面去拿指定的数据。 server 是运行在设备的控制面,如果要通过控制面去采集一些数据面的信息的话,会导致设备的性能大打折扣。
(2、NetFlow、sFlow:后续出现的高级采集协议,有NetFlow、sFlow等,可以实现网络数据流量的采样和推送,但其推送的是原始数据,不能直观地显示网络情况;而且是按照一定比例采集的,不能反映整个网络链路的流量全貌,所以不能预测流量和拥塞,sFlow通过设定的采样比采集端口数据,采样比越大,收集的数据量越少,采样比越小,收集的数据量越多越详细。缺点也很明显,采集的流量在端口流量比较小的情况下,反映网络状况不是很准确,尤其是在端口各种流量比较丰富的情况下,就可能会漏掉部分流量。
这种被动响应以及故障定位迟缓、粗略的网络监控方式,管理效率越来越低,已无法跟上时代的步伐,满足不了数据中心云网络运维需求。
2、带内网络遥测(INT,In-band Network Telemetry)——更实时、全面、精细的运维模式
INT是通过数据面业务进行网络状况的收集、传送、上传的。
通过名称我们可以看出两个技术关键点。“带内”意味着可以从传输网络内部收集信息,而不是通过额外搭建的业务网以及实际端口收集;“遥测”,表现在测量网络的数据并且远程上报的特点。
对比上述传统技术,INT的特点优势一目了然:
目前,INT已成为了当代大型数据中心运营的关键组成部分,能实现整网的流量可视化,通过对网络设备的数据进行远程高速采集和监控,提供更实时、更全面和更精细的网络监管能力,从而帮助加速网络故障排除、预测网络容量增长和评估网络性能的潜力。
二、INT如何实现?
1、INT的报文格式
正确类型的遥测数据使网络运营商能够主动解决网络盲点并保持其业务系统高效运行。我们不妨先了解下INT的头部报文格式
2、数据包的传递
在带内网络遥测架构中,交换设备转发处理携带遥测指令(Telemetry instructions)的数据包。当遥测数据包经过该设备时,这些遥测指令告诉具备网络遥测功能的网络设备应该收集并写入何种网络状态信息。
一般来说,一个INT过程涉及3个功能节点:
通过上述信息,我们不难发现:INT可以精准地描述一个报文在交换机里的运作情况。这是传统的遥测技术比如Snmp,sFlow所无法实现的,它体现的是网络在转发业务那一瞬间最真实的情况。尤其是当下数据中心越发呈现出“高速率、大规模、多接入、不可预期”的特点之下,INT技术无疑更满足运维人员的实际需求。
三、星融元基于可编程交换芯片的INT方案,帮助实现整网自动化、智能化的运维
INT方案
INT方案-精细化运维
星融元通过提供支持INT功能的可编程云网交换机产品,搭配AFF(Asteria Fabric Foresight)云网智能遥测系统 构建了一套INT解决方案:在不影响设备的性能和功能的情况下,实现更高精度的网络数据监控。在转发业务流量的同时,将网络的即时性能、状态、参数收集并记录下来,在网络的出口发送给运营分析系统,用来精准分析物理网络的健康状况,让运维人员快速、精准地掌握全网设备的实时运行状态,帮助提升响应速度和运维效率。
1、释放算力资源
采用订阅上报机制,通过设备的交换芯片转发INT流量,不占用设备CPU开销
2、精细化运维
纳秒级别的监控粒度,记录精准的转发时延和实时的转发状态,一针见血反映网络状况,
3、故障快速定位
呈现清晰的报文转发路径,远程预警方式快速告知客户详细网络故障信息。
留言与评论(共有 0 条评论) “” |