aliyun邮箱-压测性能分析进阶:XRunner云原生探针

随着信息化体系的建造完整和市场的推广竞赛,功用 慢慢变成衡量运用是否可用、好用的关键衡量目标之一。功用测验不同于功用测验、接口测验,功用更多重视于事务的呼应速度和运用体系的全体处理能力 上,当功用目标不契合与预期希望时,用户往往会直观地反应不好用。

这儿用户的“不好用”便是功用测验的中心要点。经过各种监控手法收集相关功用数据后,根据事务剖析在各链路上的耗时、判别体系瓶颈是做功用测验、功用优化剖析必不可少的环节。但是在当下这种靠个人能力或传统安插Agent、日志等运用功用监控技能逐渐失效,现已无法满意用户的功用需求以及越来越快的体系迭代速度。

aliyun邮箱,尤以当下企业全面转向云核算,以容器、微服务架构、DevOps为中心的云原生架构成为降本提质增效的最优途径背景下,大规模容器集群产生更大的事务负载能力、更高的流量突发能力。容器架构的动态改变,对功用监控、剖析的规模影响也越来越大与不可预估。因而,如安在云原生年代下更好打开质量领域功用测验,是咱们为企业在市场上提供竞赛力的弹药之一。

功用测验

说到功用测验,咱们的第一印象根本上都是这三个阶段:

1)模仿用户事务流程操作,经过录制手法或脚本修改生成功用测验脚本,对脚本进行参数化、办理、思考时刻、集合点设置完成全体功用脚本

2)模仿用户负载行为,经过场景化进行压测的模型设置,挑选监控目标

3)剖析测验数据,经过工具自带的整合剖析功用或结合其他功用数据

那么咱们做功用测验的意图在于什么呢?大多数同学刚开始做功用测验的时分,都是做完功用脚本调试、设置完压测模型、履行完脚本,看下体系的CPU、内存、吞吐量、事务TPS,在输出一份测验报告就完毕了。

这种流程和测验报告在曩昔10年前或许是能够接受的,这受限于最初的技能架构(单体、前后端)和监控剖析手法,但在当下技能架构、事务场景、用户需求、研发模式、灵敏转型、研发效能等诸多内、外环境的改变,企业对功用测验的意图越来越多样化、针对性。

常见功用测验意图 一般包含 

1、确认体系的呼应时刻:比方体系均匀呼应时刻≤3秒

2、确认体系的最大用户数:比方体系在100000个用户下均匀呼应时刻≤4秒

3、确认体系的最佳配置:比方在Centos7、8C16G、500G配置下,某事务支撑50000个用户同时拜访,均匀呼应时刻≤1秒

传统功用监控的困境

功用测验意图确认后,往往都是根据此意图去做功用压测施行和监控数据剖析 ,这儿怎么打开压测施行流程先不打开介绍,咱们首要就监控数据剖析 这部分咱们比较少谈的论题打开。

1、 传统环境下功用监控颗粒度较粗

传统环境下体系的运用都是需求经过物理层网络设施进行流量转发,因而传统环境下,事务运用流量 都是经过利用网络设备支撑旁路流量镜像的方式完成收集,比方在交换机设置端口镜像或TAP转发收集。

但收集到的流量数据无法和事务对应起来,根本都是体系资源上如CPU、内存、吞吐量或者自身服务器(如Tomcat)自带的目标等数据,无法分解到具体某个URL和事务上。

这些都导致传统功用监控更多是以监控体系可用性为中心,不涉及具体事务。

2、 技能架构晋级的功用监控难点

曩昔在单体架构、前后端分离、SOA架构上都能够进行物理层网络设施流量收集,随之信息化建造的展开,企业全面转向云核算,微服务架构、容器、DevOps大行其道。

开发团队为了满意事务调整更加灵敏,在技能上大量运用微服务架构,将事务解耦,把曩昔大单体拆解到小的服务,使其能够更加快速的发布投产。

运维团队运用容器、DevOps技能,让代码更快发布,对事务流量进行实时监控、事务资源动态伸缩,更好的满意事务运营需求。

而这些都导致事务解析颗粒度越来越细,服务解耦越来越明晰,问题定位需求越来越精准,尤其是在当下技能上现已不会呈现较大功用问题,更多在于不同技能架构、事务依赖、基础设施(网络、云渠道、服务器)、服务配置、虚拟化技能的运用编排,而这些都需求精准的监控来进行剖析。

3、 事务功用需求常态化

得益于互联网的飞速展开,各种技能的迭代使其能够满意越来越多的事务形状,比方当下最盛行的直播、赛事转播等,这些事务能够让咱们身边每个人都能随时随地的参与和拜访,都离不开功用保证。

功用需求在14年还只是在大型电商活动做秒杀、各种活动的时分,12306刚开始发售时,也曾呈现无数次出票服务不可用、体系呼应缓慢的问题,当时的功用需求仍是被迫的或针对性的打开的。而现在日常的日子文娱、出行交通、作业协同现已是无时无刻不在打开功用需求。

云原生年代功用监控探针

面临传统功用监控的困境,以及现阶段技能上的框架推进、灵敏开发和自动化监控布置也对功用监控发起了应战。

为了处理种种流量监控的难点,掌动智能云网一体化功用保证渠道(XRunner)流量确诊探针,在面临杂乱云环境下真实处理云流量收集、管理、回溯、输出的实用性价值,真实协助企业对云环境进行无盲点、细粒度的监控,保证功用监控更加精准和功用定位到事务级别。

1、 异构环境下流量收集布置

现在干流的开源项目底座、国内干流云厂商底环境、信创环境都支撑云环境、宿主机、IDC机房布置、流量收集。

1)云环境支撑

● 布置支撑私有云、公有云、混合云环境

● 布置支撑虚拟机布置,或预置在Docker

2)宿主机体系支撑

● 对干流Centos7/8,Ubuntu20.0等相关发行版,都只需求一个版本、一个程序即可完成完美兼容

● 对干流虚拟化、容器化、云厂商(VMware、Kubernetes、Docker、OpenStack、阿里云、腾讯云、华为云等)支撑

2、 网络接口、数据包捕获

经过布置在私有云宿主机,或公有云作业负载的操作体系层,能够完成对:

● 悉数网卡,特定网卡,IO捕获

● 特定IP / IP:Port / Port / IP~IP / Subnet的数据包捕获

● 并能够履行BPF条件的Byte-Code数据包过滤捕获

3、 宿主机统信数据管理与输出

对契合特征的流量进行实时解析,能够实时输出如下四种数据类型:

1、丰富的TCP/UDP的会话目标

判别网络时延行为的首要依据;能够实时的剖析悉数或特定网卡的TCP/UDP会话,并能够将剖析成果,以UDP封装JSON格式的数据,实时转发到外部的数据接纳端;首要的通信目标包含,聚合后的四元组信息,MAC,VXLAN/GRE编号,以及悉数标志位信息等。

2、HTTP/URL的目标和内容,负载段的内容

判别各类运用层风险的首要依据,UniProbe能够实时剖析HTTP/URL/XML等会话和负载内容,并能够将其内容和首要目标,以UDP封装的JSON数据,实时转发到外部的数据接纳端。

3、DB/SQL的目标和内容

判别各类数据库风险的首要依据,UniProbe能够实时剖析SQL会话内容,并能够将其内容和首要目标,以UDP封装的JSON数据,实时转发到外部的数据接纳端;支撑的DB包含但不限于Oracle,MySQL,SQLserver等结构化数据库。

4、进程信息

如上三类数据监控功用,都能够与宿主机的进程相关联,经过剖析进程的活跃程度(CPU/MEM用量),进一步定位、分解功用风险。

收益与价值

经过云网一体化功用保证渠道(XRunner)的功用确诊探针的施行,能带给企业如下价值体现:

1、对杂乱云环境下运用的云流量进行剖析,做到云流量可视化,云网功用监控,反常流量发现和剖析

2、在多层虚拟化环境下从物理设备层、私有云、K8S容器云、lstio、事务层POD等多维度功用追寻,识别分层次下综合功用瓶颈,从而进行功用定位和调优

3、协助客户从用户和事务视角剖析和评价事务买卖健康、后端运用功用、混合基础架构支撑能力

4、协助用户根据统一渠道,快速完成端到端事务买卖追寻、代码级事务处理功用剖析、事务故障、功用、多层虚拟化架构和SDN云网功用的全栈问题盯梢与确诊等等。