百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

如何使用火焰图来降低服务器负载 火焰图怎么做

liebian365 2024-10-31 15:20 17 浏览 0 评论

LucidChart 提供在线编辑流程图、网络拓扑图、ER 图、 UML 图以及脑图等多种图表服务,有超过 7 百万的用户,因其简单直观的交互体验和强大的多人协作功能,是可以替代 Visio 的最佳选择。

在 Lucid,我们使用面向服务的架构来建设我们的系统。其中字体服务(font service)就是其中之一,它负责根据字体族名称和 unicode 编码范围来提供相应的字体服务,同时也对用户上传的字体进行校验和检查。在生产环境中,该服务的负载一直很高,这一点超出我们的预期(使用或等待 CPU 的平均线程数)。特别从去年开始,我们注意到字体服务的负载高的惊人,特别是在晚上这样的流量低峰时期。

幸运的是最终我们找到了根本原因,并通过改进大大提高了服务的整体性能和稳定性。通过下面的内容,您将了解到我们是如何做到的。

图1: 字体服务在变更前后服务器平均负载对比

通过火焰图来调试和发现问题

我们从 Netflix 找到了一个非常棒的火焰图工具[1][2],并部署到生产环境。 此工具可以将多个不同调试分析工具的数据组合在一起并生成火焰图,以可视化的方式展示服务器和 JVM 的资源使用情况。

如下图所示,每个矩形表示一个栈帧,同时矩形的宽度代表了资源(比如 CPU 时间)的使用情况,Y 轴表示调用栈。通过识别那些宽的矩形块,就能快速缩小问题范围。在调试和排查字体服务时,它极大地帮助了我们。

图2: 高负载时字体服务中一台服务器的火焰图

在高负载状态下,我们对字体服务收集数据并生成了几个火焰图。下图是其中之一,并且特别展示了 JVM 相关栈的部分。可以分析得出,大部分时间都花在了 libz.so这一步(gzip 使用该库进行压缩/解压缩操作),剩下大部分时间都花在了 XML 转义和 UTF-8 编码上。

图3: JVM 相关栈活动的局部火焰图

找到慢的原因

首先多啰嗦几句这个字体服务的一些背景情况。我们将所有字体相关数据存储在 Amazon S3 中,具体来说是将每个字体的每个 unicode 范围分别存为一个 S3 object。当其他服务请求为了获取字体族,一组 unicode 范围,或者是用户自定义字体时会向字体服务请求字体数据,接着字体服务将字体数据包裹在 XML 中返回。

功能非常简单,并没有什么明显的密集型计算。但是对于出现的高负载问题,火焰图帮助我们识别出了问题所在—— libz,XML 转义和 UTF-8编码都使用了大量的 CPU。

但是为什么会产生这么多编码和压缩的消耗?记得前面提到晚上时间的负载反而是最高的吗?我们的晚上(美国山区时间)正好是亚洲地区的白天,该地区很多用户都使用中文、日文或韩文等亚洲语言。会进行大量的 gzip 解压缩 → UTF-8解码 → XML 转义 → UTF-8编码 → gzip 压缩。相比于拉丁语系,单个 CJK 的 unicode 范围比拉丁语系的 unicode 范围大2个数量级(1MB:60KB)。所以上述的转换过程都压到了 CPU 上,特别压缩和解压缩,以及 XML 转义这类操作。

如何改进?

字体服务对请求的响应本质上只是 S3 上原始数据的集合。它确实需要执行一些重要的附加任务,如权限检查和从字体族中检索名称。但是,字体服务根本没必要挡在 S3 前面来代理那些字体数据!所以解决办法很简单, 直接用包含 S3 object 的链接(就是那些字体数据)的列表作为响应返回,字体服务不再从 S3 下载并重新编码字体数据。所以从图1中可以看出负载几乎降低到可忽略的程度。

总结

通过调试分析生产环境,我们能够找到并消除那些不必要的任务和工作,进而降低服务器负载。

  1. 使用例如火焰图之类的分析工具(profiling tool)来帮助识别 CPU 高占用的操作。

  2. 压缩/解压缩和各种编码/解码的操作都是昂贵的。

  3. 如果客户端可以直接访问数据,那么相比代理(客户端去请求)数据,直接返回链接是最好的选择,可以显著提高整体性能。

参考链接

[1] Brendan D. Gregg的个人网站 http://www.brendangregg.com

[2] Flame graphs http://www.brendangregg.com/flamegraphs.html

[3] 白话火焰图 https://huoding.com/2016/08/18/531

[4] Java Flame graphs http://www.brendangregg.com/blog/2014-06-12/java-flame-graphs.html

[5] OpenRestry 关于火焰图在 Lua 中的使用 https://moonbingbing.gitbooks.io/openresty-best-practices/flame_graph.html

[6] 在 Netflix 中的应用 http://techblog.netflix.com/2015/07/java-in-flames.html

[7] 在 Netflix 中的应用 http://techblog.netflix.com/2016/04/saving-13-million-computational-minutes.html

相关推荐

4万多吨豪华游轮遇险 竟是因为这个原因……

(观察者网讯)4.7万吨豪华游轮搁浅,竟是因为油量太低?据观察者网此前报道,挪威游轮“维京天空”号上周六(23日)在挪威近海发生引擎故障搁浅。船上载有1300多人,其中28人受伤住院。经过数天的调...

“菜鸟黑客”必用兵器之“渗透测试篇二”

"菜鸟黑客"必用兵器之"渗透测试篇二"上篇文章主要针对伙伴们对"渗透测试"应该如何学习?"渗透测试"的基本流程?本篇文章继续上次的分享,接着介绍一下黑客们常用的渗透测试工具有哪些?以及用实验环境让大家...

科幻春晚丨《震动羽翼说“Hello”》两万年星间飞行,探测器对地球的最终告白

作者|藤井太洋译者|祝力新【编者按】2021年科幻春晚的最后一篇小说,来自大家喜爱的日本科幻作家藤井太洋。小说将视角放在一颗太空探测器上,延续了他一贯的浪漫风格。...

麦子陪你做作业(二):KEGG通路数据库的正确打开姿势

作者:麦子KEGG是通路数据库中最庞大的,涵盖基因组网络信息,主要注释基因的功能和调控关系。当我们选到了合适的候选分子,单变量研究也已做完,接着研究机制的时便可使用到它。你需要了解你的分子目前已有哪些...

知存科技王绍迪:突破存储墙瓶颈,详解存算一体架构优势

智东西(公众号:zhidxcom)编辑|韦世玮智东西6月5日消息,近日,在落幕不久的GTIC2021嵌入式AI创新峰会上,知存科技CEO王绍迪博士以《存算一体AI芯片:AIoT设备的算力新选择》...

每日新闻播报(September 14)_每日新闻播报英文

AnOscarstatuestandscoveredwithplasticduringpreparationsleadinguptothe87thAcademyAward...

香港新巴城巴开放实时到站数据 供科技界研发使用

中新网3月22日电据香港《明报》报道,香港特区政府致力推动智慧城市,鼓励公私营机构开放数据,以便科技界研发使用。香港运输署21日与新巴及城巴(两巴)公司签署谅解备忘录,两巴将于2019年第3季度,开...

5款不容错过的APP: Red Bull Alert,Flipagram,WifiMapper

本周有不少非常出色的app推出,鸵鸟电台做了一个小合集。亮相本周榜单的有WifiMapper's安卓版的app,其中包含了RedBull的一款新型闹钟,还有一款可爱的怪物主题益智游戏。一起来看看我...

Qt动画效果展示_qt显示图片

今天在这篇博文中,主要实践Qt动画,做一个实例来讲解Qt动画使用,其界面如下图所示(由于没有录制为gif动画图片,所以请各位下载查看效果):该程序使用应用程序单窗口,主窗口继承于QMainWindow...

如何从0到1设计实现一门自己的脚本语言

作者:dong...

三年级语文上册 仿写句子 需要的直接下载打印吧

描写秋天的好句好段1.秋天来了,山野变成了美丽的图画。苹果露出红红的脸庞,梨树挂起金黄的灯笼,高粱举起了燃烧的火把。大雁在天空一会儿写“人”字,一会儿写“一”字。2.花园里,菊花争奇斗艳,红的似火,粉...

C++|那些一看就很简洁、优雅、经典的小代码段

目录0等概率随机洗牌:1大小写转换2字符串复制...

二年级上册语文必考句子仿写,家长打印,孩子照着练

二年级上册语文必考句子仿写,家长打印,孩子照着练。具体如下:...

一年级语文上 句子专项练习(可打印)

...

亲自上阵!C++ 大佬深度“剧透”:C++26 将如何在代码生成上对抗 Rust?

...

取消回复欢迎 发表评论: