百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

TCP:内存不足,考虑优化TCP_Mem

liebian365 2024-11-20 18:23 29 浏览 0 评论

最近我们经历了一个有趣的生产问题。 这个应用程序是运行在多个AWS EC2实例背后弹性负载平衡器。 GNU / Linux操作系统上运行的应用程序时,Java 8, Tomcat 8应用程序服务器。 突然,一个应用程序的实例变得反应迟钝。 所有其他应用程序实例处理流量正常。 当HTTP请求从浏览器发送到此应用程序实例,我们得到以下回应被打印在浏览器上。

我们使用我们的APM(应用程序性能监控)工具来检查这个问题。 APM的工具我们可以观察CPU内存利用率,是完美的。 另一方面,APM的交通工具,我们可以观察到没有进入这个特定的应用程序实例。 这真是令人费解。 为什么交通不进来?

我们登录这个问题AWS EC2实例。 我们执行vmstat、iostat netstat, df命令是否我们可以发现任何异常。 令我们吃惊的是,所有这些伟大的工具没有报告任何问题。

作为下一步,我们重新启动Tomcat应用程序服务器中运行这个应用程序。 它没有产生任何影响。 不过,这个应用程序实例没有回应。

DMESG命令

然后我们发出“dmesg命令”命令EC2实例。 这个命令打印消息缓冲的内核。 该命令的输出通常包含消息产生的设备驱动程序。 这个命令生成的输出,我们注意到有趣的消息重复印刷如下:

我们感到好奇看到这个错误消息:“TCP:内存不足,考虑优化tcp_mem”。 这意味着内存不足错误是发生在TCP的水平。 我们一直教导的内存错误只发生在应用程序级别,从不在TCP级别。

问题是有趣的因为我们呼吸这OutOfMemoryError问题的一天。 我们已经建立了故障排除工具GCeasy,HeapHero为了方便工程师调试OutOfMemoryError发生在应用程序级别(Java, Android, Scala, Jython的应用程序)。 我们写了一些博客OutOfMemoryError的话题。 但我们难住了OutOfMemory发生在设备驱动程序级别。 我们从未想过会有一个问题在设备驱动程序层面,也在稳定的Linux操作系统。 被这个问题难住了,我们不确定如何进一步推进。

因此,我们采取了谷歌上帝的帮助。 google的搜索词:“TCP:内存不足,考虑优化tcp_mem”,搜索结果显示只有12个。 的一篇文章,他们没有多少内容。 甚至一篇文章写的是一个外国语言,我们不能理解。 因此,我们还不能确定如何解决这个问题。

现在剩下没有其他解决方案,我们继续和实现一个通用的解决方案即“重启”。 我们重新启动延迟的EC2实例直接燃烧的火。 华友世纪! 立即重新启动服务器清理问题。 显然,这个服务器没有重启好几天(如超过70 +天),可能是由于应用程序可能有饱和TCP内存限制。

我们联系了我们的一个聪明的朋友在一家世界级的科技公司帮忙工作。 这位朋友问我们,我们设置的值低于内核属性:

  • core.netdev_max_backlog。
  • core.rmem_max。
  • core.wmem_max。
  • ipv4.tcp_max_syn_backlog。
  • ipv4.tcp_rmem。
  • ipv4.tcp_wmem。

老实说,这是第一次,我们听到这些属性。 我们发现下面是服务器设置这些属性的值:

我们的朋友建议的改变值作为下面:

他提到了设置这些值将会消除我们曾面临的问题。 与你分享的价值观(它可能帮助你)。 显然,我们的价值观非常低的值相比,他已经提供了。

结论

这里有一些我们想要画的结论:

  • 即使是现代行业标准APM(应用程序性能监控)工具没有完全回答我们今天面临的应用程序的性能问题。
  • 'Dmesg命令是你的朋友”命令。 您可能想要执行这个命令时,您的应用程序变得反应迟钝,也许你有价值的信息。
  • 记忆问题没有发生在我们写的代码,甚至可以发生在TCP /内核级别。

最后,我自己是一名从事了多年开发的JAVA老程序员,辞职目前在做自己的java私人定制课程,今年年初我花了一个月整理了一份最适合2019年学习的java学习干货,可以送给每一位喜欢java的小伙伴,想要获取的可以关注我的头条号并在后台私信我:java,即可免费获取。

相关推荐

深度解密epoll 如何工作的?(epoll基本处理流程)

epoll...

大乐透第19082期:头奖开出7注1000万分落六地 奖池41亿元

2019年7月17日晚开奖的体彩超级大乐透第19082期开奖号码为:前区06、18、20、21、31,后区03、04。本期大乐透前区号码五区比为1:0:3:0:1,二区和四区号码没有给出。当期前区和值...

【开奖】4月27日周六:福彩、体彩(2021年4月27日体彩开奖结果)

4月27日开奖福彩3D第2019110期:61222选5第2019110期:0812202122排列3第19110期:303排列5第19110期:30305大乐透第19047期:0304...

“红狒狒”落户哈尔滨铁路局(哈尔滨铁路红肠)

这几天,“红人”“红狒狒”在牡丹江机务段可引起了不小的轰动,众粉丝争相与其拍照留念,在该段人气爆棚!“红狒狒”到底何许人也?“红狒狒”,中文名:和谐3D型电力机车;绰号:红狒狒、番茄;制造商:大连机...

2D、3D、2.5D,做游戏还是搞噱头?玩家都晕了

前言游戏类型就像某种潮流,一种流行罢,另一种接棒成为主流。前两年的新作大多以“开放世界”为标签,在追求纯沙盒的过程中打造出一些细致的分类,比如说“类GTA沙盒”。诚然,纯碎的沙盒游戏并不多见,业内只有...

《战神4》PC版宣传片发布 GTX 1070即可60帧畅玩

在今年10月的时候索尼PlayStation官方正式宣布圣莫尼卡2018年的《战神4》将于2022年1月14日推出PC版本,官方在今天公布了一段PC版宣传片,并且公开了游戏的配置需求。下面让我们一起来...

男星深情好丈夫形象崩塌,半夜搂美女坐大腿,举止亲密

近日,于晓光被拍到深夜在酒吧玩,结束后与一名女子一起上车离开。上车后,女子直接坐在了他腿上,他也顺势搂着美女,美女满脸笑容地坐在他腿上玩手机离开。可能有人会好奇,于晓光是谁呢?于晓光是韩国艺人秋瓷炫的...

d3d12dll丢失怎么修复?d3d12dll加载失败怎么解决?

  d3d12.dll丢失怎么修复?d3d12.dll加载失败怎么解决?很多朋友想要运行游戏的时候都会遇到这个问题,这种情况该怎么办呢?今天系统之家小编给朋友们讲讲具体的解决方法,操作其实还蛮简单的。...

许多玩家反馈《生化4RE》PC一直崩溃 无法进入游戏

今日(3月24日),卡普空《生化危机4:重制版》正式发售,然而有部分PC玩家遇到了游戏崩溃等问题。很多玩家在贴吧发帖称游戏遇到了严重的崩溃问题,且经常反复,报错代码普遍为FatalD3Derror...

微软正式推出适用于WSL Linux的D3D12 GPU视频加速技术

今天,微软正式向WindowsSubsystemforLinux(WSL)用户发布了Direct3D12GPU视频加速支持。在微软通过WSL允许在Linux下使用Open...

《怪物猎人:崛起》曙光系统报错“Fatal d3d error”的解决办法

《怪物猎人:崛起》曙光系统报错“Fatald3derror”的解决办法不少小伙伴反应《怪物猎人:崛起》DLC曙光预载以后打不开游戏,出现了Fatald3derror类似的错误代码,这类问题的解...

Mac+双屏,前端程序员的专业配置 - Loctek 乐歌 D3D 双屏电脑显示器支架

做FE也有一段日子了,电脑屏幕每天在设计稿、浏览器、IDE、即时通讯工具、Terminal、邮箱之间切换。虽然mac的工作区带来了很多灵活,但是依然略显不足。于是入手支架,把公司配的电脑和显示器发挥起...

RPC 的原理和简单使用(rpc详解)

RPC的概念RPC,RemoteProcedureCall,翻译成中文就是远程过程调用,是一种进程间通信方式。它允许程序调用另一个地址空间(通常是共享网络的另一台机器上)的过程或函数。在调用的...

大厂开源的golang微服务rpc框架 — kitex

提前rpc估计所有的开发同学都知道,不知道的也无所谓,毕竟我也好几年没用了,今天带大家在复习一下。RPC(RemoteProcedureCall):远程过程调用,...

干货!一文掌握Protobuf所有语言所有用法,快收藏

说实话,Protobuf这个库,让人相见时难别亦难,东风无力百花残,每次等到要用它的时候,总感觉还没有完全掌握它的用法,而实际上等去百度或者谷歌的时候,教程都是多么的凌乱不堪。学会它,最直接关系到的,...

取消回复欢迎 发表评论: