百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

疯狂的Pid 疯狂的平昌歌曲播放

liebian365 2024-10-17 14:04 28 浏览 0 评论

目录

  1. 故障描述
  2. 处理经过
  3. 原因分析
  4. 故障思考


最近业务新上了一个功能,使用了chromedp

  • 它是一个无窗口的chrome
  • 非常适合在服务器端做基于浏览器的自动化测试

借用官方的demo,几段小小的代码,我们可以实现后台截chrome的图:

package main
import (
  "context"
  "github.com/chromedp/chromedp"
  "io/ioutil"
  "log"
)

func main() {
  ctx, cancel := chromedp.NewContext(
    context.Background(),
  )
  defer cancel()
  var buf []byte
  if err := chromedp.Run(ctx, elementScreenshot(`https://pkg.go.dev/`, `img.Homepage-logo`, &buf)); err != nil {
    log.Fatal(err)
  }
  if err := ioutil.WriteFile("elementScreenshot.png", buf, 0o644); err != nil {
    log.Fatal(err)
  }
}
func elementScreenshot(urlstr, sel string, res *[]byte) chromedp.Tasks {
  return chromedp.Tasks{
    chromedp.Navigate(urlstr),
    chromedp.Screenshot(sel, res, chromedp.NodeVisible),
  }
}

看上去很不错,小O很快帮研发同学小D制作了一个可以运行chromedp的基础镜像

# syntax=docker/dockerfile:1.3-labs
FROM  centos:7
RUN <<"EOF" cat > /etc/yum.repos.d/google-chrome.repo
[google-chrome]
name=google-chrome
baseurl=http://dl.google.com/linux/chrome/rpm/stable/$basearch
enabled=1
gpgcheck=1
gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pub
EOF
RUN yum install -y google-chrome-stable --nogpgcheck   && yum clean all

(注:上文使用了here-documents ,需大于Docker 18.09,且打开export DOCKER_BUILDKIT=1开启BuildKit mode,方可支持)


Dockerfile Here Document 举例(直接书写python代码):

# syntax = docker/dockerfile:1.3-labs
FROM python:3.6
RUN <<eot
#!/usr/bin/env python
print("hello world")
eot

Bash Here Document举例(直接书写文件内容):

cat <<EOF > testfile
hello world!!
EOF


业务很快就跑起来了,结果半夜小O就被告警短信轰炸了



故障描述


Pid爆炸至宿主机内存使用率暴涨


处理经过


时间

处理同学

动作

17:00

小D

开发代码,上线新功能

02:17

小O

被告警吵醒,紧急规避


原因分析


在宿主机上通过top/ps命令立刻就发现了大量僵尸进程



原因很显然了,和下午上线的chromedp脱不了干系。进到容器内:


在Linux操作系统下,一个进程结束后,如果它的父进程没有通过wait系统调用等待它,则它会变成Zombie Process,即图中的defunct状态进程。

When a process ends via exit, all of the memory and resources associated with it are deallocated so they can be reused . However, the process's entry in the process table remains. The parent can read the child's exit status by executing the wait system call, whereupon the zombie is removed. ---wikipedia

wait 系统调用承担了2个功能

  • 获取子进程的运行结果
  • 回收子进程的资源


正常情况下,如果父进程退出,则所有僵尸进程则会被1号进程收养。1号进程负责wait僵尸进程。显然在容器内部,业务的golang进程不会去回收chrome的进程。


这时我们需要一个容器内真正能做事的1号进程:

  • 处理信号
  • 回收僵尸或者孤儿进程
  • 报告容器的exit status


业界有以下几个做法

  • bash
  • supervisord
  • systemd
  • tinit
  • pause (k8s专用)
  • 业务进程回收


Bash

bash 作为父进程,具备回收子进程的功能,但是它会不透传信号给子进程

CMD ["/bin/bash", "-c", "set -e && top"]

如果写做以下方式,则会有问题

CMD ["/bin/bash", "-c", "top"]

这种形式属于“simple command”,bash内部会做优化而舍弃fork直接exec替换掉bash进程。所以在容器内看到的结果1号进程仍然是业务进程。


Supervisord

成熟的进程管理和守护工具,较重,python实现,根据公司架构情况食用。


Systemd

由于一些技术原因,目前在容器内运行systemd需要开启特权模式。


tini

一个非常轻量的init实现。是docker官方原装的init二进制。在docker命令下通过--init参数即可开启,但是在k8s情况下需要将tinit拷贝到镜像当中,在Docker中增加以下即可:

ENV TINI_VERSION v0.19.0
ADD https://github.com/krallin/tini/releases/download/${TINI_VERSION}/tini /tini
RUN chmod +x /tini
ENTRYPOINT ["/tini", "--"]


pause

k8s的基础设施pause容器的pause进程,也可以充当1号进程,只要我们和pause容器共享pid namespace即可。


业务进程回收

对于golang来说,我们可以自己动手回收:

import "golang.org/x/sys/unix"

func ReapChildren() {
    c := make(chan os.Signal, 100)
    signal.Notify(c, unix.SIGCHLD)

    for {
        <-c
        var status unix.WaitStatus
        for {
            pid, err := unix.Wait4(-1, &status, unix.WNOHANG, nil)
            switch err {
            case nil:
                if pid > 0 {
                    fmt.Println("Reap pid", pid)
                }
            case unix.ECHILD:
                // No more children, we are done.
                break
            case unix.EINTR:
                continue
            default:
                fmt.Println(err)
            }
        }
    }
}

对c语言来说则相对简单一些

static void sigreap(int signo) {
  while (waitpid(-1, NULL, WNOHANG) > 0)
    ;
}
int main(int argc, char **argv) {
 sigaction(SIGCHLD, &(struct sigaction){.sa_handler = sigreap,.sa_flags = SA_NOCLDSTOP},NULL)
}                           
                                             


大半夜的,小O只想睡好好觉。直接修改了deployment让pause来回收规避了问题。至于后续小D怎么改随他去吧。


故障思考



  • 当使用外部依赖的时候,一定要做好充分测试了解依赖的行为。外部依赖对fd、内存,磁盘的使用不一定是完全符合我们的预期。应当充分了解之后再做上线。


记录那些年我们一起处理过的故障~


相关推荐

“版本末期”了?下周平衡补丁!国服最强5套牌!上分首选

明天,酒馆战棋就将迎来大更新,也聊了很多天战棋相关的内容了,趁此机会,给兄弟们穿插一篇构筑模式的卡组推荐!老规矩,我们先来看10职业胜率。目前10职业胜率排名与一周前基本类似,没有太多的变化。平衡补丁...

VS2017 C++ 程序报错“error C2065:“M_PI”: 未声明的标识符&quot;

首先,程序中头文件的选择,要选择头文件,在文件中是没有对M_PI的定义的。选择:项目——>”XXX属性"——>配置属性——>C/C++——>预处理器——>预处理器定义,...

东营交警实名曝光一批酒驾人员名单 88人受处罚

齐鲁网·闪电新闻5月24日讯酒后驾驶是对自己和他人生命安全极不负责的行为,为守护大家的平安出行路,东营交警一直将酒驾作为重点打击对象。5月23日,东营交警公布最新一批饮酒、醉酒名单。对以下驾驶人醉酒...

Qt界面——搭配QCustomPlot(qt platform)

这是我第一个使用QCustomPlot控件的上位机,通过串口精确的5ms发送一次数据,再将读取的数据绘制到图表中。界面方面,尝试卡片式设计,外加QSS简单的配了个色。QCustomPlot官网:Qt...

大话西游2分享赢取种族坐骑手办!PK趣闻录由你书写

老友相聚,仗剑江湖!《大话西游2》2021全民PK季4月激燃打响,各PK玩法鏖战齐开,零门槛参与热情高涨。PK季期间,不仅各种玩法奖励丰厚,参与PK趣闻录活动,投稿自己在PK季遇到的趣事,还有机会带走...

测试谷歌VS Code AI 编程插件 Gemini Code Assist

用ClaudeSonnet3.7的天气测试编码,让谷歌VSCodeAI编程插件GeminiCodeAssist自动编程。生成的文件在浏览器中的效果如下:(附源代码)VSCode...

顾爷想知道第4.5期 国服便利性到底需优化啥?

前段时间DNF国服推出了名为“阿拉德B计划”的系列改版计划,截至目前我们已经看到了两项实装。不过关于便利性上,国服似乎还有很多路要走。自从顾爷回归DNF以来,几乎每天都在跟我抱怨关于DNF里面各种各样...

掌握Visual Studio项目配置【基础篇】

1.前言VisualStudio是Windows上最常用的C++集成开发环境之一,简称VS。VS功能十分强大,对应的,其配置系统较为复杂。不管是对于初学者还是有一定开发经验的开发者来说,捋清楚VS...

还嫌LED驱动设计套路深?那就来看看这篇文章吧

随着LED在各个领域的不同应用需求,LED驱动电路也在不断进步和发展。本文从LED的特性入手,推导出适合LED的电源驱动类型,再进一步介绍各类LED驱动设计。设计必读:LED四个关键特性特性一:非线...

Visual Studio Community 2022(VS2022)安装图文方法

直接上步骤:1,首先可以下载安装一个VisualStudio安装器,叫做VisualStudioinstaller。这个安装文件很小,很快就安装完成了。2,打开VisualStudioins...

Qt添加MSVC构建套件的方法(qt添加c++11)

前言有些时候,在Windows下因为某些需求需要使用MSVC编译器对程序进行编译,假设我们安装Qt的时候又只是安装了MingW构建套件,那么此时我们该如何给现有的Qt添加一个MSVC构建套件呢?本文以...

Qt为什么站稳c++GUI的top1(qt c)

为什么现在QT越来越成为c++界面编程的第一选择,从事QT编程多年,在这之前做C++界面都是基于MFC。当时为什么会从MFC转到QT?主要原因是MFC开发界面想做得好看一些十分困难,引用第三方基于MF...

qt开发IDE应该选择VS还是qt creator

如果一个公司选择了qt来开发自己的产品,在面临IDE的选择时会出现vs或者qtcreator,选择qt的IDE需要结合产品需求、部署平台、项目定位、程序猿本身和公司战略,因为大的软件产品需要明确IDE...

Qt 5.14.2超详细安装教程,不会来打我

Qt简介Qt(官方发音[kju:t],音同cute)是一个跨平台的C++开库,主要用来开发图形用户界面(GraphicalUserInterface,GUI)程序。Qt是纯C++开...

Cygwin配置与使用(四)——VI字体和颜色的配置

简介:VI的操作模式,基本上VI可以分为三种状态,分别是命令模式(commandmode)、插入模式(Insertmode)和底行模式(lastlinemode),各模式的功能区分如下:1)...

取消回复欢迎 发表评论: