作为 DevOps 工程师,我每天都使用 Linux。在本文中,我想介绍一些我日常使用的 Linux 命令,帮助我更高效地工作或排除故障。
xargs
xargs看似非常简单,之前使用方式都是肌肉记忆,后来深入研究了下发现该xargs命令构建并执行通过标准输入提供的命令。它接受输入并将其转换为另一个命令的命令参数。
我认为这个命令非常重要和方便。您可以使用此命令将命令的输出作为参数传递给另一个命令。
例如,如果要从/etc目录中查找所有“*.conf”文件,并将它们归类,可以使用以下命令:
加上-i参数还可以使用以下选项运行多个命令:
$ cat file.txt | xargs -i sh -c 'command{} | command2 {} && command3 {}'
或者您甚至可以使用存档文件tar
$ find /home/tony -name "*.jpg" -type f | xargs tar -cxvf images.tar.gz
nohup
nohup日常使用的场景就是,启动一个进程在前台运行,当关闭session时进程会被退出,想要了解这部分细节的可以看下SIGHUP(Signal Hang UP);
使用该nohup命令是阻止SIGHUP信号并允许进程完成的一种方法,即使在从终端注销后也是如此。
例如,如果你想在后台运行数据库导出操作,并将命令的操作输出记录到文件中,那么你可以这样做:
$ nohup mysqldump -uroot -pxxxx —all-databases > ./alldatabases.sql &
您还可以nohup使用以下命令在后台运行多个进程:
nohup bash -c '[command1] && [command2]'
只需将commandand替换command2为您自己的命令,如有必要,您还可以添加更多命令,仅用&&作分隔符。
查找内存/CPU 使用率高的进程
如果您已经htop安装,您可以使用它而不是键入以下命令,它更美观。如果没有安装那么您可以使用以下命令依次找出内存消耗高的进程:
$ ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%mem | head -10
PID PPID CMD %MEM %CPU
1213 1 /usr/lib/systemd/systemd-jo 0.9 0.0
2332 1 /usr/sbin/rsyslogd -n 0.6 0.0
2417 2333 /usr/bin/ssm-agent-worker 0.5 0.0
2474 1 python3 /usr/bin/amazon-efs 0.5 0.1
2333 1 /usr/bin/amazon-ssm-agent 0.3 0.0
2477 1 /usr/bin/stunnel /var/run/e 0.2 0.0
9223 2392 sshd: txu [priv ] 0.2 0.0
2392 1 /usr/sbin/sshd -D 0.2 0.0
9475 9256 sudo su - 0.1 0.0
类似地,您可以找出高 CPU 使用率的进程:
$ ps -eo pid,ppid,cmd,%mem,%cpu --sort=-%cpu | head -10
PID PPID CMD %MEM %CPU
2474 1 python3 /usr/bin/amazon-efs 0.5 0.1
1 0 /usr/lib/systemd/systemd -- 0.1 0.0
2 0 [kthreadd] 0.0 0.0
3 2 [rcu_gp] 0.0 0.0
4 2 [rcu_par_gp] 0.0 0.0
6 2 [kworker/0:0H-ev] 0.0 0.0
8 2 [mm_percpu_wq] 0.0 0.0
9 2 [rcu_tasks_rude_] 0.0 0.0
10 2 [rcu_tasks_trace] 0.0 0.0
查看多个日志
在日常工作中,我们查看日志文件的方式可能是在一个终端使用tail命令查看日志文件,在另一个终端查看另一个日志文件。但有时我觉得这种方法有点麻烦。其实有一个工具叫multitail可以在同一个终端同时查看多个日志文件。以下命令将在两列中显示两个日志
$ multitail -s 2 /var/log/messages /var/log/cloud-init-output.log
效果如下图;
查看 TCP 连接状态
查看网络请求与分析网络问题netstat必知必会,执行demo如下:
$ netstat -nat | awk '{print $6}' | sort | uniq -c | sort -rn
6 LISTEN
4 ESTABLISHED
3 SYN_RECV
1 Foreign
1 established)
请求最高的前 10 个 IP
有时用户请求量突然增加。这个时候我们可以查看请求源的IP状态。如果集中在少数几个IP上,则可能存在攻击,我们可以使用防火墙进行阻断。命令如下:
$ netstat -anlp | grep 80| grep tcp | awk '{print $5}' | awk -F: '{print $1}' | sort | uniq -c | sort -nr | head -n10
1566 10.1.1.2
500 10.2.3.4
44 10.3.2.4
...
前 10 个文件处理程序消耗进程
有时您需要监控服务器上每个进程打开的文件数,以下命令可以帮助您找出前 15 名:
$ find /proc -maxdepth 1 -type d -name '[0-9]*' -exec bash -c "ls {}/fd/ | wc -l | tr '\n' ' '" \; -printf "fds (PID = %P) \n" | 排序-rn | head -15
500 fds (PID = 2541)
366 fds (PID = 29563)
254 fds (PID = 1)
46 fds (PID = 2613)
44 fds (PID = 2253)
41 fds (PID = 30709)
38 fds (PID = 27695)
37 fds (PID = 29971)
...
它进入目录中的每个 PID 文件夹/proc并计算打开的文件,然后按降序对它们进行排序。
查找头部连接
ss指令也是网络分析必备之一,比如:统计入站连接数最多的IP地址
$ ss -t | awk '(NR>1) {print $5}' | awk -F: '{print $1}' | sort | uniq -c | sort -rn | head -10
16 127.0.0.1
8 10.238.168.96
1 10.229.36.59
...
总结
要说各种高阶的复杂指令与常用脚本片段还能加上更多,比如:
- Linux kernel的debug过程常用指令
- Linux ebpf的debug网络问题和安全问题
- Linux下使用AWK的各种高阶分析+配套的ssh的远程主机批量处理
上述内容留待后续文章单独整理,感兴趣的同学可以点个关注,后续有更新会收到推送。