linux 多线程或多进程 epoll处理 accept 惊群问题
liebian365 2024-10-27 13:13 17 浏览 0 评论
什么是惊群
简单说,惊群是因为多进程(多线程)在同时阻塞等待同一个事件的时候(休眠状态),当时间发生时,就会唤醒所有等待的(休眠的)进程(线程)。但是事件只能被一个进程或线程处理,而其他进程(线程)获取失败,只能重新进入休眠状态,这种现象和性能浪费就叫做惊群。
产生惊群的条件
- 多个进程或者多个线程
- 同时等待处理一个事件
具体场景复现
测试环境 :
- debian11
- 内核5.10.0-8
- 编译器 clang11
多线程和多进程在惊群问题上差不多,为了少些一点,下文中没有特殊说明,多线程 也包含了多进程
在linux中,使用C/C++ 编写 tcp server时,会依次调用 socket() bind() listen() accept() 这几个函数,这几个函数会打开socket,绑定ip和端口,开始监听端口,accept函数会阻塞当前进程,等待客户端连接。
如果在单线程中,只有一个accept函数在等待客户端连接,当客户端来连接的时候,只会有一个accept函数来处理,所以也不会存在惊群问题了。
在多线模型中,多个线程分别accept同一个socket,当有客户端连接时,内核会通知所有的线程来处理这个请求,但是呢,请求只能被一个线程处理,其他的线程的不到这个事件,只能白白被唤醒。
这是最简单的一种惊群,这种情况在linux2.6以后就不会产生了。因为在Linux 2.6 版本之后,通过引入一个标记位 WQ_FLAG_EXCLUSIVE,解决掉了 Accept 惊群效应。我原本还想在centos3.9(内核版本是2.5)中去复现这种情况,但是折腾了好久,也没能在centos上编译也运行C++程序,遂放弃。 不废话了,上代码,测试第一种情况
#include <netinet/in.h>
#include <iostream>
#include <sys/epoll.h>
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#define WORKER_THREAD 4
//创建socket,并返回fd
int createSocket() {
int fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
if (fd < 0) {
std::cout << "create socket error" << std::endl;
return 0;
}
sockaddr_in sockAddr{};
sockAddr.sin_port = htons(PORT);
sockAddr.sin_family = AF_INET;
sockAddr.sin_addr.s_addr = htons(INADDR_ANY);
if (bind(fd, (sockaddr *) &sockAddr, sizeof(sockAddr)) < 0) {
std::cout << "bind socket error, port:" << PORT << std::endl;
return 0;
}
if (listen(fd, 100) < 0) {
std::cout << "listen port error" << std::endl;
return 0;
}
return fd;
}
void Worker1(int socketFd, int k) {
std::cout << " Worker" << k << " run " << std::endl;
while (true) {
int tfd = 0;
sockaddr_in cli_addr{};
socklen_t length = sizeof(cli_addr);
std::cout << "worker" << k << " in " << std::endl;
tfd = accept(socketFd, (sockaddr *) &cli_addr, &length);
if (tfd <= 0) {
std::cout << "accept error" << std::endl;
return;
} else {
std::cout << "worker" << k << " accept " << std::endl;
}
}
}
int main() {
std::mutex mutex;
std::unique_lock<std::mutex> lck(mutex);
std::condition_variable cv;
int fd = createSocket();
//第一种,多个线程不使用多路复用,accept同一个socket
for (int i = 0; i < WORKER_THREAD; ++i) {
std::thread th(&Worker1, fd, i + 1);
th.detach();
}
cv.wait(lck);
return 0;
}
这代码可以用C写,但是习惯用C++了,就用C++写吧。代码也比较简单,createSocket()创建了一个socket,然后4个线程分别去accept这个socket。 下面是运行结果:
可以看到,4个线程都在运行,并且accept,但是当连接来的时候,只有个线程能得到事件。
既然linux内核已经帮我们处理了惊群,那我们还考虑这些干啥,直接用不就完了。
但是,我们在写代码的时候一般不会直接阻塞accept的,都是使用多路复用来帮我们处理连接阻塞的是多路复用函数。目前综合性能比较好的IO多路复用是epoll。当在多线程中使用epoll时,惊群问题就会出现了。 先代码和结果,然后再解释
#include <netinet/in.h>
#include <iostream>
#include <sys/epoll.h>
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#define WORKER_THREAD 4
//创建socket,并返回fd
int createSocket() {
int fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
if (fd < 0) {
std::cout << "create socket error" << std::endl;
return 0;
}
sockaddr_in sockAddr{};
sockAddr.sin_port = htons(PORT);
sockAddr.sin_family = AF_INET;
sockAddr.sin_addr.s_addr = htons(INADDR_ANY);
if (bind(fd, (sockaddr *) &sockAddr, sizeof(sockAddr)) < 0) {
std::cout << "bind socket error, port:" << PORT << std::endl;
return 0;
}
if (listen(fd, 100) < 0) {
std::cout << "listen port error" << std::endl;
return 0;
}
return fd;
}
void Worker2(int socketFd, int k) {
std::cout << " Worker" << k << " run " << std::endl;
int eFd = epoll_create(1);
if (eFd < 0) {
std::cout << "create epoll fail";
return;
}
epoll_event epev_{};
epev_.events = EPOLLIN;
epev_.data.fd = socketFd;
epoll_ctl(eFd, EPOLL_CTL_ADD, socketFd, &epev_);
epoll_event events[EVENT_NUM];
while (true) {
int eNum = epoll_wait(eFd, events, EVENT_NUM, -1);
if (eNum == -1) {
std::cout << "epoll error";
return;
}
//一定要加上这句,防止事件被瞬间处理,导致看不到结果
std::this_thread::sleep_for((std::chrono::seconds (1)));
std::cout << "worker" << k << " in " << std::endl;
for (int i = 0; i < eNum; ++i) {
if (events[i].data.fd == socketFd) {
int tfd = 0;
sockaddr_in cli_addr{};
socklen_t length = sizeof(cli_addr);
tfd = accept(socketFd, (sockaddr *) &cli_addr, &length);
if (tfd <= 0) {
std::cout << "accept error" << std::endl;
} else {
std::cout << "worker" << k << " accept " << std::endl;
}
} else {
//处理正常的socket读写事件,这里可以忽略,不是这次关注的点
}
}
}
}
int main() {
std::mutex mutex;
std::unique_lock<std::mutex> lck(mutex);
std::condition_variable cv;
int fd = createSocket();
//第二种,多个线程使用epoll多路复用,accept同一个socket
for (int i = 0; i < WORKER_THREAD; ++i) {
std::thread th(&Worker2, fd, i + 1);
th.detach();
}
}
结果
这里可以看到,当有客户端来连接的时候,4个线程都被唤醒了,但是只有workr2 线程成功获取了事件,其余的3个线程都白白唤醒浪费了性能
情景下的惊群问题,第二种情景下的惊群问题为啥就不处理了呢?
相关视频推荐
6种epoll的做法,从redis,memcached到nginx的网络模型实现
学习地址:C/C++Linux服务器开发/后台架构师【零声教育】-学习视频教程-腾讯课堂
需要C/C++ Linux服务器架构师学习资料加群812855908获取(资料包括C/C++,Linux,golang技术,Nginx,ZeroMQ,MySQL,Redis,fastdfs,MongoDB,ZK,流媒体,CDN,P2P,K8S,Docker,TCP/IP,协程,DPDK,ffmpeg等),免费分享
我的猜想不一定正确,如果有错误,请指出:
accept 只能是被一个进程调用成功(连接事件只会处理一次嘛),所以内核就直接处理了(一个accept只会唤醒一个进程)。但 epoll 不一样,epoll中管理了很多连接,不止socket这一个,除了可能后续被 accept 调用外,还有可能是其他网络 IO 事件的,而其他 IO 事件是否只能由一个进程处理,是不一定的,这是一个由用户决定的事情,例如可能一个文件会由多个进程来读写。所以,对 epoll 默认对于多进程监听同一文件不会设置互斥,所以就导致了epoll惊群问题。
在linux4.5内核之后给epoll添加了一个 EPOLLEXCLUSIVE的标志位,如果设置了这个标志位,那epoll将进程挂到等待队列时将会设置一下互斥标志位,这时实现跟内核原生accept一样的特性,只会唤醒队列中的一个进程。
修改一下worker2函数:
void Worker2(int socketFd, int k) {
std::cout << " Worker" << k << " run " << std::endl;
int eFd = epoll_create(1);
if (eFd < 0) {
std::cout << "create epoll fail";
return;
}
epoll_event epev_{};
//给epoll加上 互斥标志
epev_.events = EPOLLIN | EPOLLEXCLUSIVE;
epev_.data.fd = socketFd;
epoll_ctl(eFd, EPOLL_CTL_ADD, socketFd, &epev_);
epoll_event events[EVENT_NUM];
while (true) {
int eNum = epoll_wait(eFd, events, EVENT_NUM, -1);
if (eNum == -1) {
std::cout << "epoll error";
return;
}
//一定要加上这句,防止事件被瞬间处理,导致看不到结果
std::this_thread::sleep_for((std::chrono::seconds(1)));
std::cout << "worker" << k << " in " << std::endl;
for (int i = 0; i < eNum; ++i) {
if (events[i].data.fd == socketFd) {
int tfd = 0;
sockaddr_in cli_addr{};
socklen_t length = sizeof(cli_addr);
tfd = accept(socketFd, (sockaddr *) &cli_addr, &length);
if (tfd <= 0) {
std::cout << "accept error" << std::endl;
} else {
std::cout << "worker" << k << " accept " << std::endl;
}
} else {
//处理正常的socket读写事件,这里可以忽略,不是这次关注的点
}
}
}
}
现在来测试一下
现在的epoll已经不会有惊群问题了
另一种方式
其实解决多线程使用epoll等多路复用导致的惊群问题,还有一个更彻底解决方法,让每个线程分别打开一个socket,并且这些socket绑定在同一个端口,然后accept这个socket。这就像第一种情景那样,内核直接帮我们做了惊群处理。这里会使用到 linux 3.9后 socket提供SO_REUSEPORT标志。使用这个标志后,会允许多个socket绑定和监听同一个端口。 代码如下
#include <netinet/in.h>
#include <iostream>
#include <sys/epoll.h>
#include <iostream>
#include <thread>
#include <mutex>
#include <condition_variable>
#define WORKER_THREAD 4
//创建socket,并返回fd
int createSocket2() {
int fd = socket(AF_INET, SOCK_STREAM, IPPROTO_TCP);
if (fd == -1) {
std::cout << "create socket error" << std::endl;
return 0;
}
int on = 1;
if (setsockopt(fd, SOL_SOCKET, SO_REUSEPORT, (const void *) &on, sizeof(on)) < 0) {
std::cout << "set opt error, ret:" << std::endl;
}
sockaddr_in sockAddr{};
sockAddr.sin_port = htons(PORT);
sockAddr.sin_family = AF_INET;
sockAddr.sin_addr.s_addr = htons(INADDR_ANY);
if (bind(fd, (sockaddr *) &sockAddr, sizeof(sockAddr)) < 0) {
std::cout << "bind socket error, port:" << PORT << std::endl;
return 0;
}
if (listen(fd, 100) < 0) {
std::cout << "listen port error" << std::endl;
return 0;
}
return fd;
}
void Worker3(int k) {
std::cout << " Worker" << k << " run " << std::endl;
int socketFd = createSocket2();
int eFd = epoll_create(1);
if (eFd == -1) {
std::cout << "create epoll fail" << std::endl;
return;
}
epoll_event epev_{};
epev_.events = EPOLLIN;
epev_.data.fd = socketFd;
epoll_ctl(eFd, EPOLL_CTL_ADD, socketFd, &epev_);
epoll_event events[EVENT_NUM];
while (true) {
int eNum = epoll_wait(eFd, events, EVENT_NUM, -1);
if (eNum == -1) {
std::cout << "epoll error" << std::endl;
return;
}
std::this_thread::sleep_for((std::chrono::seconds(1)));
std::cout << "worker" << k << " in " << std::endl;
for (int i = 0; i < eNum; ++i) {
if (events[i].data.fd == socketFd) {
int tfd = 0;
sockaddr_in cli_addr{};
socklen_t length = sizeof(cli_addr);
tfd = accept(socketFd, (sockaddr *) &cli_addr, &length);
if (tfd <= 0) {
std::cout << "accept error" << std::endl;
} else {
std::cout << "worker" << k << " accept " << std::endl;
}
} else {
//处理正常的socket读写事件
}
}
}
}
int main() {
std::mutex mutex;
std::unique_lock<std::mutex> lck(mutex);
std::condition_variable cv;
//第三种,多个线程使用epoll多路复用,每个线程分别bind,listen 同一个端口, accept各自的socket
for (int i = 0; i < WORKER_THREAD; ++i) {
std::thread th(&Worker3, i + 1);
th.detach();
}
cv.wait(lck);
return 0;
}
结果
也是没有问题的,多个连接来的时候,只会有一个线程被唤醒,相当于在内核级别中实现了一个负载均衡
总结
简单总结一下,当多个线程或者进程同时阻塞同一个事件的时候,会出现惊群现象,如果不适用epoll等多路复用技术,在linux2.6 以后内核已经帮我们处理了惊群问题。
如果使用了epoll,就需要额外处理epoll导致的惊群问题,有两种方式
- linux4.5内核之后,epoll有一个EPOLLEXCLUSIVE特性,可以防止epoll惊群出现
- linux 3.9内核之后给 socket 提供SO_REUSEPORT特性,可以允许多个socket绑定在同一个端口上,相当于每个线程都有一个socket,在处理accept时,内核会自动处理惊群问题
1和2两种方式都能有效解决惊群问题,但是目前使用 socket的 SO_REUSEPORT 是最好的方式.。
我通过查资料得到 EPOLLEXCLUSIVE 标识会保证一个事件发生时候只有一个线程会被唤醒,来避免多惊群问题。不过任一时候只能有一个Worker调用 accept,限制了真正并行的吞吐量。 这个有待验证,小伙伴有时间可以去深入了解一下。
相关推荐
- 4万多吨豪华游轮遇险 竟是因为这个原因……
-
(观察者网讯)4.7万吨豪华游轮搁浅,竟是因为油量太低?据观察者网此前报道,挪威游轮“维京天空”号上周六(23日)在挪威近海发生引擎故障搁浅。船上载有1300多人,其中28人受伤住院。经过数天的调...
- “菜鸟黑客”必用兵器之“渗透测试篇二”
-
"菜鸟黑客"必用兵器之"渗透测试篇二"上篇文章主要针对伙伴们对"渗透测试"应该如何学习?"渗透测试"的基本流程?本篇文章继续上次的分享,接着介绍一下黑客们常用的渗透测试工具有哪些?以及用实验环境让大家...
- 科幻春晚丨《震动羽翼说“Hello”》两万年星间飞行,探测器对地球的最终告白
-
作者|藤井太洋译者|祝力新【编者按】2021年科幻春晚的最后一篇小说,来自大家喜爱的日本科幻作家藤井太洋。小说将视角放在一颗太空探测器上,延续了他一贯的浪漫风格。...
- 麦子陪你做作业(二):KEGG通路数据库的正确打开姿势
-
作者:麦子KEGG是通路数据库中最庞大的,涵盖基因组网络信息,主要注释基因的功能和调控关系。当我们选到了合适的候选分子,单变量研究也已做完,接着研究机制的时便可使用到它。你需要了解你的分子目前已有哪些...
- 知存科技王绍迪:突破存储墙瓶颈,详解存算一体架构优势
-
智东西(公众号:zhidxcom)编辑|韦世玮智东西6月5日消息,近日,在落幕不久的GTIC2021嵌入式AI创新峰会上,知存科技CEO王绍迪博士以《存算一体AI芯片:AIoT设备的算力新选择》...
- 每日新闻播报(September 14)_每日新闻播报英文
-
AnOscarstatuestandscoveredwithplasticduringpreparationsleadinguptothe87thAcademyAward...
- 香港新巴城巴开放实时到站数据 供科技界研发使用
-
中新网3月22日电据香港《明报》报道,香港特区政府致力推动智慧城市,鼓励公私营机构开放数据,以便科技界研发使用。香港运输署21日与新巴及城巴(两巴)公司签署谅解备忘录,两巴将于2019年第3季度,开...
- 5款不容错过的APP: Red Bull Alert,Flipagram,WifiMapper
-
本周有不少非常出色的app推出,鸵鸟电台做了一个小合集。亮相本周榜单的有WifiMapper's安卓版的app,其中包含了RedBull的一款新型闹钟,还有一款可爱的怪物主题益智游戏。一起来看看我...
- Qt动画效果展示_qt显示图片
-
今天在这篇博文中,主要实践Qt动画,做一个实例来讲解Qt动画使用,其界面如下图所示(由于没有录制为gif动画图片,所以请各位下载查看效果):该程序使用应用程序单窗口,主窗口继承于QMainWindow...
- 如何从0到1设计实现一门自己的脚本语言
-
作者:dong...
- 三年级语文上册 仿写句子 需要的直接下载打印吧
-
描写秋天的好句好段1.秋天来了,山野变成了美丽的图画。苹果露出红红的脸庞,梨树挂起金黄的灯笼,高粱举起了燃烧的火把。大雁在天空一会儿写“人”字,一会儿写“一”字。2.花园里,菊花争奇斗艳,红的似火,粉...
- C++|那些一看就很简洁、优雅、经典的小代码段
-
目录0等概率随机洗牌:1大小写转换2字符串复制...
- 二年级上册语文必考句子仿写,家长打印,孩子照着练
-
二年级上册语文必考句子仿写,家长打印,孩子照着练。具体如下:...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- wireshark怎么抓包 (75)
- qt sleep (64)
- cs1.6指令代码大全 (55)
- factory-method (60)
- sqlite3_bind_blob (52)
- hibernate update (63)
- c++ base64 (70)
- nc 命令 (52)
- wm_close (51)
- epollin (51)
- sqlca.sqlcode (57)
- lua ipairs (60)
- tv_usec (64)
- 命令行进入文件夹 (53)
- postgresql array (57)
- statfs函数 (57)
- .project文件 (54)
- lua require (56)
- for_each (67)
- c#工厂模式 (57)
- wxsqlite3 (66)
- dmesg -c (58)
- fopen参数 (53)
- tar -zxvf -c (55)
- 速递查询 (52)