skynet服务的缺陷 lua死循环 sky服务器连接失败
liebian365 2024-11-14 18:01 46 浏览 0 评论
服务端高级架构—云风的skynet这边有一个关于云风skynet的视频推荐给大家观看 点击就可以观看了!
skynet是一套多人在线游戏的轻量级服务端框架,使用C+Lua开发。skynet的显著优点是,使用这套框架,大多数时候只是用lua写代码,很少用到c,这在一定程度上提高了开发效率。lua虽然没有C高效,但开发复杂业务却是非常敏捷。不过,skynet文档相对较少,所以这里利用一点时间学习和总结skynet相关内容,文章就讲解下skynet服务出现lua死循环如何处理。
在前面的一篇文章[1]介绍到,skynet服务运行可以霸占调度器,如果lua代码有死循环,那这个服务可以霸占一个skynet调度线程。从cpu层面看到,skynet进程独占了一个cpu核心。
在写上篇文章的时候,没想到生产环境也出现以上的情况,以为代码规范化可以避免这个问题。然而随着项目越来越庞大了,果真出现这样的情况。
这个问题最致命的是,一旦skynet服务lua代码进入了死循环,这个服务无法被kill掉。就是说服务被kill了没效果,实际上服务还在跑,还占用了一个skynet调度线程。
回到文章,skynet服务出现lua死循环后如何处理?
其实,skynet作者博客[2]也说明了这个问题,他也提供了办法来解决,让skynet服务跳出死循环。做法是,在 lua vm 在处理 JMP CALL TAILCALL FORLOOP 这几条 opcode 时,去检查一个全局变量,如果全局变量被设置成和自己的 lua state 相同的指针,就立刻抛出一个异常。
结束lua死循环
说了这么多,到底要怎么做才能结束lua死循环?
方法就是,在skyent控制台输入 signal命令,为 signal <service addr>,例子如下:
signal :0100000e
以上,:0100000e 为某个skynet服务的地址。
如果不了解skynet控制台,可以参考我的这篇文章[3]。
示例lua死循环及处理
现在以一个例子测试这个问题。
# vi examples/main.lua
local skynet = require "skynet"
local sprotoloader = require "sprotoloader"
local max_client = 64
skynet.start(function()
skynet.error("Server start")
skynet.uniqueservice("protoloader")
if not skynet.getenv "daemon" then
local console = skynet.newservice("console")
end
skynet.newservice("debug_console",8000)
skynet.newservice("simpledb")
skynet.newservice("test") -- 新加了这个服务
local watchdog = skynet.newservice("watchdog")
skynet.call(watchdog, "lua", "start", {
port = 8888,
maxclient = max_client,
nodelay = true,
})
skynet.error("Watchdog listen on", 8888)
skynet.exit()
end)
看下 test 服务的代码 test.lua
# vi examples/test.lua
local skynet = require "skynet"
skynet.start(function()
skynet.fork(function()
while true do
local t={}
end
end)
end)
启动skynet进程,跑下这个例子。
# ./skynet examples/config
[:01000001] LAUNCH logger
[:01000002] LAUNCH snlua bootstrap
[:01000003] LAUNCH snlua launcher
[:01000004] LAUNCH snlua cmaster
[:01000005] LAUNCH snlua cslave
[:01000007] LAUNCH snlua datacenterd
[:01000008] LAUNCH snlua service_mgr
[:01000009] LAUNCH snlua main
[:0100000a] LAUNCH snlua protoloader
[:0100000b] LAUNCH snlua console
[:0100000c] LAUNCH snlua debug_console 8000
[:0100000d] LAUNCH snlua simpledb
[:0100000e] LAUNCH snlua test
[:0100000f] LAUNCH snlua watchdog
[:01000010] LAUNCH snlua gate
[:01000010] Listen on 0.0.0.0:8888
[:01000009] Watchdog listen on 8888
[:01000009] KILL self
[:01000002] KILL self
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
以上日志看出,skynet有服务陷入了死循环。趁现在试下 signal指令。
# nc 127.0.0.1 8000
Welcome to skynet console
signal :0100000e
OK
看下skynet的运行日志,skynet服务已跳出了死循环,cpu使用恢复了正常。
[:0100000e] recv a signal 0
[:0100000e] lua call [0 to :100000e : 1 msgsz = 0] error : ./lualib/skynet.lua:516: ./lualib/skynet.lua:155: nil
stack traceback:
./examples/test.lua:6: in upvalue 'func'
./lualib/skynet.lua:452: in upvalue 'f'
./lualib/skynet.lua:104: in function <./lualib/skynet.lua:103>
stack traceback:
[C]: in function 'assert'
./lualib/skynet.lua:516: in function 'skynet.dispatch_message'
然而,实际线上遇到的复杂环境没有这么简单。
复杂多变的线上问题
假如你的代码是这样,靠上面的方法就无法解决问题了
local skynet = require "skynet"
skynet.start(function()
skynet.fork(function()
while true do
pcall(function()
while true do
local t={}
end
end)
end
end)
end)
以上的例子中,死循环嵌套死循环,中间还有pcall的处理。当然,真正的代码不可能这样写,但由于项目函数调用层次过深,就可能出现这样的问题。
照前面的方法,调用signal指令后,结果却大相径庭:
# ./skynet examples/config
[:01000001] LAUNCH logger
[:01000002] LAUNCH snlua bootstrap
[:01000003] LAUNCH snlua launcher
[:01000004] LAUNCH snlua cmaster
[:01000005] LAUNCH snlua cslave
[:01000006] LAUNCH harbor 1
[:01000007] LAUNCH snlua datacenterd
[:01000008] LAUNCH snlua service_mgr
[:01000009] LAUNCH snlua main
[:0100000a] LAUNCH snlua protoloader
[:0100000b] LAUNCH snlua console
[:0100000c] LAUNCH snlua debug_console 8000
[:0100000d] LAUNCH snlua simpledb
[:0100000e] LAUNCH snlua test
[:0100000f] LAUNCH snlua watchdog
[:01000010] LAUNCH snlua gate
[:01000009] KILL self
[:01000002] KILL self
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
[:0100000e] recv a signal 0
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 33)
skynet服务还健在,收到了signal指令,但是还是没跳出死循环
那么,要怎么处理这个问题?skynet还有方法解决?
答案是否定的,没有了。现在,只能去改skynet的代码了
要怎么修改skynet的代码。方法不复杂,只需要改一处内容。
vi ./3rd/lua/lvm.c
/* Add by skynet */
lua_State * skynet_sig_L = NULL;
LUA_API void
lua_checksig_(lua_State *L) {
if (skynet_sig_L == G(L)->mainthread) {
//skynet_sig_L = NULL; 注释掉这行代码
lua_pushnil(L);
lua_error(L);
}
}
保存后,重新编译skynet
# make clean -C 3rd/lua
# make clean
# make linux
现在,再启动下skynet,然后在控制台执行一下命令。
# nc 127.0.0.1 8000
Welcome to skynet console
signal :0100000e
OK
kill :0100000e
:0100000e snlua test
OK
再看下skynet的运行日志,这个异常的服务已经被kill掉了
# ./skynet examples/config
[:01000001] LAUNCH logger
[:01000002] LAUNCH snlua bootstrap
[:01000003] LAUNCH snlua launcher
[:01000004] LAUNCH snlua cmaster
[:01000005] LAUNCH snlua cslave
[:01000006] LAUNCH harbor 1 16777221
[:01000007] LAUNCH snlua datacenterd
[:01000008] LAUNCH snlua service_mgr
[:01000009] LAUNCH snlua main
[:01000009] Server start
[:0100000a] LAUNCH snlua protoloader
[:0100000b] LAUNCH snlua console
[:0100000c] LAUNCH snlua debug_console 8000
[:0100000d] LAUNCH snlua simpledb
[:0100000e] LAUNCH snlua test
[:0100000f] LAUNCH snlua watchdog
[:01000010] LAUNCH snlua gate
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 35)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 35)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 35)
[:00000000] A message from [ :00000000 ] to [ :0100000e ] maybe in an endless loop (version = 35)
[:0100000e] recv a signal 0
[:0100000e] lua call [0 to :100000e : 1 msgsz = 0] error : (no error message)
[:01000003] KILL :100000e
好了,文章到这里就结束了。原理是既然跳出一层死循环无法解决问题,那么就跳出所有的死循环吧。因为标记是全局变量的关系,所以同一时间只能处理一个skynet服务。
需要的朋友可以后台私信【1】获取学习视频
相关推荐
- go语言也可以做gui,go-fltk让你做出c++级别的桌面应用
-
大家都知道go语言生态并没有什么好的gui开发框架,“能用”的一个手就能数的清,好用的就更是少之又少。今天为大家推荐一个go的gui库go-fltk。它是通过cgo调用了c++的fltk库,性能非常高...
- 旧电脑的首选系统:TinyCore!体积小+精简+速度极快,你敢安装吗
-
这几天老毛桃整理了几个微型Linux发行版,准备分享给大家。要知道可供我们日常使用的Linux发行版有很多,但其中的一些发行版经常会被大家忽视。其实这些微型Linux发行版是一种非常强大的创新:在一台...
- codeblocks和VS2019下的fltk使用中文
-
在fltk中用中文有点问题。英文是这样。中文就成这个样子了。我查了查资料,说用UTF-8编码就行了。edit->Fileencoding->UTF-8然后保存文件。看下下边的编码指示确...
- FLTK(Fast Light Toolkit)一个轻量级的跨平台Python GUI库
-
FLTK(FastLightToolkit)是一个轻量级的跨平台GUI库,特别适用于开发需要快速、高效且简单界面的应用程序。本文将介绍Python中的FLTK库,包括其特性、应用场景以及如何通过代...
- 中科院开源 RISC-V 处理器“香山”流片,已成功运行 Linux
-
IT之家1月29日消息,去年6月份,中科院大学教授、中科院计算所研究员包云岗,发布了开源高性能RISC-V处理器核心——香山。近日,包云岗在社交平台晒出图片,香山芯片已流片,回片后...
- Linux 5.13内核有望合并对苹果M1处理器支持的初步代码
-
预计Linux5.13将初步支持苹果SiliconM1处理器,不过完整的支持工作可能还需要几年时间才能完全完成。虽然Linux已经可以在苹果SiliconM1上运行,但这需要通过一系列的补丁才能...
- Ubuntu系统下COM口测试教程(ubuntu port)
-
1、在待测试的板上下载minicom,下载minicom有两种方法:方法一:在Ubuntu软件中心里面搜索下载方法二:按“Ctrl+Alt+T”打开终端,打开终端后输入“sudosu”回车;在下...
- 湖北嵌入式软件工程师培训怎么选,让自己脱颖而出
-
很多年轻人毕业即失业、面试总是不如意、薪酬不满意、在家躺平。“就业难”该如何应对,参加培训是否能改变自己的职业走向,在湖北,有哪些嵌入式软件工程师培训怎么选值得推荐?粤嵌科技在嵌入式培训领域有十几年经...
- 新阁上位机开发---10年工程师的Modbus总结
-
前言我算了一下,今年是我跟Modbus相识的第10年,从最开始的简单应用到协议了解,从协议开发到协议讲解,这个陪伴了10年的协议,它一直没变,变的只是我对它的理解和认识。我一直认为Modbus协议的存...
- 创建你的第一个可运行的嵌入式Linux系统-5
-
@ZHangZMo在MicrochipBuildroot中配置QT5选择Graphic配置文件增加QT5的配置修改根文件系统支持QT5修改output/target/etc/profile配置文件...
- 如何在Linux下给zigbee CC2530实现上位机
-
0、前言网友提问如下:粉丝提问项目框架汇总下这个网友的问题,其实就是实现一个网关程序,内容分为几块:下位机,通过串口与上位机相连;下位机要能够接收上位机下发的命令,并解析这些命令;下位机能够根据这些命...
- Python实现串口助手 - 03串口功能实现
-
串口调试助手是最核心的当然是串口数据收发与显示的功能,pzh-py-com借助的是pySerial库实现串口收发功能,今天痞子衡为大家介绍pySerial是如何在pzh-py-com发挥功能的。一、...
- 为什么选择UART(串口)作为调试接口,而不是I2C、SPI等其他接口
-
UART(通用异步收发传输器)通常被选作调试接口有以下几个原因:简单性:协议简单:UART的协议非常简单,只需设置波特率、数据位、停止位和校验位就可以进行通信。相比之下,I2C和SPI需要处理更多的通...
- 同一个类,不同代码,Qt 串口类QSerialPort 与各种外设通讯处理
-
串口通讯在各种外设通讯中是常见接口,因为各种嵌入式CPU中串口标配,工业控制中如果不够还通过各种串口芯片进行扩展。比如spi接口的W25Q128FV.对于软件而言,因为驱动接口固定,软件也相对好写,因...
- 嵌入式linux为什么可以通过PC上的串口去执行命令?
-
1、uboot(负责初始化基本硬bai件,如串口,网卡,usb口等,然du后引导系统zhi运行)2、linux系统(真正的操作系统)3、你的应用程序(基于操作系统的软件应用)当你开发板上电时,u...
你 发表评论:
欢迎- 一周热门
- 最近发表
-
- go语言也可以做gui,go-fltk让你做出c++级别的桌面应用
- 旧电脑的首选系统:TinyCore!体积小+精简+速度极快,你敢安装吗
- codeblocks和VS2019下的fltk使用中文
- FLTK(Fast Light Toolkit)一个轻量级的跨平台Python GUI库
- 中科院开源 RISC-V 处理器“香山”流片,已成功运行 Linux
- Linux 5.13内核有望合并对苹果M1处理器支持的初步代码
- Ubuntu系统下COM口测试教程(ubuntu port)
- 湖北嵌入式软件工程师培训怎么选,让自己脱颖而出
- 新阁上位机开发---10年工程师的Modbus总结
- 创建你的第一个可运行的嵌入式Linux系统-5
- 标签列表
-
- wireshark怎么抓包 (75)
- qt sleep (64)
- cs1.6指令代码大全 (55)
- factory-method (60)
- sqlite3_bind_blob (52)
- hibernate update (63)
- c++ base64 (70)
- nc 命令 (52)
- wm_close (51)
- epollin (51)
- sqlca.sqlcode (57)
- lua ipairs (60)
- tv_usec (64)
- 命令行进入文件夹 (53)
- postgresql array (57)
- statfs函数 (57)
- .project文件 (54)
- lua require (56)
- for_each (67)
- c#工厂模式 (57)
- wxsqlite3 (66)
- dmesg -c (58)
- fopen参数 (53)
- tar -zxvf -c (55)
- 速递查询 (52)