centos7 系统cache的一例故障及解决

故障现象
公司某云上一台重度计算型服务出现错误报警,且ssh无法登录,强制重启后检查系统日志,发现系统无法登陆至强制重启期间,下列日志多次重复。
想要了解更多关于互联网知识,windows,linux的知识可以去《linux就该这么学》看看。

操作方法

  • 01

    Apr 21 13:03:41 web03 kernel: INFO: task kworker/5:0H:11070 blocked for more than 120 seconds . Apr 21 13:03:41 web03 kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables thi s message. Apr 21 13:03:41 web03 kernel: kworker/5:0H    D ffff8802bebf3dd8     0 11070      2 0x0000008 0 Apr 21 13:03:41 web03 kernel: ffff8802bebf3bf0 0000000000000046 ffff8807fc690fb0 ffff8802bebf 3fd8 Apr 21 13:03:41 web03 kernel: ffff8802bebf3fd8 ffff8802bebf3fd8 ffff8807fc690fb0 ffff8802bebf 3d58 Apr 21 13:03:41 web03 kernel: ffff8802bebf3d60 7fffffffffffffff ffff8807fc690fb0 ffff8802bebf 3dd8 Apr 21 13:03:41 web03 kernel: Call Trace: Apr 21 13:03:41 web03 kernel: [<ffffffff8168c169>] schedule+0x29/0x70 Apr 21 13:03:41 web03 kernel: [<ffffffff81689bc9>] schedule_timeout+0x239/0x2c0 Apr 21 13:03:41 web03 kernel: [<ffffffff810c5308>] ? try_to_wake_up+0x1c8/0x320 Apr 21 13:03:41 web03 kernel: [<ffffffff8168c546>] wait_for_completion+0x116/0x170 Apr 21 13:03:41 web03 kernel: [<ffffffff810c54c0>] ? wake_up_state+0x20/0x20 Apr 21 13:03:41 web03 kernel: [<ffffffff810b08e8>] kthread_create_on_node+0xa8/0x140 Apr 21 13:03:41 web03 kernel: [<ffffffff810a9170>] ? rescuer_thread+0x460/0x460 Apr 21 13:03:41 web03 kernel: [<ffffffff810a883a>] create_worker+0xea/0x250 Apr 21 13:03:41 web03 kernel: [<ffffffff810a8b36>] manage_workers.isra.24+0xf6/0x2d0 Apr 21 13:03:41 web03 kernel: [<ffffffff810a9542>] worker_thread+0x3d2/0x410 Apr 21 13:03:41 web03 kernel: [<ffffffff810a9170>] ? rescuer_thread+0x460/0x460 Apr 21 13:03:41 web03 kernel: [<ffffffff810b0a4f>] kthread+0xcf/0xe0 Apr 21 13:03:41 web03 kernel: [<ffffffff810b0980>] ? kthread_create_on_node+0x140/0x140 Apr 21 13:03:41 web03 kernel: [<ffffffff816970d8>] ret_from_fork+0x58/0x90 Apr 21 13:03:41 web03 kernel: [<ffffffff810b0980>] ? kthread_create_on_node+0x140/0x140 Apr 21 13:05:41 web03 kernel: INFO: task kworker/5:0H:11070 blocked for more than 120 seconds .

  • 02

    解决参考 经过学习了解到,linux会利用最多40%的可用内存作为文件系统的缓存,到了写入磁盘的时候,如果io速度慢或者压力过大的话,超过120秒未写入完成,那么系统内存就会充满数据并就出现这个错误。 有两个参数可以降低缓存的默认比例, vm.dirtybackgroundratio 和 vm.dirty_ratio ,使其写入磁盘的时间少于120秒,如下示例:

  • 03

    /etc/sysctl.conf 示例 ## 系统cache在后台和前端可以使用的内存百分比,分别为5%和10%,默认是40%,系统比较繁忙时使用 ## 尝试解决"task kworker/5:0H:11070 blocked for more than 120 seconds ## kernel: "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" disables thi ## s message." vm.dirty_background_ratio = 5 vm.dirty_ratio = 10

  • 04

    使配置文件生效 sysctl -p

  • 05

    后续观察是否还会出现同样错误

(0)

相关推荐

  • Win7系统出现0x000000c2蓝屏故障的解决方法

    Win7系统出现0x000000c2蓝屏故障怎么办?当我们的电脑出现蓝屏的时候,就会显示一系列的蓝屏代码,供大家去分析看看是哪里出的问题.最近,Win7系统用户的电脑遇到蓝屏,提示错误代码:0x000 ...

  • SOLARIS系统无法启动图形界面故障的解决方法

    SOLARIS系统无法启动图形界面故障的解决方法

  • windows系统常见故障的解决方法

     一、在Windows下经常出现蓝屏故障 出现此类故障的表现方式多样,有时在Windows启动时出现,有时在Windows下运行一些软件时出现,出现此类故障一般是由于用户操作不当促使Windows系统 ...

  • windows xp系统常见的异常故障及解决方法整理

    板载声卡发音不正常?快速开机后鼠标无法移动?当你遇到这些系统故障时候是不是觉得很崩溃呢?今天小编就给大家盘点那些常见的windows xp系统异常故障及解决途径,希望对那些还在坚守windows xp ...

  • windows7系统引导故障的解决修复mbr图文教程

    windows7的启动过程的常识:电脑加电后,首先是启动BIOS程序,BIOS自检完毕后,找到硬盘上的主引导记录MBR,MBR读取DPT(分区表),从中找出活动的主分区,然后读取 活动主分区的PBR( ...

  • Win8.1系统网络连接"有限连接"故障解决办法

    有限连接是什么意思呢?导致网络连接受限的原因很多,可能是信号源(运营商的问题或者路由器问题),也可能是由于计算机系统导致的TCP/IP连接问题。如果是运营商的问题就需要致电您当地的服务商了,小编就为您 ...

  • 常见的windows xp系统异常故障及解决途径

    板载声卡发音不正常?快速开机后鼠标无法移动?当你遇到这些系统故障时候是不是觉得很崩溃呢?今天小编就给大家盘点那些常见的windows xp系统异常故障及解决途径,希望对那些还在坚守windows xp ...

  • Win8双系统开机双引导菜单发生故障怎么解决

    Win8双系统开机双引导菜单发生故障怎么解决 一.故障原因: 出现上面的这种故障,是由于Win8系统里面引进了快速启动的功能,微软的说法就是为节约开机的更多时间,将一部分系统启动所需的信息储存在一个文 ...

  • centos7系统怎么修改锁屏时间?

    centos7系统怎么修改锁屏时间? 1.点击gnome桌面左上角的应用程序,然后点击系统工具中的设置 2.点击隐私 3.点击锁屏 4.在弹出的设置界面即可更改锁屏时间 更多知识请关注服务器教程