一文细说Linux Out Of Memory机制_通讯

2023-01-31 17:01:13 | 来源:哔哩哔哩

有时候我们会发现系统中某个进程会突然挂掉,通过查看系统日志发现是由于 OOM机制导致进程被杀掉。


(资料图)

今天我们就来介绍一下什么是 OOM机制以及怎么防止进程因为 OOM机制而被杀掉。

什么是OOM机制

OOM是 Out Of Memory 的缩写,中文意思是内存不足。而 OOM机制是指当系统内存不足时,系统触发的应急机制。

当 Linux 内核发现系统中的物理内存不足时,首先会对系统中的可回收内存进行回收,能够被回收的内存有如下:

读写文件时的页缓存。

为了性能而延迟释放的空闲 slab 内存页。

当系统内存不足时,内核会优先释放这些内存页。因为使用这些内存页只是为了提升系统的性能,释放这些内存页也不会影响系统的正常运行。

如果释放上述的内存后,还不能解决内存不足的情况,那么内核会如何处理呢?答案就是:触发 OOM killer杀掉系统中占用内存最大的进程。如下图所示:

可以看出,OOM killer 是防止系统崩溃的最后一个手段,不到迫不得已的情况是不会触发的。

【文章福利】小编推荐自己的Linux内核技术交流群:【749907784】整理了一些个人觉得比较好的学习书籍、视频资料共享在群文件里面,有需要的可以自行添加哦!!!(含视频教程、电子书、实战项目及代码)     

OOM killer 实现

接下来,我们分析一下内核是如何实现 OOM killer 的。

由于在 Linux 系统中,进程申请的都是虚拟内存地址。所以当程序调用 malloc()申请内存时,如果虚拟内存空间足够的话,是不会触发 OOM 机制的。

当进程访问虚拟内存地址时,如果此虚拟内存地址还没有映射到物理内存地址的话,那么将会触发 缺页异常

在缺页异常处理例程中,将会申请新的物理内存页,并且将进程的虚拟内存地址映射到刚申请的物理内存。

如果在申请物理内存时,系统中的物理内存不足,那么内核将会回收一些能够被回收的文件页缓存。如果回收完后,物理内存还是不足的话,那么将会触发 swapping机制(如果开启了的话)。

swapping机制会将某些进程不常用的内存页写入到交换区(硬盘分区或文件)中,然后释放掉这些内存页,从而达到缓解内存不足的情况。

如果通过上面的手段还不能解决内存不足的情况,那么内核将会调用 pagefault_out_of_memory()函数来杀掉系统中占用物理内存最多的进程。

我们来看看 pagefault_out_of_memory()函数的实现:

可以看出,pagefault_out_of_memory()函数最终会调用 out_of_memory()来杀死系统中占用内存最多的进程。

我们继续来看看 out_of_memory()函数的实现:

out_of_memory()函数的逻辑比较简单,主要完成两个事情:

调用 select_bad_process()函数从系统中选择一个最坏(占用物理内存最多)的进程。

如果找到最坏的进程,那么调用 oom_kill_process()函数将此进程杀掉。

从上面的分析可知,找到最坏的进程是 OOM killer 最为重要的事情。

那么我们来看看 select_bad_process()函数是怎样选择最坏的进程的:

select_bad_process()函数的主要工作如下:

遍历系统中所有的进程和线程,并且调用 oom_badness()函数计算进程的最坏分数值。

选择最坏分数值最大的进程作为被杀掉的目标进程。

所以,计算进程的最坏分数值就是 OOM killer 的核心工作。我们接着来看看 oom_badness()函数是怎么计算进程的最坏分数值的:

oom_badness()函数主要按照以下步骤来计算进程的最坏分数值:

如果进程不能被杀掉(init进程和内核进程是不能被杀的),那么返回分数值为 0。

可以通过 /proc/{pid}/oom_score_adj文件来设置进程的 OOM 建议值(取值范围为 -1000 ~ 1000)。建议值越小,进程被杀的机会越低。如果将其设置为 -1000 时,进程将被禁止杀掉。

统计进程使用的物理内存数,包括实际使用的物理内存、页表占用的物理内存和 swap 机制占用的物理内存。

最后加上进程的 OOM 建议值,得出最终的分数值。

通过 oom_badness()函数计算出进程的最坏分数值后,系统就能从中选择一个分数值最大的进程杀死,从而解决内存不足的情况。

禁止进程被 OOM 杀掉

有时候,我们不希望某些进程被 OOM killer 杀掉。例如 MySQL 进程如果被 OOM killer 杀掉的话,那么可能导致数据丢失的情况。

那么如何防止进程被 OOM killer 杀掉呢?从上面的分析可知,在内核计算进程最坏分数值时,会加上进程的 oom_score_adj(OOM建议值)值。如果将此值设置为 -1000时,那么系统将会禁止 OOM killer 杀死此进程。

例如使用如下命令,将会禁止杀死 PID 为 2000 的进程:

这样,我们就能防止一些重要的进程被 OOM killer 杀死。

原文作者:Linux内核那些事

上一篇 下一篇

相关新闻

一文细说Linux Out Of Memory机制_通讯

种子库,守护全球生物多样性(国际视点)

【环球新视野】2023环青海湖公路自行车赛比赛项目+赛程

全球快资讯丨港澳居民个税优惠辅助功能上新啦!优惠减免测算功能已正式上线

01月31日00时江西景德镇昨日疫情新增0例、累计报告阳性感染者确诊9例

前FPX两大打野性格成对比?天饱受舆论争议,Bo欧洲风生水起! 全球要闻

突发 | Gucci任命Valentino成衣设计师为创意总监

天天视点!新店速递 | 邂逅冰雪淄博,喜迎IU酒店·淄博万象王府井步行街店开业!

翻阅近40年人口史,我终于找到了重庆楼市的未来!

张艺谋的《满江红》看得我想一头撞死

2023年元宵节成都川菜博物馆还有活动么?

环球信息:安居乐业的安是什么意思_安居乐业什么意思

收入“兔”增429.02%,125万游客昼夜畅玩大江大湖,武汉文旅集团迎来开门红_世界短讯

焦点播报:【LLAS简评】Fes2步梦+鞠莉

乐见首套房贷利率政策再调整|环球聚焦

最新新闻

一文细说Linux Out Of Memory机制_通讯

种子库,守护全球生物多样性(国际视点)

【环球新视野】2023环青海湖公路自行车赛比赛项目+赛程

全球快资讯丨港澳居民个税优惠辅助功能上新啦!优惠减免测算功能已正式上线

01月31日00时江西景德镇昨日疫情新增0例、累计报告阳性感染者确诊9例

前FPX两大打野性格成对比?天饱受舆论争议,Bo欧洲风生水起! 全球要闻

突发 | Gucci任命Valentino成衣设计师为创意总监

天天视点!新店速递 | 邂逅冰雪淄博,喜迎IU酒店·淄博万象王府井步行街店开业!

翻阅近40年人口史,我终于找到了重庆楼市的未来!

张艺谋的《满江红》看得我想一头撞死

2023年元宵节成都川菜博物馆还有活动么?

环球信息:安居乐业的安是什么意思_安居乐业什么意思

收入“兔”增429.02%,125万游客昼夜畅玩大江大湖,武汉文旅集团迎来开门红_世界短讯

焦点播报:【LLAS简评】Fes2步梦+鞠莉

乐见首套房贷利率政策再调整|环球聚焦

天天头条:决胜局大崩盘!国乒直板名将输球,何卓佳险胜,女单7人进八强

湛江01月28日13时疫情有多少例 _昨日新增12例本土确诊病例、0例本土无症状感染者 热头条

天天简讯:唐山银保监分局关于唐山银行股份有限公司玉田鸦鸿桥支行开业的批复

苔丝读后感400字_苔丝读后感

大豆主产国是哪里 大豆的发源地和主产国蚂蚁新村

返程高峰,地铁内人“鼓了” 环球聚看点

今日精选:俄媒:美国核导弹基地军人被曝血癌高发

隐藏喻体的句子(合集685句) 世界播报

当前观察:“洋女婿”史提夫中国过年趣事

世界微资讯!春节档票房破52亿元 观影人次突破1亿

新消息丨苹果官网调整以旧换新价格:Mac上涨 iPhone下跌

曾子言曰士不可以不弘毅_不可以不弘毅 精选

全球连线|洋媳妇中国乡村赶大集_天天消息

预计春节假期后半段深圳冷空气活动较频繁-速讯

2023年养老金上涨,五类人有可能涨300每月,有你吗? 世界滚动