内存泄漏

内存泄漏(英语:memory leak)是计算机科学中的一种资源泄漏,主因是计算机程序内存管理失当[1],因而失去对一段已分配内存空间的控制,程序继续占用已不再使用的内存空间,或是存储器所存储之对象无法透过执行代码而访问,令内存资源空耗[2]

“memory leak”的各地常用译名
中国大陆内存泄漏
台湾记忆体流失、记忆体漏失

内存泄漏与许多其他问题情形具有相同征兆,通常只有获得程序源代码的程序员能分析诊断是否发生内存泄漏[原创研究?]

后果

内存泄漏会因为减少可用内存的数量从而降低计算机的性能。最终,在最糟糕的情况下,过多的可用内存被分配掉导致全部或部分设备停止正常工作,或者应用程序崩溃[3]

内存泄漏带来的后果可能是不严重的,有时甚至能够被常规的手段检测出来。在现代操作系统中,一个应用程序使用的常规内存在程序终止时被释放。这表示一个短暂运行的应用程序中的内存泄漏不会导致严重后果。

在以下情况,内存泄漏后果较严重:

  • 程序运行后置之不理,并且随着时间的流逝消耗越来越多的内存(比如服务器上的后台任务,尤其是嵌入式系统中的后台任务,这些任务可能被运行后很多年内都置之不理);
  • 新的内存被频繁地分配,比如当显示电脑游戏或动画视频画面时;
  • 程序能够请求即使在程序终止之后也不会被释放的内存(比如共享内存);
  • 泄漏在操作系统内部发生;
  • 泄漏在系统关键驱动中发生;
  • 内存非常有限,比如在嵌入式系统或便携设备中;
  • 当运行于一个程序终止时内存并不自动释放内存的操作系统(比如AmigaOS)之上时。

简例

以下的虚构例子无需任何程序设计的知识,但能表明如何导致存储器泄漏及其造成的影响。

在此例中的应用程序是一个简单软件的一小部分,用来控制电梯的运作。此部分软件当乘客在电梯内按下一楼层的按钮时运行。

当按下按钮时:

  1. 要求使用存储器,用作记住目的楼层
  2. 把目的楼层的数字储存到存储器中
  3. 电梯是否已到达目的楼层?
  4. 如是,没有任何事需要做:程序完成
  5. 否则:
  1. 等待直至电梯停止
  2. 到达指定楼层
  3. 释放刚才用作记住目的楼层的存储器

此程序有一处会造成存储器泄漏:如果在电梯所在楼层按下该层的按钮(即上述程序的第4步),程序将触发判断条件而结束运行,但存储器仍一直被占用而没有被释放。这种情况发生得越多,泄漏的存储器也越多。

这个小错误不会造成即时影响。因为人不会经常在电梯所在楼层按下同一层的按钮。而且在通常情况下,电梯应有足够的存储器以应付上百次、上千次类似的情况。不过,电梯最后仍有可能消耗完所有存储器。这可能需要数个月或是数年,所以在简单的测试下这个问题不会被发现。

而这个例子导致的后果会是不那么令人愉快。至少,电梯不会再理会前往其他楼层的要求。更严重的是,如果程序需要存储器去开启电梯门,那可能有人被困电梯内,因为电梯没有足够的存储器去开启电梯门。

存储器泄漏只会在程序运行的时间内持续。例如:关闭电梯的电源时,程序终止运行。当电源再度开启,程序会再次运行而存储器会重置,而这种缓慢的泄漏则会从头开始再次发生。

程序设计问题

存储器泄漏是程序设计中一项常见错误,特别是使用没有内置自动垃圾回收编程语言,如CC++。一般情况下,存储器泄漏发生是因为不能访问动态分配的存储器。目前有相当数量的调试工具用于检测不能访问的内存,从而可以防止存储器泄漏问题,如IBM Rational Purify英语IBM Rational PurifyBoundsChecker英语BoundsCheckerValgrindInsure++英语Insure++memwatch英语memwatch都是为C/C++程序设计亦较受欢迎的存储器调试工具。垃圾回收则可以应用到任何编程语言,而C/C++也有此类函数库。

提供自动内存管理的编程语言如JavaCC#VB.NET以及LISP,都不能避免存储器泄漏。例如,程序会把项目加入至列表,但在完成时没有移除,如同人把对象丢到一堆物品中或放到抽屉内,但后来忘记取走这件物品一样。内存管理器不能判断项目是否将再被访问,除非程序作出一些指示表明不会再被访问。

譬如以C语言为例,在stdlib.h中提供了 malloc()、calloc()、free()等函数,在使用malloc()获取存储器空间,则需在不需使用后free()释放,如未释放,则会产生所谓memory leakage。

虽然内存管理器可以恢复不能访问的存储器,但它不可以释放可访问的存储器因为仍有可能需要使用。现代的内存管理器因此为程序设计员提供技术来标示存储器的可用性,以不同级别的“访问性”表示。内存管理器不会把需要访问可能较高的对象释放。当对象直接和一个强引用相关或者间接和一组强引用相关表示该对象访问性较强。(强引用相对于弱引用,是防止对象被回收的一个引用。)要防止此类存储器泄漏,开发者必须使用对象后清理引用,一般都是在不再需要时将引用设成null,如果有可能,把维持强引用的事件侦听器全部注销。

一般来说,自动内存管理对开发者来讲比较方便,因为他们不需要实现释放的动作,或担心清理内存的顺序,而不用考虑对象是否依然被引用。对开发者来说,了解一个引用是否有必要保持比了解一个对象是否被引用要简单得多。但是,自动内存管理不能消除所有的内容泄漏。

影响

如果一个程序存在内存泄漏并且它的内存使用量稳定增长,通常不会有很快的症状。每个物理系统都有一个较大的内存量,如果内存泄漏没有被中止(比如重启造成泄漏的程序)的话,它迟早会造成问题。

大多数的现代计算机操作系统都有存储在RAM芯片中主内存和存储在次级存储设备如硬盘中的虚拟内存,内存分配是动态的——每个进程根据要求获得相应的内存。访问活跃的页面文件被转移到主内存以提高访问速度;反之,访问不活跃的页面文件被转移到次级存储设备。当一个简单的进程消耗大量的内存时,它通常占用越来越多的主内存,使其他程序转到次级存储设备,使系统的运行效率大大降低。甚至在有内存泄漏的程序终止后,其他程序需要相当长的时间才能切换到主内存,恢复原来的运行效率。

当系统所有的内存全部耗完后(包括主内存和虚拟内存,在嵌入式系统中,仅有主内存),所有申请内存的操作将失败。这通常导致程序试图申请内存来终止自己,或造成分段内存访问错误(segmentation fault)。现在有一些专门为修复这种情况而设计的程序,常用的办法是预留一些内存。值得注意的是,第一个遭遇得不到内存问题的程序有时候并不是有内存泄漏的程序。

一些多任务操作系统有特殊的机制来处理内存耗尽得情况,如随机终止一个进程(可能会终止一些正常的进程),或终止耗用内存最大的进程(很有可能是引起内存泄漏的进程)。另一些操作系统则有内存分配限制,这样可以防止任何一个进程耗用完整个系统的内存。这种设计的缺点是有时候某些进程确实需要较大数量的内存时,如一些处理图像,视频和科学计算的进程,操作系统需要重新配置。

如内存泄漏发生在内核,表示操作系统自身发生了问题。那些没有完善的内存管理的计算机,如嵌入式系统,会因为一个长时间的内存泄漏而崩溃。

一些被公众访问的系统,如网络服务器路由器很容易被黑客攻击,加入一段攻击代码,而产生内存泄漏。

其他存储器消耗

值得注意的是,存储器用量持续增加不一定表明存储器泄漏。一些应用程序会存储越来越多资料到存储器中(如用作缓存。如果缓存太大引起问题,这可能是程序设计上的错误,但并非是存储器泄漏因为资料仍被使用。另一方面,程序有可能申请不合理的大量存储器,因为程序设计者假设存储器总是足够运行特定的工作;例如,图像文件处理器会在开始时阅读图像文件的内容并把之存储至存储器中,有时候由于图像文件太大,消耗的存储器超过了可用的内存导致失败。

另一角度讲,内存泄漏是一种特殊的编程错误,如果没有源代码,根据征兆只能猜测可能有内存泄漏。在这种情况下,使用术语“内存消耗持续增加”可能更确切。

例子

C

下面是一个C语言的例子,在函数f()中申请了内存却没有释放,导致内存泄漏。当程序不停地重复调用这个有问题的函数f,申请内存函数malloc()最后会在程序没有更多可用存储器可以申请时产生错误(函数输出为NULL)。但是,由于函数malloc()输出的结果没有加以出错处理,因此程序会不停地尝试申请存储器,并且在系统有新的空闲内存时,被该程序占用。注意,malloc()返回NULL的原因不一定是因为前述的没有更多可用存储器可以申请,也可能是逻辑地址空间耗尽,在Linux环境上测试的时候后者更容易发生。

 #include <stdio.h>
 #include <stdlib.h>

 void f(void)
 {
     void* s;
     s = malloc(50); /* 申请内存空间 */
     return;  /* 内在泄漏 - 参见以下资料 */ 
     /* 
      * s 指向新分配的堆空间。
      * 当此函数返回,离开局部变量s的作用域后将无法得知s的值,
      * 分配的内存空间不能被释放。
      *
      * 如要「修复」这个问题,必须想办法释放分配的堆空间,
      * 也可以用alloca(3)代替malloc(3)。
      * (注意:alloca(3)既不是ANSI函数也不是POSIX函数)
      */
 }
 int main(void)
 {
     /* 该函数是一个死循环函数 */
     while (true) f(); /* Malloc函数迟早会由于内存泄漏而返回NULL*/
     return 0;
 }

C++

以下例子中,存储了整数123的内存空间不能被删除,因为地址丢失了。这些空间已无法再使用。

#include <iostream>
using namespace std;
int main()
{ 
   int *a = new int(123);
   cout << *a << endl;
   // We should write "delete a;" here
   a = new int(456);
   cout << *a << endl;
   delete a;
   return 0;
}

参阅

参考资料

  1. ^ Crockford, Douglas. JScript Memory Leaks. [20 July 2022]. (原始内容存档于7 December 2012). 
  2. ^ Creating a memory leak with Java. Stack Overflow. [2013-06-14]. (原始内容存档于2019-11-29). 
  3. ^ Rudafshani, Masoomeh, and Paul A. S. Ward. "LeakSpot: Detection and Diagnosis of Memory Leaks in JavaScript Applications." Software, practice & experience 47.1 (2017): 97–123. Web.

外部链接