第3章 Python垃圾回收

只愿长相守 提交于 2020-01-26 05:40:26

Python 垃圾回收机制
计数引用, Python 中一切皆对象。因此,你所看到的一切变量,本质上都是对象的一个指针,计数引用就是这个指针。

那么,怎么知道一个对象,是否永远都不能被调用了呢?

就是当这个对象的引用计数(指针数)为 0 的时候,说明这个对象永不可达,自然它也就成为了垃圾,需要被回收。

import os
import psutil

1、显示当前 python 程序占用的内存大小

import os
import psutil

#显示当前 python 程序占用的内存大小
def show_memory_info(hint):
    pid = os.getpid()
    p = psutil.Process(pid)

    info = p.memory_full_info()
    memory = info.uss /1024 /1024
    print('{} memory used:{}MB'.format(hint,memory))

def func():
    show_memory_info('initia')
    #global a 
    #局部变量,但函数调用结束,a会被释放,所占用内存会被释放
    a = [i for i in range(10000000)]
    show_memory_info('after a created')

func()
show_memory_info('finished')

上面程序返回值:
initia memory used:6.3359375MB
after a created memory used:393.734375MB
finished memory used:6.66796875MB
注意:
当用 global关键字 声明a为全局变量时,func函数低啊用结束时,内存不会释放。
当用一个变量接收func函数的 retuen a 时,内存也不会被释放。

2、循环引用

2.1 引用计数

import sys

a = [1,2,3]
b = a
print(sys.getrefcount(a))
print(sys.getrefcount(a))

返回值:3
说明:上面程序,a被引用了3次,print(sys.getrefcount(a)),相同的引用被当做一次处理。
第一次引用:a = [1,2,3]
第二次引用:b = a
第三次引用:print(sys.getrefcount(a))、print(sys.getrefcount(a))

2.2 循环引用

如果有两个对象,它们互相引用,并且不再被别的对象所引用,那么它们应该被垃圾回收吗?

import os
import psutil
import gc
#sys.getrefcount() 引用计数函数
# a = [1,2,3]
# b = a
# print(sys.getrefcount(a))

def show_memory_info(hint):
    pid = os.getpid()
    p = psutil.Process(pid)

    info = p.memory_full_info()
    memory = info.uss /1024 /1024
    print('{} memory used:{}MB'.format(hint,memory))

def func():
    show_memory_info('initial')
    a = [i for i in range(10000000)]
    b = [i for i in range(10000000)]
    show_memory_info('after a, b created')
    a.append(b)
    b.append(a)

func()
gc.collect() #func函数结束后,由于局部变量 a 和 b 互相引用,内存需要通过gc.collect()回收
show_memory_info('finished')

上面程序的内存使用情况如下:
initial memory used:8.4375MB
after a, b created memory used:783.7265625MB
finished memory used:783.7265625MB

2.3调试内存泄漏

虽然有了自动回收机制,但这也不是万能的,难免还是会有漏网之鱼。内存泄漏是我们不想见到的,而且还会严重影响性能。有没有什么好的调试手段呢?

它就是 objgraph,一个非常好用的可视化引用关系的包。在这个包中,我主要推荐两个函数,第一个是 show_refs(),它可以生成清晰的引用关系图。

下面代码在ipython执行,文件会自动保存在一个路径。例如:Graph written to C:\Users\Administrator\AppData\Local\Temp\objgraph-80cerxvn.dot (8 nodes)
Spawning graph viewer (xdot)
import objgraph

a = [1, 2, 3]
b = [4, 5, 6]

a.append(b)
b.append(a)

objgraph.show_refs([a])

在这里插入图片描述
dot转图片网站:https://onlineconvertfree.com/zh/
导入上面生成的文件后,会转换成图片,并提供下载。

总结

垃圾回收是 Python 自带的机制,用于自动释放不会再用到的内存空间;
引用计数是其中最简单的实现,不过切记,这只是充分非必要条件,因为循环引用需要通过不可达判定,来确定是否可以回收;
Python 的自动回收算法包括标记清除和分代收集,主要针对的是循环引用的垃圾收集;
调试内存泄漏方面, objgraph 是很好的可视化分析工具。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!