python的内存管理机制

落爺英雄遲暮 提交于 2020-01-17 23:54:50

一、python是一个什么样类型的语言

  1、python是一种动态解释性强类型定义的高级、通用性编程语言。

    解释型:执行的时候,才一条一条的解释成机器语言给计算机来执行。如:python、js、ruby、PHP等

    编译型:把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机可以直接以机器语言来运行此程序,速度快。如:C、C++、go等

    动态语言:动态类型的语言编程时,永远也不用给任何变量指定数据类型,该语言会在你第一次赋值给变量时,在内部将数据类型记录下来

    静态语言:与动态类型语言刚好相反,它的数据类型是在编译其间检查的,也就是说在写程序时要声明所有变量的数据类型

    强类型定义语言:一旦一个变量被指定了某个数据类型,如果不经过强制转换,那么它就永远是这个数据类型

    弱类型定义语言:数据类型可以被忽略的语言。它与强类型定义语言相反, 一个变量可以赋不同数据类型的值

二、python的内存管理机制

   python的内存管理机制:引用计数、垃圾回收、内存池机制

  1、变量与对象

    

    

    1、变量:通过变量指针引用对象

 

        变量指针:指向具体对象的内存空间,取对象的值。

 

    2、对象,类型已知,每个对象都包含一个头部信息(头部信息:类型标识符和引用计数器)

 

        注意:变量名没有类型,类型属于对象(因为变量引用对象,所以类型随对象),变量引用什么类型的对象,变量就是什么类型的。

       a、容器对象

          Python的一个容器对象(比如:表、词典等),可以包含多个对象。

            

 

          容器对象:容器对象中包含的并不是元素对象本身,是指向各个元素对象的引用。         

            1、Python缓存了整数和短字符串,因此每个对象在内存中只存有一份,引用所指对象就是相同的,即使使用赋值语句,也只是创造新的引用,而不是对象本身;

            2、Python没有缓存长字符串、列表及其他对象,可以有多个相同的对象,可以使用赋值语句创建出新的对象。

  2、引用计数

   a、普通引用

    

    注意:当使用某个引用作为参数,传递给getrefcount()时,参数实际上创建了一个临时的引用。因此,getrefcount()所得到的结果,会比期望的多1。

    b、容器对象

      

    c、引用计数增加

       1、对象被创建

          2、另外的别人被创建

      3、作为容器对象的一个元素

    d、引用计数减少

      1、对象的别名被显式的销毁

      2、对象的一个别名被赋值给其他对象

      3、对象从一个窗口对象中移除,或,窗口对象本身被销毁

      4、一个本地引用离开了它的作用域,比如上面的foo(x)函数结束时,x指向的对象引用减1。

   3、垃圾回收     

      吃太多,总会变胖,Python也是这样。当Python中的对象越来越多,它们将占据越来越大的内存。不过你

    不用太担心Python的体形,它会乖巧的在适当的时候“减肥”,启动垃圾回收(garbage collection),将没用的

    对象清除。在许多语言中都有垃圾回收机制,比如Java和Ruby。尽管最终目的都是塑造苗条的提醒,但不同

    语言的减肥方案有很大的差异 (这一点可以对比本文和Java内存管理与垃圾回收)。

    从基本原理上,当Python的某个对象的引用计数降为0时,说明没有任何引用指向该对象,该对象就成为要被

    回收的垃圾了。比如某个新建对象,它被分配给某个引用,对象的引用计数变为1。如果引用被删除,对象的引

    用计数为0,那么该对象就可以被垃圾回收。比如下面的表:

    1.   a = [1, 2, 3]
    2. del a

    del a后,已经没有任何引用指向之前建立的[1, 2, 3]这个表。用户不可能通过任何方式接触或者动用这个对象。

    这个对象如果继续待在内存里,就成了不健康的脂肪。当垃圾回收启动时,Python扫描到这个引用计数为0的对象,

    就将它所占据的内存清空。

    然而,减肥是个昂贵而费力的事情。垃圾回收时,Python不能进行其它的任务。频繁的垃圾回收将大大降低Python的

    工作效率。如果内存中的对象不多,就没有必要总启动垃圾回收。所以,Python只会在特定条件下,自动启动垃圾回收。

    当Python运行时,会记录其中分配对象(object allocation)和取消分配对象(object deallocation)的次数。当两者的差值高于

    某个阈值时,垃圾回收才会启动。

    我们可以通过gc模块的get_threshold()方法,查看该阈值:

    1.   import gc
    2.   print(gc.get_threshold())

    返回(700, 10, 10),后面的两个10是与分代回收相关的阈值,后面可以看到。700即是垃圾回收启动的阈值。可以

    通过gc中的set_threshold()方法重新设置。

    我们也可以手动启动垃圾回收,即使用gc.collect()。

    分代回收

      Python同时采用了分代(generation)回收的策略。这一策略的基本假设是,存活时间越久的对象,越不可能在

    后面的程序中变成垃圾。我们的程序往往会产生大量的对象,许多对象很快产生和消失,但也有一些对象长期被使用。

    出于信任和效率,对于这样一些“长寿”对象,我们相信它们的用处,所以减少在垃圾回收中扫描它们的频率。

 

    Python将所有的对象分为0,1,2三代。所有的新建对象都是0代对象。当某一代对象经历过垃圾回收,依然存活,那么它就

    被归入下一代对象。垃圾回收启动时,一定会扫描所有的0代对象。如果0代经过一定次数垃圾回收,那么就启动对0代和1代的

    扫描清理。当1代也经历了一定次数的垃圾回收后,那么会启动对0,1,2,即对所有对象进行扫描。

    这两个次数即上面get_threshold()返回的(700, 10, 10)返回的两个10。也就是说,每10次0代垃圾回收,会配合1次1代的垃圾

    回收;而每10次1代的垃圾回收,才会有1次的2代垃圾回收。

    同样可以用set_threshold()来调整,比如对2代对象进行更频繁的扫描。

    1.   import gc
    2.   gc.set_threshold(700, 10, 5)

   

    4、内存池机制

      Python中有分为大内存和小内存:(256K为界限分大小内存)

    1、大内存使用malloc进行分配

    2、小内存使用内存池进行分配

    3、Python的内存池(金字塔)

      第3层:最上层,用户对Python对象的直接操作

      第1层和第2层:内存池,有Python的接口函数PyMem_Malloc实现-----若请求分配的内存在1~256字节之间就

      使用内存池管理系统进行分配,调用malloc函数分配内存,但是每次只会分配一块大小为256K的大块内存,不会

      调用free函数释放内存,将该内存块留在内存池中以便下次使用。

      第0层:大内存-----若请求分配的内存大于256K,malloc函数分配内存,free函数释放内存。

      第-1,-2层:操作系统进行操作

      

    内容来自:

     @https://www.cnblogs.com/geaozhang/p/7111961.html

     @https://www.cnblogs.com/yhll/p/8908882.html

    

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!