python可变对象与不可变对象

Apr 25, 2024
2 views
Python

概念

可变对象与不可变对象的区别在于对象本身是否可变。

python内置的一些类型中

  • 可变对象:list dict set
  • 不可变对象:tuple string int float bool 举一个例子
# 可变对象
>>> a = [1, 2, 3]
>>> a[1] = 4
>>> a
[1, 4, 3]
# 不可变对象
>>> b = (1, 2, 3)
>>> b[1] = 4
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: 'tuple' object does not support item assignment

上面例子很直观地展现了,可变对象是可以直接被改变的,而不可变对象则不可以

地址问题

下面我们来看一下可变对象的内存地址变化

>>> a = [1, 2, 3]
>>> id(a)
2139167175368
>>> a[1] = 4
>>> id(a)
2139167175368

我们可以看到,可变对象变化后,地址是没有改变的

如果两个变量同时指向一个地址

1.可变对象

>>> a = [1, 2, 3]
>>> id(a)
2139167246856
>>> b = a
>>> id(b)
2139167246856
>>> a[1] = 4
>>> a
[1, 4, 3]
>>> b
[1, 4, 3]
>>> id(a)
2139167246856
>>> id(b)
2139167246856

我们可以看到,改变ab也跟着变,因为他们始终指向同一个地址

2.不可变对象

>>> a = (1, 2, 3)
>>> id(a)
2139167074776
>>> b = a
>>> a = (4, 5, 6)
>>> a
(4, 5, 6)
>>> b
(1, 2, 3)
>>> id(a)
2139167075928
>>> id(b)
2139167074776

我们可以看到,a改变后,它的地址也发生了变化,而b则维持原来的地址,原来地址中的内容也没有发生变化

作为函数参数

1.可变对象

**>>>** **def** **myfunc**(l):
**...**     l**.**append(1)
**...**     print(l)
**...****>>>** l **=** [1, 2, 3]
**>>>** myfunc(l)
[1, 2, 3, 1]
**>>>** l
[1, 2, 3, 1]

我们可以看到,可变对象作为参数传入时,在函数中对其本身进行修改,是会影响到全局中的这个变量值的,因为函数直接对该地址的值进行了修改。

2.不可变对象

**>>>** **def** **myfunc**(a):
**...**     a **+=** 1
**...**     print(a)
**...****>>>** a **=** 2
**>>>** myfunc(a)
3
**>>>** a
2

对于不可变对象来说,虽然函数中的a值变了,但是全局中的a值没变,因为函数中的a值已经对应了另外一个地址,而全局中的a值指向的原来地址的值是没有变的。

3.总结

python中向函数传递参数只能是引用传递,表示把它的地址都传进去了,这才会带来上面的现象。

有的编程语言允许值传递,即只是把值传进去,在里面另外找一个地址来放,这样就不会影响全局中的变量。

可变参数在类中使用

我们直接来看下面这个例子

**class** **Myclass**:
    **def** **__init__**(self, a):
        self**.**a **=** a
    **def** **printa**(self):
        print(self**.**a)

运行如下

**>>>** aa **=** [1,2]
**>>>** my **=** Myclass(aa)
**>>>** my**.**printa()
[1, 2]
**>>>** aa**.**append(3)
**>>>** my**.**printa()
[1, 2, 3]

我们可以看到,类中的变量和全局变量地址依然是共用的,无论在哪里修改都会影响对方。

其实这个特性也不能说是一个弊端,利用这一点可以进行一些很方便的操作,比如两个线程同时操作一个队列,我们不用设置一个global队列,只要将队列这个可变对象传入类之中,修改就会自动同步。

下面这个生产者消费者例子就是这样

**import** time
**import** threading
**import** random
**from** queue **import** Queue

**class** **Producer**(threading**.**Thread):

    **def** **__init__**(self, queue):
        threading**.**Thread**.**__init__(self)
        self**.**queue **=** queue

    **def** **run**(self):
        **while** **True**:
            random_integer **=** random**.**randint(0, 100)
            self**.**queue**.**put(random_integer)
            print('add {}'**.**format(random_integer))
            time**.**sleep(random**.**random())


**class** **Consumer**(threading**.**Thread):

    **def** **__init__**(self, queue):
        threading**.**Thread**.**__init__(self)
        self**.**queue **=** queue

    **def** **run**(self):
        **while** **True**:
            get_integer **=** self**.**queue**.**get()
            print('lose {}'**.**format(get_integer))
            time**.**sleep(random**.**random())


**def** **main**():
    queue **=** Queue()
    th1 **=** Producer(queue)
    th2 **=** Consumer(queue)
    th1**.**start()
    th2**.**start()

**if** __name__ **==** '__main__':
    main()

queue传入两个类中,在两个类中随意更改,自动在两个类间同步。

函数默认参数

函数默认参数一定要设定为不可变参数,否则会引发一些错误,我们来看下面一个例子

**>>>** **def** **myfunc**(l**=**[]):
**...**     l**.**append('add')
**...**     print(l)
**...****>>>** myfunc([1, 2, 3])
[1, 2, 3, 'add']
**>>>** myfunc(['a', 'b'])
['a', 'b', 'add']

上面代码是正常运行的,我们来看下面这些

**>>>** myfunc()
['add']
**>>>** myfunc()
['add', 'add']
**>>>** myfunc()
['add', 'add', 'add']

按理说应该每次都是['add'],但是现在出现了意想不到的错误。

这是因为l = []是在函数定义时就确定下来的了,所以之后每次调用这个函数,使用的l都是同一个,如果不指定这个参数的新值,就会出现上面这个问题。

上面这个l可以默认设置为None,这就是一个不可变对象。

两种类在实现上的差异

对于list tuple这些类来说,它们的元素都相当于类的属性,修改元素相当于修改类的属性。

正常定义一个类它的属性是可以正常访问和修改的,所以那些类的实例都是可变对象。

我们只要定义一个类,不允许它修改属性,就可以创建一个不可变对象。

这就要使用python的魔法方法,主要有两种方法

  • 设置__setattr__直接抛出异常,即只要想设置属性值,就会抛出异常
  • 设置__slot__限制属性的访问,如果属性都不能访问了,那就肯定不能修改