Diferencia entre a=a+b y a+=b en Python

Publicado el 28 noviembre 2022 por Daniel Rodríguez @analyticslane

El operador de asignación y suma (+=) se puede usar en Python para sumar el valor de un variable a la de otra o concatenar tanto cadenas de texto como listas. El resultado es el mismo que se obtendría realizando la operación y asignando el resultado a la primera variable. Aparentemente no es más que azúcar sintáctico (syntactic sugar). Pero no es así, existen unas pequeñas diferencias en cuanto al uso de la memoria cuando se utiliza a=a+b y a+=b en Python, especialmente al trabajar con listas. Diferencias que también afectan al operador de asignación y multiplicación (*=).

Concatenar dos listas con a=a+b y a+=b en Python

Ejecutar tanto la instrucción a=a+b como a+=b en Python produce el mismo resultado; suma o concatena los valores de a y b, dependiendo del tipo de dato, y asigna el resultado a a. Pero cuando se trabaja con listas existe una pequeña diferencia. La instrucción a=a+b realiza la operación y crea un nuevo objeto que asigna a la variable a. Pero, en el caso de la operación a+=b lo que se hace es modificar la lista original agregando los elementos de la segunda lista. Esto se puede comprobar fácilmente usando la función id() que devuelve el identificador de un objeto.

Si la concatenación de las listas se realiza mediante la instrucción a=a+b, el identificador del primer objeto cambia, pero no el del segundo.

list1 = [1, 2, 3]
list2 = [4, 5, 6]
print(id(list1), id(list2))

list1 = list1 + list2
print(id(list1), id(list2))
4401730624 4401730880
4401732544 4401730880

Por otro lado, si la concatenación se hace mediante el operador a+=b el identificador del primer objeto no cambia.

list1 = [1, 2, 3]
list2 = [4, 5, 6]
print(id(list1), id(list2))

list1 += list2
print(id(list1), id(list2))
4401731776 4401640896
4401731776 4401640896

Esto es, realmente a+=b funciona como el método append de las listas.

list1 = [1, 2, 3]
list2 = [4, 5, 6]
print(id(list1), id(list2))

list1.append(list2)
print(id(list1), id(list2))
4399020928 4401737856
4399020928 4401737856

Consecuencia del diferente funcionamiento

Aparentemente la diferencia entre los dos operadores no es más que una curiosidad, pero no es así, usar el operador de asignación y suma en lugar de la suma para concatenar dos listas es más rápido y requiere menos memoria. Debido a que la primera operación es más sencilla. Usar a+=b no requiere crear una nueva lista y liberar de memoria la anterior, solamente concatenar los datos. Algo que se puede comprobar fácilmente con timeit. En primer lugar se puede medir el tiempo necesario para obtener el resultado con el operador suma.

import timeit
    
timeit.timeit("""list1 = [1, 2, 3]
list2 = [4, 5, 6]
list1 = list1 + list2""", number=100000000)
8.567127583000001

Repitiendo el ejercicio para el operador de asignación y suma

timeit.timeit("""list1 = [1, 2, 3]
list2 = [4, 5, 6]
list1 += list2""", number=100000000)
7.644791791999978

En este caso, donde se ha repetido la concatenación 100 millones de veces, el tiempo de ejecución ha bajado de 8,6 a 7,6 segundos. Lo que supone una mejora de en torno al 12%.

Sumar dos números con a=a+b y a+=b en Python

Lo visto hasta ahora no afecta a la suma de enteros y reales ni a la concatenación de cadenas de texto. Esto es así porque para estos tipos de datos el id del dato cambia siempre, por lo que existe la diferencia.

Conclusiones

En esta ocasión se ha visto que no es lo mismo realizar la operación a=a+b o a+=b en Python cuando se trabaja con listas. El primer caso es más lento dado que se tiene que crear una nueva lista y asignar está a la variable. Para el segundo caso no se crea una nueva lista, sino que se concatena la primera con la segunda. Por los que es más eficiente usar el operador de asignación y suma cuando se trabaja con listas. Si se trabaja con números o cadenas de texto esto no es así debido a la naturaleza de los tipos de datos.

Image by Ulrike Leone from Pixabay