NumPy: La función reshape de NumPy con ejemplos

Publicado el 05 abril 2021 por Daniel Rodríguez @analyticslane

El método que podemos usar en NumPy para redimensionar los vectores es la función reshape. Una función que es clave conocer para trabajar de forma eficaz con NumPy. Veamos a continuación como se puede usar la función reshape de NumPy a través de diferentes ejemplos.

La función reshape de NumPy

En la documentación de NumPy se pude ver que la función reshape tiene la siguiente forma

np.reshape(a, newshape, order='C')

donde

  • a: el vector de NumPy que se desea redimensionar.
  • newshape: una tupla, en el caso de que se desee convertir en un vector 23 o 30, o un valor entero, cuando el vector de destino 1D.
  • order: un valor opción en el que se indica el orden de llenado de los vectores. Los valores disponibles para esta propiedad son:
    * C: lee y escribe los elementos del vector por filas, estilo como en C.
    * F: lee y escribe los elementos del vector por columnas, estilo como en FORTRAN
    * A: lee y escribe los elementos del vector según el orden que tengan esos en memoria.

El nuevo tamaño tiene que ser compatible con el original

Un punto importante es que el nuevo tamaño que se le indique a la función reshape tiene que ser compatible con el original. Esto es, si en el vector original hay 10 elementos, tiene que haber necesariamente 10 en el de nuevo. Si no es así se producirá un error. Esto es así porque reshape no permite omitir elementos del vector original ni dejar elementos sin valor en el de destino.

Uso básico de reshape en NumPy

En el caso de que tengamos un vector en memoria se puede usar reshape para crear un vector 2D con los mismos datos. Para ello solamente se tiene que llamar a la función y pasar el vector original y una tupla con las nuevas dimensiones como parámetro. Así para convertir un vector en un objeto 2D se puede usar

import numpy as np

arr = np.arange(12)

np.reshape(arr, (2, 6))
array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11]])

Con lo que se ha convertido una vector en una matriz de 6 por dos. Otra alternativa sería crear una matriz de 2 por seis, lo que se puede conseguir mediante

np.reshape(arr, (6, 2))
array([[ 0,  1],
       [ 2,  3],
       [ 4,  5],
       [ 6,  7],
       [ 8,  9],
       [10, 11]])

En el caso de que queramos crear un objeto 3D, simplemente es necesario pasar una tupla de tres elementos.

np.reshape(arr, (2, 2, 3))
array([[[ 0,  1,  2],
        [ 3,  4,  5]],

       [[ 6,  7,  8],
        [ 9, 10, 11]]])

Convertir matrices 2D o 3D en vectores

Para convertir una matriz tanto de 2D como 3D en un vector se ha de indicar un escalar con el número de elementos. Aunque, en estos casos, es más cómodo utilizar -1, ya que convertirá la matriz en un vector sin necesidad de conocer su tamaño. Lo que evita posibles errores. Esto es, una matriz 3D se puede transformar en una vector con las dos líneas que se muestra a continuación.

arr3d = np.reshape(arr, (2, 2, 3))

np.reshape(arr3d, 12)

np.reshape(arr3d, -1)
array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

Tipos de llenado de los vectores

Como ya se ha explicado al principio existen tres tipos de llenado para los vectores. Por filas, al estilo C

arr3d = np.arange(9)

np.reshape(arr3d, (3,3), order='C')
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])

Por columnas, al estilo FORTRAN

np.reshape(arr3d, (3,3), order='F')
array([[0, 3, 6],
       [1, 4, 7],
       [2, 5, 8]])

Y en base a la posición en memoria.

np.reshape(arr3d, (3,3), order='A')
array([[0, 3, 6],
       [1, 4, 7],
       [2, 5, 8]])

En estos ejemplos no se puede hacer una diferencia entre el tipo C en base a la posición en memoria. Pero sí que es posible observar esto cuando se realiza una transformación, por ejemplo, una transposición de la matriz.

arr = np.arange(9)
arr2d = np.reshape(arr, (3,3), order='C').T
arr2d
array([[0, 3, 6],
       [1, 4, 7],
       [2, 5, 8]])

En este caso el método C leerá los datos por filas

np.reshape(arr2d, 9, order='C')
array([0, 3, 6, 1, 4, 7, 2, 5, 8])

Mientras que el método A recuperará los datos tal como están ubicados en memoria.

np.reshape(arr2d, -1, order='A')
array([0, 1, 2, 3, 4, 5, 6, 7, 8])

Los resultados de reshape son vistas

Es importante tener en cuenta que siempre que es posible reshape devuelve una vista del objeto original. No un nuevo objeto con los valores. Por lo que, en caso de modificar los valores en la vista, también se modificarán en el objeto original y viceversa. Efecto que se puede observar en el siguiente ejemplo.

arr = np.arange(4)
arr2d = np.reshape(arr, (2,2))

arr2d[1][1] = 9

print(arr)
print(arr2d)
[0 1 2 9]
[[0 1]
 [2 9]]

En el caso de que queramos modificar uno de los dos objetos sin afectar al otro es necesario hacer una copia del resultado. Así se podrán modificar el contenido de los vectores sin riesgo de modificaciones accidentales.

arr = np.arange(4)
arr2d = np.reshape(arr, (2,2)).copy()

arr2d[1][1] = 9

print(arr)
print(arr2d)
[0 1 2 3]
[[0 1]
 [2 9]]

Accediendo al objeto base

En la vista se puede acceder al objeto original, usando para ellos la propiedad base. Propiedad que en caso de ser nula indicará que el objeto no es una vista, por ejemplo es una copia de una vista.

arr = np.arange(4)
arr2d = np.reshape(arr, (2,2))
copy2D = arr2d.copy()

print(arr2d.base)
print(copy2D.base)
[0 1 2 3]
None

Conclusiones

En esta entrada hemos comprobado las propiedades de la función reshape de NumPy. Una función que es clave a la hora de trabajar con vectores de NumPy, ya que es la que se utiliza para redimensionar estos. Viendo además que en esta función existen dos puntos claves: el número de elementos del vector redimensionado tiene que ser compatible con el original y los resultados son una vista del vector original. Siendo necesario tenerlos en cuenta para evitar problemas.