NumPy: Comprobar todos los valores de una matriz de NumPy

Publicado el 31 mayo 2021 por Daniel Rodríguez @analyticslane

Una de las grandes ventajas de las matrices de NumPy es la posibilidad de realizar operaciones lógicas sobre ellas, como puede ser el caso de igualdades o comparaciones. El resultado de estas operaciones es una nueva matriz de valores lógicos donde se muestra el resultado de aplicar la operación sobre cada uno de los elementos. Algo con lo que es posible paralelizar análisis de datos, permitiendo comprobar todos los valores de una matriz de NumPy mediante una única operación. Lo que se puede combinar con las funciones np.all() y np.any() para comprobar si todos los elementos cumplen la condición. Algo que puede ser de gran utilidad como se muestra en los siguientes ejemplos.

Comprobar que todos los elementos de una matriz de NumPy son cero

Supongamos que tenemos una matriz con miles o decenas de miles de elementos. En el caso de querer comprobar si todos los valores son iguales o no a cero se puede hacer simplemente comparando la matriz de NumPy a cero. Obteniendo un vector con los mismos elementos de valores lógicos. Algo similar a lo que se muestra en el siguiente ejemplo.

In[1]:  import numpy as np

        arr = np.array([0, 0, 0])
        arr == 0

Out[1]: array([ True,  True,  True])

Ahora, si queremos saber si todos los elementos son iguales o no a cero únicamente tenemos que revisar el vector. Algo que es fácil en el ejemplo, pero no en un caso con miles de elementos. Para solucionar esto existe la función np.all() la cual nos devuelve verdadero en el caso de que todos los elementos sean verdadero y falso el el resto de los casos. Con la que fácilmente se puede saber si todos los elementos cumplen o no la condición.

In[2]:  np.all(arr == 0)

Out[2]: True

Comprobar si algún elemento es diferente de cero en una matriz de NumPy

En el ejemplo anterior se ha obtenido verdadero porque todos los elementos son iguales a cero, en el caso de que no lo fuese se obtendría un valor igual a falso. Otra forma de obtener este resultado es comprobar si hay algún valor diferente de cero. Lo que se puede conseguir mediante el uso de la función np.any() una función que devuelve verdadero si al menos un elemento de la matriz es verdadero y falso en cualquier otro caso. Así se puede comprobar que para el ejemplo anterior no existe ningún valor distinto de cero.

In[3]:  np.all(arr != 0)

Out[3]: False

Otra cosa es que se cambie el contenido del vector por uno como el siguiente.

In[4]:  arr = np.array([0, 0, 0, 1, 0, 1])
		arr != 0

Out[4]: array([False, False, False,  True,

Con lo cual se obtendría una respuesta afirmativa a la pregunta de si existe un valor distinto de cero.

In[5]:  np.any(arr != 0)

Out[5]: True

Comprobar cuántos valores son diferentes de cero en una matriz de NumPy

Una vez que sabemos que existe, por lo menos, un elemento distinto de cero en la matriz una pregunta que puede surgir es cuántos son. Para ello se puede usar la función np.sum() ya que al sumar sobre datos booleanos el valor verdadero es un uno y los valores falsos son cero. Así se puede saber rápidamente la cantidad de valores que cumplen la condición de ser distintos de cero.

In[6]:  np.sum(arr != 0)

Out[6]: 2

Obtener el número de valores que sean mayores que un valor en una matriz de NumPy

Lo que se ha visto en las secciones anteriores se puede aplicar también sobre cualquier otra operación lógica. Se puede comprobar si los valores de una matriz son mayores, menores, iguales o cualquier combinación que se nos pueda ocurrir. Así para saber cuántos elementos son mayores que tres solamente se tiene que hacer algo como lo que se muestra a continuación.

In[7]:  arr = np.array([1, 2, 3, 4, 5])
		np.sum(arr > 3)

Out[7]: 2

Combinar varias condiciones

Otra necesidad con la que nos podemos encontrar es con la necesidad de validar dos condiciones, por ejemplo, comprobar los elementos que son mayores de un valor y menor de otro. Para lo que es necesario usar alguna función como puede ser np.logical_and().

In[8]:  np.logical_and(arr > 1, arr < 5)

Out[8]: array([False,  True,  True,  True, False])

Alternativamente también se puede usar el operador & como una versión corta del anterior.

In[9]:  (arr > 1) & (arr < 5)

Out[9]: array([False,  True,  True,  True, False])

Lo que se puede combinar fácilmente como las funciones vistas anteriormente como es el caso de np.sum().

In[10]:  np.sum((arr > 1) & (arr < 5))

Out[10]: 3

Comprobar valores sobre matrices 2D de NumPy

Una vez llegado a este punto nos podemos plantear si los métodos vistos pueden trabajar sobre matrices 2D. La respuesta es que funcionan exactamente igual. Por ejemplo, la función np.all() devuelve verdadero si todos los elementos de la matriz 2D cumplen la condición.

In[11]:  arr = np.array([[0, 0, 0], [0 ,1, 0], [1, 0, 1]])
         arr == 0

Out[11]: array([[ True,  True,  True],
                [ True, False,  True],
                [False,  True, False]])

In[12]:  np.all(arr == 0)

Out[12]: False

Aunque en este caso se puede llevar a cabo también un análisis por fila o columna, indicando para ello la propiedad axis. Pudiendo saber de este modo si todos los elementos de una columna (el eje 0 de la matriz) son cero

In[13]:  np.all(arr == 0, axis=0)

Out[13]: array([False, False, False])

En este caso en ninguna de las columnas los valores son todos igual a cero, pero esto sí que sucede en la primera columna. Lo que se puede validar mediante el uso de la siguiente expresión.

In[14]:  np.all(arr == 0, axis=1)

Out[14]: array([True, False, False])

Algo que funciona exactamente igual para la función suma, con la que se puede comprobar cuántos valores son cero en toda la matriz.

In[15]:  np.sum(arr == 0)

Out[15]: 6

O en cada una de las filas.

In[16]:  np.sum(arr == 0, 1)

Out[16]: array([3, 2, 1])

Conclusiones

En esta ocasión hemos visto cómo se pueden utilizar las funciones np.all(), np.any() y np.sum() para comprobar todos los valores de una matriz de NumPy de una forma fácil y sencilla. La primera de las funciones, np.all(), nos ayuda a comprobar si todas los valores cumplen una condición. Mientras que la segunda, np.any(), comprueba si alguna cumple la condición. Finalmente, el uso de np.sum() nos permite saber cuántas veces se cumple la condición.

Imagen de bettinabef en Pixabay