Truco: identificar filas o columnas únicas en numpy

Publicado el 10 febrero 2020 por Daniel Rodríguez @analyticslane

Numpy ofrece la función np.unique() para identificar los elementos únicos dentro de un array. Una función que es muy útil. Pero lo que mucha gente no sabe es que se puede utilizar no solo para identificar los elementos únicos dentro de un array, sino que también para identificar filas o columnas únicas en los objetos bidimensionales.

Para identificar las filas o columnas únicas mediante la función np.unique() se tiene que utilizar el parámetro axis. Con el que se le indica el eje de los objetos bidimensionales en los que debe buscar los elementos únicos. Así para identificar las filas únicas de un array se debería escribir

np.unique(data, axis=1)

Mientas que para obtener las columnas se debería de escribir

np.unique(data, axis=0)

Lo que se muestra en el siguiente código.

import numpy as np

data = np.array([[1, 2],[2, 2], [1, 2], [1, 1], [1, 2]])

np.unique(data, axis=0)

array([[1, 1],
       [1, 2],
       [2, 2]])

Obteniendo en el ejemplo como resultado solamente las tres filas que son únicas de las cinco originales. Siendo este una función que puede resultar bastante útil a la hora de realizar múltiples análisis.

Imagen de Theodor Moise en Pixabay