Matrices dispersas en Matlab

Publicado el 25 octubre 2019 por Daniel Rodríguez @analyticslane

En una entrada reciente se ha escrito acerca de las matrices dispersas ("sparse matrix") en las que la mayoría de los elementos son cero. Guardar estas matrices en memoria como si fuesen matrices densas, donde la mayoría de los elementos son distintos de cero, no es eficiente. Para ello Matlab dispone de diferentes funciones que permiten convertir matrices densas en dispersas y el paso contrario. Si trabajamos con matrices dispersas en Matlab es necesario conocer cómo funcionan las funciones sparse() y full() que se explicarán a continuación.

Convertir una matriz en dispersas

En el caso de que se tenga una matriz dispersa en Matlab se puede almacenar esta de una forma más eficiente utilizando la función sparse(). Al llamar a esta función con una matriz se obtendrá un objeto en el que solamente se guardan los valores diferentes de cero. Por ejemplo, se pueden comparar la representación de una matriz diagonal almacenada en un formato u otro.

M = eye(3)
S = sparse(M)
M =

     1     0     0
     0     1     0
     0     0     1


S =

   (1,1)        1
   (2,2)        1
   (3,3)        1

Como se puede ver en ejemplo en el segundo caso solamente se almacenan los valores diferentes de cero. Si se desea recuperar la matriz original se puede utilizar la función full().

full(S)
ans =

     1     0     0
     0     1     0
     0     0     1

Trabajar con matrices dispersas en Matlab

A la hora de trabajar con matrices dispersas no existe ninguna diferencia respeto a usarlas normales. Siendo válido el mismo código en ambos casos, ya que Matlab las trata exactamente igual. Por ejemplo, se puede ver cómo multiplicar una matriz normal por una dispersa es igual que hacer con una normal

M = randi(20, 2, 2);
I = [0, 1; 0, 0];
S = sparse(I);

M * S
M * I
ans =

     0    17
     0    14


ans =

     0    17
     0    14

Como se puede ver en el ejemplo en ambos casos se ha utilizado el mismo código y obtenido el mismo resultado.

Ahorro de memoria en las matrices dispersas

Utilizando la función whos se puede el espacio que ocupa cada una de las variables. Así es posible conocer el ahorro que suponer guardar la matriz en un formato u otro.

  Name      Size            Bytes  Class     Attributes

  M         3x3                72  double              
  S         3x3                80  double    sparse

En el ejemplo se puede ver que la matriz original ocupa 72 bytes, mientras que guarda como dispersa 80. En este caso no se obtiene ahorro, de hecho, la matriz guardada como dispersa ocupa más, porque la matriz solamente es de 3×3. En caso de que se aumente el tamaño de la matriz la matriz dispersa comenzará a ocupar menos memoria. Por ejemplo, en una matriz de 100×100 la original ocupará 80000 bytes, mientras que al guardarlo como dispersa solamente 2408, solamente un 3% de la original.

  Name        Size             Bytes  Class     Attributes

  M         100x100            80000  double              
  S         100x100             2408  double    sparse

Una forma más clara de ver esto es representar en una gráfica el tamaño relativo de la matriz en formato disperso respecto a la normal. Esto es lo que se muestra en la siguiente figura. En donde se puede apreciar que, para una matriz con el grado de dispersión utilizado, el ahorro es considerable de una dimensión 50. Si el grado de dispersión es mayor el ahorro se obtendrá antes.

Comparación de la memoria necesaria para almacenar una matriz diagonal en formato disperso frente a denso en función de las dimensiones.

Conclusiones

En esta entrada se ha visto cómo trabajar con matrices dispersas en Matlab, observado que su uso es completamente transparente. Además, se ha comparado el tamaño que ocupan ambos objetos en memoria y como son más eficaces las dispersas a medida que aumentan las dimensiones.

Imágenes: Pixabay (Free-Photos)

No te olvides valorar esta entrada