Ley potencial y visitas Analytics Lane

Publicado el 18 octubre 2019 por Daniel Rodríguez @analyticslane

La ley potencial es una relación entre magnitudes que se puede observar en diferentes fenómenos de carácter físico, biológico o debidos a la actividad humana. Los cuales se caracterizan por tener distribuciones sesgadas de los valores en los que un pequeño número de registros tienen valores más elevados. Además de tener invariancia de escala. Algunos fenómenos que siguen esta ley son las erupciones volcánicas, el tamaño de las poblaciones o la popularidad de los apellidos en una población.

Otro aspecto en el que se espera que se cumpla la ley potencial es el número de visitas a una web. Por lo que es una buena idea probarlo con las visitas a Analytics Lane. Comprobado de esta manera si se el número de visitas cumplen esta ley o no.

La ley potencial

En muchos fenómenos se puede relacionar dos magnitudes mediante la ley potencial. Una ley que se puede expresar como

donde x e y es una magnitud son las magnitudes que relacionar y a y k son los constantes. Una relación simple que tiene múltiples e interesantes características. Siendo una de las principales características la invariancia de escala. Esto es, si se multiplica una magnitud por una constante la ley también se multiplica por una constante.

Representación de la ley potencial

Las magnitudes de los fenómenos que siguen la ley potencial se pueden represar en una línea recta cuando ambas escalas son logarítmicas. Lo que se puede comprobar simplemente aplicando el logaritmo en ambas partes de la ecuación.

\log(y) = \log(a) + k \log(x).

Lo que es una recta con pendiente k y altura el origen \log(a).

Aplicación a las visitas a Analytics Lane

Para verificar la ley potencial hemos consultado el numero de visitas a las diferentes páginas de Analytics Lane durante los últimos tres meses y ordenadas estas de menor a mayor. Estos datos se guardan en un archivo Excel. Para comprobar si se verifica la ley se importan los datos del archivo Excel en Python con pandas. Posteriormente se calcula el logaritmo de las visitas y frecuencias para representar con seaborn. Utilizándose la función lmplot() que también implemente la regresión lineal.

import numpy as np
import pandas as pd
import seaborn as sns

visits = pd.read_excel('power.xlsx')
visits = np.log(visits)

sns.lmplot(x='visitas', y='frecuencia', data=visits)

Al ejecutar este código se obtiene la siguiente figura.

Relación entre visitas número de visitar y frecuencia

En esta se puede ver que las visitas a Analytics Lane no siguen estrictamente la ley potencial. Pero se ajustan bastante. El R^2 del modelo es 0,72.

Conclusiones

En esta entrada se ha comprobado cómo las visitas a Analytics Lane no se ajustan estrictamente a la ley potencial.

No te olvides valorar esta entrada