Disección de Google Penguin 2.1

Por Mikigarcia25

La disección del algoritmo de Google Penguin ha sido una pasión para muchos profesionales de SEO desde el primer momento que se hablo de la actualización. El año pasado, en el Reino Unido MathSight utilizó ingeniería inversa para identificar cuáles son los factores utilizados por Penguin 2.0. Recientemente, MathSight reveló más pistas acerca de lo que este algoritmo en particular realiza.

Antes del Pingüino 2.1, Andreas Voniatis, director gerente de MathSight, dijo que es importante pensar más allá de la creación de vínculos cuando se trataba de comprender la raiz de la causa de esta actualización.

Pero eso fue para 2.0, ¿Y qué ocurre con la actualización del pingüino 2,1?

Según algunos datos que MathSight mostró sobre diferentes sitios web, que ganaron y perdieron tráfico con Google Penguin 2.1, estas webs contenían varias características:

  • Una mayor (bueno) o menor (malo) proporción de palabras raras en el cuerpo del texto.
  • Un número más alto (bueno) o bajo (malo) de palabras por frase en el texto del cuerpo.
  • Un número más alto (bueno) o inferior (malo) de sílabas por palabra en el texto del cuerpo.

Los datos de MathSight pueden apoyar diferentes teorías que los profesionales SEO tienen acerca de la vinculación de los sitios de baja calidad, y que el factor “calidad” se ve obstaculizado en el contenido.

“La legibilidad de los contenidos de una página web es muy influyente sobre cómo ve Google Penguin el sitio, es decir, como el sitio está vinculado a otros sitios web. Se deberían eliminar enlaces de sitios que no cumplan con los límites de la legibilidad demandas por la actualización”, dijo .

Entonces, ¿cómo 2.1 difiere en las métricas?  Esa es la cuestión

“Cuando comparamos Pingüino 2,1 y 2,0, encontramos que el algoritmo había sido refinado para que las métricas de legibilidad fueran más fuertes”, dijo Voniatis. ”Así que parece que Google está tratando de encontrar los límites del spam en internet, para ajustar sus fórmulas de legibilidad.”

Voniatis explicó la fórmula utilizada para determinar la legibilidad utilizando la escala de Kincaid tal como sigue:

RE = 206.835 – (1.015 x ASL) – (84,6 x ASW)

    • RE = Facilidad
    • ASL = longitud media de la oración (el número de palabras dividido por el número de frases)
    • ASW = Promedio del número de sílabas por palabra (el número de sílabas dividido por el número de palabras)

“Cuanto más baja es la puntuación, más difícil es comprender el texto leido.”, dijo Voniatis. ”ANOVA (análisis de varianza) mostró que la certeza de Flesch-Kincaid provoca un cambio en el tráfico debido a la actualización del pingüino en un 99,999 por ciento.”

Las barras rojas en el gráfico anterior indican esos factores en los sitios examinados que desencadenó Penguin, según datos de MathSight. Las barras verdes indican los factores que los sitios web tenían que les benefició después del pingüino 2.1.

Entonces, ¿qué significa todo esto?

Voniatis dijo que las estadísticas “nos dicen los ingredientes secretos, pero no la razón por la que Google está utilizando la legibilidad. Sospecho que Google encuentra en la legibilidad una manera fácil de descontar los enlaces de artículos escritos como invitado por personas no expertas.”

Agregó, que los profesionales SEO pueden comprobar manualmente cada vinculo de contenido de su página web mediante el uso de herramientas gratuitas online. Con ello, los SEOs pueden descartar vínculos o reacondicionar contenido de la página de aterrizaje de la web.” Además, dijo, “Los umbrales se actualizan con cada actualización del algoritmo.”