Revista Salud y Bienestar

Definiendo significación clinica vs. estadistica

Por David Ormeño @Arcanus_tco
Definiendo significación clinica vs. estadistica
Por Sean Sinden traducción David Ormeño

La práctica de la prueba de hipótesis nula se ha utilizado tradicionalmente para interpretar los resultados de los estudios en una amplia variedad de campos científicos. Brevemente, las pruebas de Convencionalmente, si esa probabilidad es inferior a 0,05 el resultado se considera significación\significancia implican el cálculo de un resultado estadístico, conocido como el valor P. El valor P representa la probabilidad de encontrar una diferencia, por casualidad, entre dos conjuntos de valores más grandes que la que se observó, suponiendo que no hay diferencia entre los dos conjuntos de valores. "estadísticamente significativo". <span title="If this sounds confusing, it's because it is!

">Si esto suena confuso, es porque ¡lo es!

Los valores p son comúnmente mal interpretados y mal utilizados para responder a las preguntas de investigación, pero en realidad no ofrecen mucha información para el lector. Este método de análisis estadístico ha enfrentado críticas a lo largo de su historia y más en las últimas décadas. <span title="The P value doesn't begin to explain the importance of a study's outcome or the amount of the effect observed, though many researchers mistakenly believe it to.

">Las deficiencias de las pruebas de significación\significancia se han identificado tanto en la literatura académica y la no académica.

<span title="The P value doesn't begin to explain the importance of a study's outcome or the amount of the effect observed, though many researchers mistakenly believe it to.

">El valor de p no explica la importancia de los resultados de un estudio o la cantidad del efecto observado, aunque muchos investigadores creen erróneamente que lo hace.

Las pruebas de significación de la hipótesis nula no explican cuánto mejor (o peor) un grupo de individuos se comparó con otro grupo, sólo que había una diferencia entre los dos grupos. En resumen, las pruebas de significación sólo nos dan la significación estadística y no dicen nada de la importancia práctica de un estudio o su aplicabilidad clínica. <span title="There are numerous examples of a statistically significance result having no practical significance and vice-versa, two of which I have included below:

">Hay numerosos ejemplos donde un resultado significativo estadísticamente no tiene importancia práctica y viceversa, dos de los cuales he incluido a continuación:

Un medicamento de prevención del VIH conocido como Truvada (una combinación de tenofovir y emtricitabina), fue aprobado por la Food and Drug Administration (FDA) en 2012. Los dos principales efectos secundarios de este medicamento, tomado como una dosis oral diaria, son una leve disminución no progresiva de la función renal y una pequeña disminución en la densidad mineral ósea. El efecto sobre la función renal se encontró que era estadísticamente significativa (P = 0,02), pero se consideró que era "sub-clínico" por los autores. En un estudio separado, el mismo fármaco causó una disminución pequeña, pero estadísticamente significativa en la densidad mineral ósea, la importancia clínica era desconocida, pero no se asoció con un aumento de la incidencia de fractura ósea durante el estudio. Por lo tanto, Truvada no parece tener efectos secundarios clínicos significativos (ver la tabla). Sin embargo, en un Este es un error muy alarmante para una enfermedad que infecta a aproximadamente a 50.000 estadounidenses y 2 millones de personas a nivel mundial por año, destacando la necesidad de una mejor traslación de conocimientos para mejorar la comprensión pública de los resultados de investigación. estudio de cohorte de 1.603 individuos en riesgo en los EE.UU., 185 personas (aproximadamente el 12% de los encuestados) citaron preocupación sobre los efectos secundarios como la razón para no tomar el medicamento.

Definiendo significación clinica vs. estadistica

Por otro lado, los resultados de investigación que no se encuentran que sean estadísticamente significativos pueden tener aplicaciones clínicas. <span title="In the field of exercise physiology, a 1% change in performance might be considered clinically applicable.

">En el campo de la fisiología del ejercicio, un cambio 1% en el rendimiento puede ser considerado clínicamente aplicable.

<span title="To put this in perspective, a difference of 1% in the 100m sprint is the difference between Donovan Bailey's 1996 Olympic record of 9.84 seconds, and Asafa Powell's 2007 world record of 9.74 seconds.

">Para poner esto en perspectiva, una diferencia del 1% en los 100 metros planos es la diferencia entre el récord olímpico de Donovan Bailey, de 9,84 segundos en <span title="To put this in perspective, a difference of 1% in the 100m sprint is the difference between Donovan Bailey's 1996 Olympic record of 9.84 seconds, and Asafa Powell's 2007 world record of 9.74 seconds.

">1996<span title="To put this in perspective, a difference of 1% in the 100m sprint is the difference between Donovan Bailey's 1996 Olympic record of 9.84 seconds, and Asafa Powell's 2007 world record of 9.74 seconds.

">, y el récord mundial 2007 de Asafa Powell de 9,74 segundos.

Tal diferencia no puede ser considerada estadísticamente significativa en un estudio típico de investigación, debido a la dificultad de obtener precisión en torno a una diferencia tan pequeña como resultado de un tamaño limitado en la muestra o una gran variabilidad en la medición. Otro buen ejemplo es el de un estudio donde los investigadores encontraron una mejoría de 2,9 minutos contrarreloj en una carrera de ciclismo que dura (totalmente) 160 minutos, con una intervención de un suplemento. Esta diferencia no fue estadísticamente significativa. Sin embargo, si los investigadores analizarán los resultados desde un punto de vista de aplicación, su conclusión podría haber sido diferente: la mejora de tiempo 2,9 minutos se tradujo en un aumento del 1,8% en el rendimiento, lo que sugiere que los atletas competitivos probablemente se beneficiarían de la intervención de un suplemento y que <span title="further investigation is warranted (7).

">debe ampliarse la investigación.

En los últimos años ha habido un alejamiento en el uso de pruebas de significación para la hipótesis nula sola, en muchos campos científicos. El h acer inferencias utilizando medidas basadas en una magnitud, tales como los intervalos de confianza, se está convirtiendo cada vez más popular, permite a los investigadores estimar el tamaño de un efecto en relación con su importancia clínica y práctica. Los valores P todavía tienen un lugar en nuestra evaluación estadística de los resultados del estudio, pero no debe ser el valor que define aceptar o rechazar un resultado. Los investigadores, escritores científicos y el público tienen que mirar los resultados de la investigación desde un punto de vista práctico, y no sólo utilizan la visión anticuada y dicotómica de la significación estadística. No se debe hacer conclusiones acerca de los resultados de investigación únicamente sobre la base de pruebas de significación sin tener en cuenta la importancia práctica y aplicabilidad del efecto observado.


Volver a la Portada de Logo Paperblog