Cómo reportar estadísticas: valores P, intervalos de confianza y tamaños del efecto (lista de verificación para revisores)

En casi toda revisión estadística hay un momento en que la ciencia parece sólida, pero la presentación no lo es. Un valor p sin tamaño del efecto. La palabra “significativo” utilizada para decir “grande.” Una tabla de pruebas sin mención de cuál se usó ni por qué. El análisis subyacente puede ser perfectamente correcto, pero el lector no puede saberlo, y un revisor que no puede saberlo empieza a dudar del resto.

Lo reconfortante es que la mayoría de estos son problemas de presentación, no de análisis. Los estudios sobre manuscritos enviados muestran que la gran mayoría no describe sus pruebas con claridad, y que una proporción llamativa extrae conclusiones que sus datos no respaldan. Puede evitar casi todo esto sin modificar su análisis, simplemente presentándolo de la manera en que un revisor lo lee. Aquí le explicamos cómo.

1El valor p no es el resultado

Un valor p responde a una sola pregunta específica: si verdaderamente no hubiera efecto, ¿qué tan sorprendentes serían datos como los suyos? Eso es todo. No es el tamaño del efecto, ni la probabilidad de que su hipótesis sea verdadera, ni una medida de importancia. Presentado por sí solo, le dice al lector casi nada que pueda utilizar. Dos cifras adicionales contienen el hallazgo real: el tamaño del efecto y su intervalo de confianza.

Figura 1. El tamaño del efecto (el punto) es su respuesta: qué tan grande es la diferencia. El intervalo de confianza (la barra) es su precisión: qué tan seguro está usted. El valor p reduce todo esto a un simple sí o no respecto a la línea discontinua. Reporte los tres y el lector verá el panorama completo.

2Acompañe cada efecto con un intervalo de confianza

El tamaño del efecto es la respuesta a la pregunta que planteó su estudio: la diferencia de medias, la razón de momios, la razón de riesgo, la correlación. El intervalo de confianza indica con qué precisión lo midió. Un intervalo estrecho indica que ha determinado el efecto con exactitud; uno amplio indica que no, incluso si el valor p es pequeño. Preséntelos siempre juntos. “El riesgo disminuyó un 38% (95% CI 12% a 56%)” le dice todo a un revisor; “p < 0.05” le dice casi nada.

Figura 2. El mismo hallazgo, presentado de dos maneras. El segundo le proporciona al lector la magnitud, la precisión y un valor p exacto, para que pueda evaluar el resultado en lugar de aceptarlo sin cuestionamiento.

3“Significativo” es un término estadístico, no un sinónimo de grande

En una sección de resultados, “significativo” debe aparecer únicamente cuando hay una prueba y un valor p que lo respalden. Utilizarlo para decir “grande” o “importante” es una de las formas más rápidas de provocar el comentario que todo autor teme: ¿significativo en qué sentido? Si quiere decir que el efecto fue grande, diga que fue grande y proporcione el número. Reserve “significativo” para la significancia estadística, y aun así, deje que el tamaño del efecto y el intervalo carguen el peso.

4Nombre la prueba y demuestre que verificó sus supuestos

El error de presentación más común es no nombrar la prueba estadística, o nombrarla sin justificarla. Para cada análisis, el lector debe poder ver qué prueba utilizó, por qué era la adecuada y que verificó sus supuestos. Un t-test asume cosas que un Mann-Whitney no asume. Una regresión lineal asume cosas que usted debería haber examinado. Indique la prueba, señale que los supuestos fueron verificados y mencione el software y la versión utilizados. Este único párrafo elimina toda una categoría de dudas por parte del revisor.

5Proporcione números exactos y reporte todo lo que pre-especificó

Dos hábitos completan el cuadro. Primero, reporte valores p exactos, “p = 0.03,” no “p < 0.05,” ni un simple “n.s.” El valor exacto contiene información que el umbral descarta. Segundo, reporte todos los resultados que pre-especificó, no solo los que alcanzaron significancia. Omitir silenciosamente los análisis que no funcionaron, o realizar múltiples comparaciones y reportar solo la que dio resultado, es exactamente el patrón que los revisores están capacitados para detectar. Pre-especifique y luego reporte todo.

Figura 3. Seis puntos que eliminan casi todos los comentarios estadísticos que un revisor hace sobre la presentación. Ninguno de ellos modifica su análisis. Cambian si el lector puede confiar en él.

Nada de esto convierte un resultado débil en uno sólido, ni se trata de realizar estadísticas más sofisticadas. Se trata de permitir que el lector vea el tamaño de lo que encontró, qué tan seguro está y cómo llegó a ello. Si hace eso, el revisor que lee sus resultados no tendrá nada que señalar, que es exactamente la posición en la que usted desea encontrarse.

Cómo reportar estadísticas: valores P, intervalos de confianza y tamaños del efecto

1El valor p no es el resultado

2Acompañe cada efecto con un intervalo de confianza

3“Significativo” es un término estadístico, no un sinónimo de grande

4Nombre la prueba y demuestre que verificó sus supuestos

5Proporcione números exactos y reporte todo lo que pre-especificó

Priv.-Doz. Dr. med. Sied Kebir, MD, PhD

¿Desea que sus resultados sean revisados así antes de que los vea un revisor?