Siempre el mismo drama: tengo los resultados, y ¿cómo los analizo? Un experto en estadística, por favor!
En realidad, en ese momento es muy tarde. Como lo sería llamar al arquitecto una vez que la casa está construida: no hay mucho que pueda hacer, salvo recomendar enredaderas y ligustrinas para disimular los errores. Hay quienes tienen ese errado concepto de la estadística para la investigación clínica.
El diseño estadístico de un ensayo clínico es parte del diseño general. Los médicos debemos tener una idea general, conceptual, que nos alcance para explicarle al experto qué queremos analizar. Del mismo modo que le diríamos al arquitecto qué tipo de casa querríamos que construyera para nosotros (si pudiéramos pagarlo).
Copio aquí breves notas a un mini-curso sobre "estadistica médica sin dolor", enfocada como "de médicos, para médicos". Sucede que los tests de significación estadística no son muy diferentes de otros tests diagnósticos que los médicos usamos: tienen su mecanismo básico de funcionamiento, sus suposiciones sobre la realidad, su sensibilidad, especificidad y precisión. Y como los procedimientos terapéuticos y diagnósticos, tienen sus indicaciones y contraindicaciones. Con ese espíritu describo algunos, e iré agregando, por etapas.
En la primera reunión nos ocupamos de las proporciones (cocientes), de su disposición en el formato de tablas de 2 x 2 (buen o mal control de la TA, versus presencia o no de infarto).
Los tests estadísticos que nos señalan si la distribución pudiera explicarse por mero azar o no son: Chi cuadrado, y si los números son pequeños, test exacto de Fisher.
Básicamente, Chi cuadrado calcula el valor "esperado" en cada casillero de la tabla 2 x 2, en base a los totales (en los márgenes), y se pregunta cuán grande es la dif entre "observado" y "esperado", en cada casillero, y los suma. Pequeños valores de esa sumatoria de diferencias son considerados debidos a mero azar. Pero si la suma de las difs O-E resulta grande... ya se rechaza que sea mero azar. Se obtiene un valor de Chi cuadrado, se va a tabla, y se saca la P, es decir, la probabilidad de que los datos fuesen simplemente fruto del azar.
El test de Fisher, en cambio, entra en una compleja trama de cálculos, factibles de hacer manualmente si los números son peq, pero monumental si son grandes. Su ventaja: calcula "directa y exactamente"... "la P".
En resumen: el test de Chi cuadrado "está indicado"... si examinamos proporciones, de distribución gaussiana, en una tabla de 2 x 2 (o de mayor tamaño), y si ningún valor dentro de la tabla es "pequeño"( <> 200, tentativamente. Si el N total es <>
El test exacto de Fisher "está indicado" solamente para tablas de 2 x 2, de proporciones, con distribución gaussiana, y para números "pequeños". Es el "test de elección" si en la tabla de 2 x 2 hay más de un casillero con valor <5.
Cocientes como indicadores de probabilidad o riesgo
También son proporciones (cocientes) todos los indicadores de probabilidad o riesgo. Y el cociente de riesgos es el riesgo relativo.
Si el riesgo relativo es mayor que 1.00, hablamos de aumento, y si menor, de disminución. Pero excederá lo aceptable por simple azar?
Vimos reducción relativa del riesgo, RRR, y reducción absoluta, RRA.
Aprendimos a calcular NNT, número necesario a tratar para evitar un evento (infarto): NNT = 1 / RRA. Simple y directo. En otras palabras, cuanto menor la reducción absoluta de riesgo, mayor el número de pacientes a tratar para evitar un solo evento.
También, para la toxicidad, hablamos de NNH, número necesario para dañar (H: harm, daño).
Y para programas de screening, NNS, número de mujeres a las que debe hacerse Pap para detectar un cáncer de cuello uterino, número de mujeres que harán mamografía anual por 10 años para evitar una muerte.
Vimos que el mercado (laboratorios farmacéuticos) nos pone por delante la RRR ("el nuevo fármaco reduce en un 40% el riesgo de un infarto"), y que debemos saber también la RRA (si el riesgo de infarto fuese bajo en la población, un 40% de reducción podría representar pasar de, por ejemplo, un infarto por mil personas al año, a 0.6 infartos por mil por año). Por eso es importante establecer el NNT, para ponderar la efecividad de la intervención (cuántas personas en riesgo deberán utilizar el medicamento diariamente, para evitar un infarto en un año)..
Las proporciones se aplican a las estadísticas de supervivencia o "curvas". Se establecen las "curvas" con el método de Kaplan Meier, que computa probabilidad de supervivencia (cociente; riesgo) en cada intervalo, tomando los datos de cuantos puedan ser evaluados en el intervalo. Como en las "colas" hay menos pacientes, la cola tiene mucha dispersión (error), y lo mejor es no apresurarse a extraer conclusiones por lo observado en la cola de una curva, ya que se ha trazado en base a un número muy pequeño de pacientes "en riesgo" (es decir, que aún no han experimentado el evento que se busca evaluar)..
Se puede comparar dos curvas de supervivencia con el test de log rank: una forma especial de Chi cuadrado que se plantea que si la pendiente de ambas "curvas" es igual, o no difiere más que por mero azar, o bien... excede lo esperado por mero azar: observado versus esperado. Otra vez el razonamiento Chi cuadrado.
Saludos,
Pedro Politi
No hay comentarios:
Publicar un comentario