Diseño experimental, (pseudo)replicación, poder estadístico

B0305 – Lab Eco Gral

Prof. T Nakov

Escuela de Biologia, Universidad de Costa Rica

01 Aug 2025

Diseño experimental

Por qué importa el diseño experimental

  • Ecología = sistemas complejos y variables
  • Mal diseño → conclusiones inválidas, esfuerzo desperdiciado
  • Buen diseño → inferencia más sólida, capacidad de generalizar
  • Diseño experimental
    • El investigador manipula tratamientos (ej. sombreado vs sin sombreado).
    • Inferencia más fuerte sobre causa-efecto. Requiere control de factores confusores.
  • Diseño natural
    • El investigador aprovecha la variación natural (ej. arroyos soleados vs sombreados).
    • No hay asignación verdadera de tratamientos

¡Ojo!

Incluso sin manipulación, es necesaria una definición clara de unidades experimentales y replicación.

Diseño Factorial

  • Definición: Se prueban todas las combinaciones de factores.
  • Ejemplo: Dos factores → luz (alta/baja) × nutrientes (altos/bajos)
    • Tratamientos = 2 × 2 = 4 combinaciones
  • Ventaja: puede detectar efectos de interacción (cómo se combinan los factores).

Figure 1: 2×2 factorial design schematic: Light × Nutrients.

Bloques

  • Definición: Agrupar unidades experimentales en bloques que comparten condiciones similares.
  • Ejemplo: La fertilidad del suelo varía a través de un campo → cada bloque contiene todos los tratamientos.
  • Propósito: controlar fuentes conocidas de variación.
  • Análisis: el bloque se incluye como factor en el modelo (aleatorio o fijo).

Idea clave: Los bloques reducen el ruido de la heterogeneidad.

Figure 2: Randomized complete block design: each block contains all treatments.

Aleatorización

  • Definición: Asignación aleatoria de tratamientos a unidades experimentales.
  • Propósito: evita sesgo sistemático.
  • Puede ser completa o restringida (dentro de bloques).

Ejemplo: Asignar aleatoriamente sombreado vs control a estanques, no solo “primera mitad sombreada, segunda mitad control.”

Figure 3: Randomized assignment of treatments on a field grid (within blocks).

Mensajes claves

  • Diseño factorial: probar múltiples factores y sus interacciones.
  • Bloques: controlar variación agrupando unidades similares.
  • Aleatorización: protegerse contra sesgo.

Replicación y pseudoeplicación

Conceptos fundamentales

  • Tratamiento: Lo que se manipula
  • Unidad Experimental: La unidad más pequeña que puede recibir independientemente un tratamiento
  • Replicación: Múltiples unidades experimentales independientes por tratamiento

¡Ojo!

Replicación = unidades experimentales, no muestras.

Replicación

  • Propósito: estimar variabilidad, probar hipótesis confiablemente
  • Tipos:
    • Replicación verdadera: unidades independientes (20 plantas)
    • Replicación técnica: medidas repetidas de la misma unidad (20 hojas de 1 planta)
  • Regla práctica: Replicación = número de unidades independientes

Replicación verdadera vs pseudo replicación

Replicación verdadera vs pseudo replicación

Evitando la pseudoreplicación

  • Múltiples unidades independientes por tratamiento
  • Asignación aleatoria de tratamientos
  • Bloques para controlar la variación
  • Modelos jerárquicos / mixtos para datos anidados

Mensajes clave

  • Replicación = unidades independientes, no medidas repetidas
  • La pseudoreplicación es común pero evitable
  • Reconocer cuando la replicación completa es imposible

Poder Estadístico: Introducción

  • Poder estadístico = probabilidad de detectar un efecto si verdaderamente existe
  • Poder = 1 – β
    • β (Error Tipo II): fallar en rechazar una hipótesis nula cuando esta falsa
  • Meta común: 80% de poder

¡Ojo!

Alto poder = buena oportunidad de detectar efectos biológicamente significativos.

Componentes del poder

El poder depende de:

  • Tamaño del efecto: qué tan grande es la diferencia verdadera
  • Tamaño de muestra (n): número de unidades independientes
  • Varianza (σ²): variabilidad natural en el sistema
  • Nivel de significancia (α): usualmente 0.05

Poder y varianza: Cómo se conectan

  • Recordar: El poder depende del tamaño del efecto, tamaño de muestra, varianza, y α
  • En la práctica, la varianza (σ²) está incorporada en el tamaño del efecto

Para una prueba t de dos muestras:

\[ d = \frac{\text{diferencia de medias}}{\text{desviación estándar}} \]

Ejemplo: De varianza a poder

Supongamos que probamos sombreado vs sin sombreado en el crecimiento de algas:

  • Diferencia de medias esperada = 20 unidades
  • Datos piloto: desviación estándar = 25
  • Nivel de significancia α = 0.05
  • Poder objetivo = 0.80

\[ d = \frac{20}{25} = 0.8 \]

Pregunta: ¿Cuántos arroyos réplica por tratamiento se necesitan?

Cálculo en R

library(pwr)

# Tamaño del efecto a partir de diferencia de medias y DE
d <- 20 / 25   # = 0.8

# Análisis de poder para prueba t de dos muestras
pwr.t.test(d = d, power = 0.8, sig.level = 0.05,
           type = "two.sample")

     Two-sample t test power calculation 

              n = 25.52458
              d = 0.8
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

NOTE: n is number in *each* group

Resultado: ~26 réplicas por grupo necesarias

Interpretación

  • Con σ = 25, detectar una diferencia de 20 unidades necesita ~26 réplicas por tratamiento.

  • Si la variabilidad fuera menor (σ = 10): d = 20/10 = 2 → muchas menos réplicas necesarias

  • Si la variabilidad fuera mayor (σ = 40): d = 20/40 = 0.5 → mucha más replicación necesaria

Mensajes Clave

  • Planificar el tamaño de muestra antes del experimento
  • ¡La varianza importa! Dicta qué tan grande se ve el efecto relativo al ruido.
  • Siempre tratar de estimar la varianza de estudios piloto o la literatura.

Bibliografia

Statistics done wrong: https://www.statisticsdonewrong.com/pseudoreplication.html

Marshall, D.J., 2024. Principles of experimental design for ecology and evolution. Ecology Letters, 27(4), p.e14400. 📄 PDF

Gotelli, N. J., & Ellison, A. M. (2004). A primer of ecological statistics (Vol. 1), Capitulo 4. Sunderland: Sinauer Associates. 📄 PDF

Gotelli, N. J., & Ellison, A. M. (2004). A primer of ecological statistics (Vol. 1), Capitulo 6. Sunderland: Sinauer Associates. 📄 PDF