Diseño experimental, (pseudo)replicación, poder estadístico

B0305 – Lab Eco Gral

Prof. T Nakov

Escuela de Biologia, Universidad de Costa Rica

01 Aug 2025

Diseño experimental

Por qué importa el diseño experimental

Ecología = sistemas complejos y variables
Mal diseño → conclusiones inválidas, esfuerzo desperdiciado
Buen diseño → inferencia más sólida, capacidad de generalizar

Diseño experimental
- El investigador manipula tratamientos (ej. sombreado vs sin sombreado).
- Inferencia más fuerte sobre causa-efecto. Requiere control de factores confusores.

Diseño natural
- El investigador aprovecha la variación natural (ej. arroyos soleados vs sombreados).
- No hay asignación verdadera de tratamientos

¡Ojo!

Incluso sin manipulación, es necesaria una definición clara de unidades experimentales y replicación.

Diseño Factorial

Definición: Se prueban todas las combinaciones de factores.
Ejemplo: Dos factores → luz (alta/baja) × nutrientes (altos/bajos)
- Tratamientos = 2 × 2 = 4 combinaciones
Ventaja: puede detectar efectos de interacción (cómo se combinan los factores).

Figure 1: 2×2 factorial design schematic: Light × Nutrients.

Bloques

Definición: Agrupar unidades experimentales en bloques que comparten condiciones similares.
Ejemplo: La fertilidad del suelo varía a través de un campo → cada bloque contiene todos los tratamientos.
Propósito: controlar fuentes conocidas de variación.
Análisis: el bloque se incluye como factor en el modelo (aleatorio o fijo).

Idea clave: Los bloques reducen el ruido de la heterogeneidad.

Figure 2: Randomized complete block design: each block contains all treatments.

Aleatorización

Definición: Asignación aleatoria de tratamientos a unidades experimentales.
Propósito: evita sesgo sistemático.
Puede ser completa o restringida (dentro de bloques).

Ejemplo: Asignar aleatoriamente sombreado vs control a estanques, no solo “primera mitad sombreada, segunda mitad control.”

Figure 3: Randomized assignment of treatments on a field grid (within blocks).

Mensajes claves

Diseño factorial: probar múltiples factores y sus interacciones.
Bloques: controlar variación agrupando unidades similares.
Aleatorización: protegerse contra sesgo.

Replicación y pseudoeplicación

Conceptos fundamentales

Tratamiento: Lo que se manipula
Unidad Experimental: La unidad más pequeña que puede recibir independientemente un tratamiento
Replicación: Múltiples unidades experimentales independientes por tratamiento

¡Ojo!

Replicación = unidades experimentales, no muestras.

Replicación

Propósito: estimar variabilidad, probar hipótesis confiablemente
Tipos:
- Replicación verdadera: unidades independientes (20 plantas)
- Replicación técnica: medidas repetidas de la misma unidad (20 hojas de 1 planta)
Regla práctica: Replicación = número de unidades independientes

Replicación verdadera vs pseudo replicación

Evitando la pseudoreplicación

Múltiples unidades independientes por tratamiento
Asignación aleatoria de tratamientos
Bloques para controlar la variación
Modelos jerárquicos / mixtos para datos anidados

Mensajes clave

Replicación = unidades independientes, no medidas repetidas
La pseudoreplicación es común pero evitable
Reconocer cuando la replicación completa es imposible

Poder Estadístico: Introducción

Poder estadístico = probabilidad de detectar un efecto si verdaderamente existe
Poder = 1 – β
- β (Error Tipo II): fallar en rechazar una hipótesis nula cuando esta falsa
Meta común: 80% de poder

¡Ojo!

Alto poder = buena oportunidad de detectar efectos biológicamente significativos.

Componentes del poder

El poder depende de:

Tamaño del efecto: qué tan grande es la diferencia verdadera
Tamaño de muestra (n): número de unidades independientes
Varianza (σ²): variabilidad natural en el sistema
Nivel de significancia (α): usualmente 0.05

Poder y varianza: Cómo se conectan

Recordar: El poder depende del tamaño del efecto, tamaño de muestra, varianza, y α
En la práctica, la varianza (σ²) está incorporada en el tamaño del efecto

Para una prueba t de dos muestras:

\[ d = \frac{\text{diferencia de medias}}{\text{desviación estándar}} \]

Ejemplo: De varianza a poder

Supongamos que probamos sombreado vs sin sombreado en el crecimiento de algas:

Diferencia de medias esperada = 20 unidades
Datos piloto: desviación estándar = 25
Nivel de significancia α = 0.05
Poder objetivo = 0.80

\[ d = \frac{20}{25} = 0.8 \]

Pregunta: ¿Cuántos arroyos réplica por tratamiento se necesitan?

Cálculo en R

library(pwr)

# Tamaño del efecto a partir de diferencia de medias y DE
d <- 20 / 25   # = 0.8

# Análisis de poder para prueba t de dos muestras
pwr.t.test(d = d, power = 0.8, sig.level = 0.05,
           type = "two.sample")


     Two-sample t test power calculation 

              n = 25.52458
              d = 0.8
      sig.level = 0.05
          power = 0.8
    alternative = two.sided

NOTE: n is number in *each* group

Resultado: ~26 réplicas por grupo necesarias

Interpretación

Con σ = 25, detectar una diferencia de 20 unidades necesita ~26 réplicas por tratamiento.
Si la variabilidad fuera menor (σ = 10): d = 20/10 = 2 → muchas menos réplicas necesarias
Si la variabilidad fuera mayor (σ = 40): d = 20/40 = 0.5 → mucha más replicación necesaria

Mensajes Clave

Planificar el tamaño de muestra antes del experimento
¡La varianza importa! Dicta qué tan grande se ve el efecto relativo al ruido.
Siempre tratar de estimar la varianza de estudios piloto o la literatura.

Bibliografia

Statistics done wrong: https://www.statisticsdonewrong.com/pseudoreplication.html

Marshall, D.J., 2024. Principles of experimental design for ecology and evolution. Ecology Letters, 27(4), p.e14400. 📄 PDF

Gotelli, N. J., & Ellison, A. M. (2004). A primer of ecological statistics (Vol. 1), Capitulo 4. Sunderland: Sinauer Associates. 📄 PDF

Gotelli, N. J., & Ellison, A. M. (2004). A primer of ecological statistics (Vol. 1), Capitulo 6. Sunderland: Sinauer Associates. 📄 PDF