Benchmarking de future.apply

R Tutoriales - Este artículo es parte de una serie.

Parte 1: Este artículo

Los tres contendientes
#

Bucle for estándar: Iteración manual (con pre-asignación).
lapply: El estándar funcional y secuencial de R.
future_lapply: La versión paralelizada.

Experimento 1: La tarea “barata” (ligera)
#

En este escenario, hacemos algo muy rápido: calcular la media de 1.000 números.

n <- 200
data_list <- replicate(n, rnorm(1000), simplify = FALSE)

bench_cheap <- microbenchmark(
  for_loop = {
    res_for <- vector("list", n)
    for (i in 1:n) res_for[[i]] <- mean(data_list[[i]])
  },
  standard_apply = lapply(data_list, mean),
  future_apply = future_lapply(data_list, mean),
  times = 10
)

# Generar tabla
kable(summary(bench_cheap), caption = "Resultados de la tarea ligera (milisegundos)")

expr	min	lq	mean	median	uq	max	neval
for_loop	1526.106	1660.558	1737.2113	1724.8730	1767.877	2058.762	10
standard_apply	581.668	600.766	683.3103	610.2285	644.566	1329.651	10
future_apply	42850.048	46636.701	72920.2842	70995.9105	87396.966	139938.649	10

Resultados de la tarea ligera (milisegundos)

# Generar figura
autoplot(bench_cheap) +
  labs(title = "Tarea ligera: La sobrecarga del paralelo es visible")

Experimento 2: La tarea “cara” (pesada)
#

En este escenario, simulamos un trabajo “pesado” añadiendo un pequeño retardo (Sys.sleep). Esto imita el modelado estadístico complejo o el web scraping.

n_heavy <- 20
data_heavy <- replicate(n_heavy, rnorm(10), simplify = FALSE)

# Una función que tarda 0,1 segundos por llamada
heavy_func <- function(x) {
  Sys.sleep(0.1)
  mean(x)
}

bench_expensive <- microbenchmark(
  for_loop = {
    res_for <- vector("list", n_heavy)
    for (i in 1:n_heavy) res_for[[i]] <- heavy_func(data_heavy[[i]])
  },
  standard_apply = lapply(data_heavy, heavy_func),
  future_apply = future_lapply(data_heavy, heavy_func),
  times = 2 # ¡Pocas iteraciones porque es lento!
)

# Generar tabla
kable(summary(bench_expensive), caption = "Resultados de la tarea pesada (segundos)")

expr	min	lq	mean	median	uq	max	neval
for_loop	2010.3002	2010.3002	2012.249	2012.249	2014.1975	2014.1975	2
standard_apply	2008.0148	2008.0148	2008.313	2008.313	2008.6106	2008.6106	2
future_apply	286.0831	286.0831	288.471	288.471	290.8588	290.8588	2

Resultados de la tarea pesada (segundos)

# Generar figura
autoplot(bench_expensive) +
  labs(title = "Tarea pesada: Future gana por goleada")

R Tutoriales - Este artículo es parte de una serie.

Parte 1: Este artículo

Los tres contendientes#

Experimento 1: La tarea “barata” (ligera)#

Experimento 2: La tarea “cara” (pesada)#

Los tres contendientes
#

Experimento 1: La tarea “barata” (ligera)
#

Experimento 2: La tarea “cara” (pesada)
#