Hilos virtuales en Java: una revolución en la concurrencia

1 de diciembre de 2025, 17:00:45 Diario Tecnología 19 min lectura

Desde sus primeras versiones, Java ha sido sinónimo de robustez y capacidad para gestionar sistemas complejos. Sin embargo, uno de los desafíos recurrentes para los desarrolladores ha sido siempre la concurrencia. La gestión de hilos, aunque potente, ha implicado una serie de compromisos en términos de recursos, complejidad de código y escalabilidad. ¿Qué pasaría si te dijera que la última versión de Java trae consigo una característica que promete redefinir por completo cómo abordamos la concurrencia, haciendo que el código sea más simple, más escalable y más eficiente? Prepárate para sumergirte en el fascinante mundo de los hilos virtuales (Virtual Threads), una de las joyas más brillantes de Project Loom, que finalmente ha llegado para quedarse en las versiones recientes de la plataforma, como Java 21 LTS.

Este tutorial no solo te guiará a través de la teoría detrás de esta innovación, sino que también te proporcionará ejemplos de código claros para que puedas empezar a utilizarlos de inmediato. Veremos cómo los hilos virtuales no solo facilitan la vida del desarrollador, sino que también ofrecen un camino hacia arquitecturas de software mucho más eficientes y capaces de manejar cargas de trabajo masivas sin sudar la gota gorda. Si alguna vez te has sentido frustrado por los cuellos de botella de los hilos tradicionales o por la complejidad de los frameworks reactivos, este artículo es para ti. ¡Comencemos este viaje hacia una concurrencia más sencilla y potente!

¿Qué son los hilos virtuales (Virtual Threads)?

Los hilos virtuales son la respuesta de Java a las limitaciones históricas de los hilos de plataforma (también conocidos como hilos del sistema operativo o "OS threads"). Tradicionalmente, cada hilo de Java se mapeaba directamente a un hilo del sistema operativo. Esto funcionaba bien hasta cierto punto, pero el sistema operativo tiene un límite en la cantidad de hilos que puede manejar eficientemente. Crear y gestionar miles de hilos de SO consume una cantidad significativa de memoria (una pila de memoria de varios megabytes por hilo) y recursos de CPU (para el cambio de contexto), lo que se traduce en un cuello de botella de escalabilidad para aplicaciones con alta concurrencia, como servidores web o microservicios que manejan miles de peticiones simultáneas.

Aquí es donde entran los hilos virtuales. Son hilos muy ligeros, gestionados completamente por la máquina virtual de Java (JVM), no por el sistema operativo. Esto significa que la JVM puede crear millones de hilos virtuales sin la sobrecarga asociada a los hilos de plataforma. Un hilo virtual no tiene un hilo de SO dedicado de forma permanente; en cambio, se "monta" y "desmonta" dinámicamente sobre un pequeño número de hilos de plataforma cuando necesita ejecutarse. Cuando un hilo virtual realiza una operación bloqueante (como una llamada de red o una espera de base de datos), se "desmonta" del hilo de plataforma, liberando ese hilo de plataforma para que otro hilo virtual pueda utilizarlo. Cuando la operación bloqueante termina, el hilo virtual se "remonta" en un hilo de plataforma disponible para continuar su ejecución.

Esta abstracción es el corazón de la eficiencia de los hilos virtuales. Permite que la aplicación mantenga una arquitectura de programación concurrente basada en el estilo "uno por petición" (one-thread-per-request), que es inherentemente más fácil de entender y depurar, mientras se beneficia de la escalabilidad y la eficiencia de recursos que antes solo se podían lograr con modelos de programación asíncronos más complejos (como la programación reactiva). Es, en esencia, tener lo mejor de ambos mundos: simplicidad de código y alta escalabilidad. Personalmente, creo que esta característica cambiará la forma en que muchos equipos abordan el diseño de APIs y servicios en Java, ya que reduce drásticamente la barrera de entrada para construir sistemas de alto rendimiento.

La problemática de la concurrencia tradicional en Java

Para entender el verdadero impacto de los hilos virtuales, es crucial comprender las limitaciones que intentan resolver. La concurrencia tradicional en Java, basada en java.lang.Thread, presenta desafíos significativos en entornos de alta carga. Cada instancia de Thread se corresponde directamente con un hilo del sistema operativo, lo que implica una serie de costes:

Alto consumo de memoria: Los hilos de plataforma requieren una pila de memoria considerable (típicamente entre 1 y 2 MB por defecto en la mayoría de los sistemas). Multiplica eso por miles de hilos, y verás rápidamente cómo la memoria RAM de tu servidor se consume sin ofrecer necesariamente un rendimiento proporcional.
Sobrecarga del sistema operativo: El sistema operativo es responsable de programar, cambiar el contexto y gestionar el ciclo de vida de estos hilos. Cuantos más hilos haya, mayor será la sobrecarga para el kernel, lo que ralentiza todo el sistema. El cambio de contexto entre miles de hilos es costoso y reduce el rendimiento general de la aplicación.
Ineficiencia en operaciones de E/S bloqueantes: Muchas aplicaciones empresariales pasan gran parte de su tiempo esperando operaciones de E/S: bases de datos, APIs externas, sistemas de archivos, etc. Durante este tiempo de espera, un hilo de plataforma tradicional está "bloqueado", es decir, no está haciendo nada útil, pero sigue consumiendo memoria y ocupando un slot que podría ser utilizado por otro trabajo. Para mitigar esto, los desarrolladores recurren a los thread pools, que limitan el número de hilos, pero esto puede llevar a la saturación si la latencia de las operaciones de E/S es alta.
Complejidad del código: Para superar estas limitaciones, han surgido patrones y frameworks complejos como la programación reactiva (Spring WebFlux, Vert.x, Project Reactor). Si bien son extremadamente eficientes en el uso de recursos, a menudo introducen una curva de aprendizaje pronunciada, un estilo de programación menos intuitivo (el famoso "callback hell" o la necesidad de entender los flujos reactivos) y una depuración más difícil. El código se vuelve más verboso y menos legible para resolver el problema fundamental de la espera de E/S.

La programación concurrente ha estado atrapada entre la simplicidad de la programación síncrona con hilos pesados y la eficiencia de la programación asíncrona con hilos ligeros, a menudo a costa de la complejidad del código. Los hilos virtuales buscan romper este dilema, permitiendo la simplicidad del modelo uno-por-petición con la eficiencia de un modelo asíncrono subyacente. Es un cambio de paradigma que tiene el potencial de simplificar enormemente el desarrollo de servicios de alto rendimiento en Java. Para profundizar en la discusión sobre los hilos de plataforma, recomiendo revisar la documentación oficial de Oracle sobre hilos virtuales.

Implementando hilos virtuales en Java: un tutorial paso a paso

Ahora que entendemos la teoría y la motivación detrás de los hilos virtuales, es hora de poner las manos en el código. Veremos lo sencillo que es empezar a utilizarlos y cómo pueden simplificar tus aplicaciones.

Requisitos previos

Para seguir este tutorial, necesitarás:

Java Development Kit (JDK) 21 o superior: Los hilos virtuales se estandarizaron como característica final en Java 21 LTS. Si utilizas Java 19 o 20, necesitarías habilitar el modo de previsualización (--enable-preview), pero para producción y facilidad, se recomienda Java 21 o posterior. Puedes descargar el JDK desde el sitio oficial de Oracle.
Un IDE moderno: IntelliJ IDEA, VS Code con la extensión de Java, o Eclipse son excelentes opciones que ofrecen buen soporte para las últimas versiones de Java.
Un sistema de construcción (opcional pero recomendado): Maven o Gradle facilitarán la gestión de tu proyecto.

Creación básica de un hilo virtual

La forma más sencilla de crear y ejecutar un hilo virtual es utilizando el método Thread.ofVirtual(). Compara esto con la creación de un hilo de plataforma tradicional:


import java.util.concurrent.TimeUnit;

public class VirtualThreadBasic {

    public static void main(String[] args) throws InterruptedException {
        System.out.println("Iniciando aplicación con " + Thread.currentThread().getName());

        // Hilo de plataforma tradicional
        Thread platformThread = new Thread(() -> {
            try {
                System.out.println("Hola desde hilo de plataforma: " + Thread.currentThread().getName());
                TimeUnit.SECONDS.sleep(1); // Simula una operación bloqueante
                System.out.println("Adiós desde hilo de plataforma: " + Thread.currentThread().getName());
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        }, "mi-hilo-plataforma");

        platformThread.start();
        platformThread.join(); // Espera a que termine el hilo de plataforma

        // Hilo virtual
        Thread virtualThread = Thread.ofVirtual().name("mi-hilo-virtual").start(() -> {
            try {
                System.out.println("Hola desde hilo virtual: " + Thread.currentThread().getName());
                TimeUnit.SECONDS.sleep(1); // Simula una operación bloqueante
                System.out.println("Adiós desde hilo virtual: " + Thread.currentThread().getName());
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
            }
        });

        virtualThread.join(); // Espera a que termine el hilo virtual

        System.out.println("Aplicación finalizada.");
    }
}

Como puedes ver, la sintaxis es muy similar, lo que facilita la migración de código existente. La diferencia fundamental reside en cómo la JVM gestiona internamente el hilo virtual frente al hilo de plataforma.

Usando `Executors.newVirtualThreadPerTaskExecutor()`

Para escenarios donde necesitas ejecutar muchas tareas concurrentes de corta duración, el patrón más común es usar un ExecutorService. Java ha introducido un nuevo tipo de executor diseñado específicamente para hilos virtuales: Executors.newVirtualThreadPerTaskExecutor(). Este executor crea un nuevo hilo virtual para cada tarea que se le envía, una estrategia que sería inviable y muy ineficiente con hilos de plataforma tradicionales. Este enfoque es ideal para modelos de concurrencia "uno a uno", donde cada petición o tarea se maneja en su propio hilo.


import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;

public class VirtualThreadExecutorExample {

    private static void performTask(int taskId) {
        try {
            System.out.printf("Tarea %d iniciada por hilo: %s%n", taskId, Thread.currentThread().getName());
            TimeUnit.MILLISECONDS.sleep(100 + (long) (Math.random() * 500)); // Simula trabajo y E/S
            System.out.printf("Tarea %d completada por hilo: %s%n", taskId, Thread.currentThread().getName());
        } catch (InterruptedException e) {
            Thread.currentThread().interrupt();
            System.err.printf("Tarea %d interrumpida.%n", taskId);
        }
    }

    public static void main(String[] args) throws InterruptedException {
        int numberOfTasks = 5000; // Un gran número de tareas concurrentes

        long startTime = System.currentTimeMillis();

        try (ExecutorService executor = Executors.newVirtualThreadPerTaskExecutor()) {
            for (int i = 0; i  numberOfTasks; i++) {
                final int taskId = i;
                executor.submit(() -> performTask(taskId));
            }
        } // El executor se cierra automáticamente al salir del try-with-resources

        // Esperar un tiempo prudencial para que todas las tareas terminen
        // En un entorno real, usarías un mecanismo de espera más robusto, como CountDownLatch
        // o esperar a que el executor termine con shutdown() y awaitTermination()
        TimeUnit.SECONDS.sleep(5); 

        long endTime = System.currentTimeMillis();
        System.out.printf("Todas las tareas (%d) ejecutadas en %d ms.%n", numberOfTasks, (endTime - startTime));
        System.out.println("Aplicación finalizada.");
    }
}

Ejecuta este código y observa cómo se inician y completan miles de tareas casi instantáneamente, cada una en su propio hilo virtual. Intenta reemplazar Executors.newVirtualThreadPerTaskExecutor() con Executors.newFixedThreadPool(100) (un thread pool de 100 hilos de plataforma) y verás una diferencia abismal en el tiempo de ejecución y la capacidad de respuesta, e incluso el agotamiento de recursos si el número de hilos de plataforma es demasiado alto.

Manejo de E/S bloqueante con hilos virtuales

La mayor ventaja de los hilos virtuales brilla en la gestión de operaciones de E/S bloqueantes. Cuando un hilo virtual encuentra una operación bloqueante (como leer de un socket, esperar una respuesta HTTP, o dormir), no bloquea el hilo de plataforma subyacente. En su lugar, la JVM "desmonta" el hilo virtual del hilo de plataforma, lo que permite que ese hilo de plataforma sea utilizado por otro hilo virtual que esté listo para ejecutarse. Una vez que la operación de E/S del primer hilo virtual se completa, la JVM lo "remonta" en cualquier hilo de plataforma disponible para que continúe su ejecución. Todo esto sucede de forma transparente para el desarrollador, haciendo que el código parezca síncrono, pero actuando de manera asíncrona por debajo.

Consideremos un ejemplo simulado de un servidor que maneja múltiples peticiones que implican una espera (simulando una llamada a base de datos o a otro servicio):


import com.sun.net.httpserver.HttpServer; // Necesitas el módulo jdk.httpserver en tu classpath/module-path
import java.io.IOException;
import java.io.OutputStream;
import java.net.InetSocketAddress;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;

public class VirtualThreadBlockingServer {

    public static void main(String[] args) throws IOException {
        int port = 8080;
        HttpServer server = HttpServer.create(new InetSocketAddress(port), 0);
        
        // Usamos un ExecutorService con hilos virtuales para manejar las peticiones
        // Cada petición HTTP será manejada por un nuevo hilo virtual
        server.setExecutor(Executors.newVirtualThreadPerTaskExecutor()); 

        server.createContext("/api/data", httpExchange -> {
            try {
                System.out.printf("Petición recibida por hilo: %s%n", Thread.currentThread().getName());
                // Simular una operación de E/S bloqueante (ej. consulta a DB, llamada a API externa)
                TimeUnit.SECONDS.sleep(2); 

                String response = "Datos procesados por " + Thread.currentThread().getName();
                httpExchange.sendResponseHeaders(200, response.length());
                OutputStream os = httpExchange.getResponseBody();
                os.write(response.getBytes());
                os.close();
                System.out.printf("Petición completada por hilo: %s%n", Thread.currentThread().getName());
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
                httpExchange.sendResponseHeaders(500, -1);
            }
        });

        server.start();
        System.out.println("Servidor iniciado en el puerto " + port);
        System.out.println("Visita http://localhost:8080/api/data en tu navegador o usa curl.");
        System.out.println("Prueba a abrir varias pestañas o ejecutar varios 'curl' simultáneamente.");

        // Para evitar que el programa termine inmediatamente, espera una señal de parada
        // o mantén el hilo principal vivo de alguna otra manera.
        // Aquí lo mantenemos simple para el ejemplo.
        // Thread.currentThread().join(); // Esto bloquearía el main thread indefinidamente
    }
}

Para probar este servidor:

Guarda el código como `VirtualThreadBlockingServer.java`.
Compílalo: `javac --enable-preview -source 21 VirtualThreadBlockingServer.java` (si usas Java 19/20) o `javac VirtualThreadBlockingServer.java` (con Java 21+).
Ejecútalo: `java --enable-preview VirtualThreadBlockingServer` (si usas Java 19/20) o `java VirtualThreadBlockingServer` (con Java 21+).
Abre múltiples pestañas en tu navegador a `http://localhost:8080/api/data` o usa `curl http://localhost:8080/api/data` varias veces rápidamente.

Verás cómo el servidor puede manejar muchas peticiones simultáneamente, a pesar de que cada una "duerme" durante 2 segundos. Con hilos de plataforma tradicionales y un thread pool pequeño, se saturaría rápidamente. Aquí, los hilos virtuales permiten que el código de manejo de peticiones siga siendo secuencial y fácil de leer, mientras la infraestructura subyacente se encarga de la concurrencia eficiente.

Para más información sobre la implementación de hilos virtuales y sus constructores, puedes consultar directamente el JEP 444, que detalla la característica Virtual Threads.

Ventajas y consideraciones de los hilos virtuales

La adopción de hilos virtuales no es una decisión trivial y, como toda nueva tecnología, viene con sus propias ventajas y un conjunto de consideraciones importantes a tener en cuenta.

Ventajas

Escalabilidad masiva: Esta es la ventaja principal. Los hilos virtuales permiten que una aplicación maneje cientos de miles, o incluso millones, de tareas concurrentes con una huella de memoria mínima. Esto es un cambio radical para servicios que experimentan picos de carga o que necesitan mantener muchas conexiones abiertas simultáneamente.
Simplificación del código concurrente: Los hilos virtuales permiten escribir código secuencial y síncrono para manejar tareas que son inherentemente asíncronas y bloqueantes. Esto elimina gran parte de la complejidad asociada con los callbacks, Futures, CompletableFuture, y los complejos flujos de programación reactiva. El código se vuelve más fácil de leer, escribir y depurar, ya que se parece más al código tradicional y lineal al que la mayoría de los desarrolladores están acostumbrados.
Mejor utilización de recursos: Al desacoplar los hilos de Java de los hilos del sistema operativo, la JVM puede utilizar de manera más eficiente un número limitado de hilos de plataforma para ejecutar una cantidad mucho mayor de tareas. Esto reduce la sobrecarga del sistema operativo y libera