Es uno de los mayores genios de la IA y probablemente no lo conoces: desapareció por completo tras revolucionar las redes neuronales

Publicado el 12/09/2025 por Diario Tecnología
Artículo original

Es uno de los mayores genios de la IA y probablemente no lo conoces: desapareció por completo tras revolucionar las redes neuronales

Dejando de lado el lado más mediático-empresarial que representan Elon Musk, Sam Altman y compañía, en la historia reciente de la inteligencia artificial (entendida como ciencia) sigue habiendo algunos nombres que brillan por su visibilidad mediática: Geoffrey Hinton, Yann LeCun, Yoshua Bengio... 

Sin embargo, entre bastidores, un joven investigador nacido en la Unión Soviética, Alex Krizhevsky, fue el auténtico detonante de la revolución del aprendizaje profundo que hoy mueve desde la visión por computadora hasta la generación de texto e imágenes.

Su historia, paradójicamente, es la del protagonista de una revolución que eligió 'borrarse de la foto'.

Los orígenes

Alex Krizhevsky nació en 1979 en la Unión Soviética (en la actual Ucrania, para más señas) y emigró con su familia a Canadá durante su infancia. Allí estudió ciencias de la computación en la Universidad de Toronto, donde más tarde entraría en el laboratorio de Geoffrey Hinton, considerado el "padrino del Deep Learning".

Hinton llevaba décadas investigando las redes neuronales en una época en la que el campo estaba desprestigiado: los métodos estadísticos y el aprendizaje automático clásico dominaban la escena académica.

Pero Hinton tenía una intuición y persistía en ella: con la potencia computacional adecuada y los datos suficientes, las redes neuronales profundas podrían superar todos los enfoques existentes. Cuánta razón tenía.

Curiosamente, no empezó su doctorado en IA por convicción “visionaria”, sino para retrasar la entrada al mercado laboral como programador

El nacimiento (e impacto) de AlexNet

En 2012, Krizhevsky, junto a Ilya Sutskever y Geoffrey Hinton, presentó un modelo de red neuronal convolucional que pasaría a la historia con el nombre de AlexNet. Entrenado mediante varias GPUs —un uso pionero de este hardware para tareas de aprendizaje profundo— y ejecutado literalmente en el dormitorio de Krizhevsky, el modelo arrasó en el ImageNet Large Scale Visual Recognition Challenge (ILSVRC 2012).

Mientras que los modelos tradicionales obtenían tasas de error de alrededor del 26%, AlexNet logró reducir esa cifra a un 15%. La diferencia no era incremental, era abismal. Fue el punto de inflexión: la comunidad científica comprendió que las redes neuronales profundas habían dejado de ser un sueño imposible.

El triunfo de AlexNet desató una auténtica avalancha. En pocos años, compañías tecnológicas como Google, Facebook y Microsoft comenzaron a invertir masivamente en investigación de deep learning. Las GPU se convirtieron en herramientas fundamentales para científicos de datos.

Fueron sus ideas las que permitieron entrenar en 5 o 6 días un modelo que, de otra manera, habría tardado semanas o meses

Hoy en día, casi todos los avances en el campo de la IA se alimentan de aquella semilla plantada por Alex Krizhevsky en 2012. De hecho, su paper original cuenta ya con más de 180.000 citas académicas, una cifra extraordinaria incluso en un campo en rápida expansión.

Un genio que eligió desaparecer

Lo curioso es que, tras alcanzar la cima del reconocimiento científico, Krizhevsky eligió retirarse de los focos. Es cierto que trabajó un tiempo en Google Brain (porque Google adquirió la startup en la que trabajaba, DNNresearch), y allí continuó investigando junto a Hinton y Sutskever, pero poco después, abandonó la compañía y desapareció tanto de la vida académica como del debate público.

En Google había trabajado tanto en Google Photos como, posteriormente, en su proyecto de coches autónomos. Pero en septiembre de 2017 dijo que había perdido interés en su trabajo y 'cogió la puerta'. Stephen Witt, en su libro "La máquina pensante" lo describe de manera precisa:

"Si Alex Krizhevsky hubiera podido volverse invisible, probablemente lo habría hecho. [...] Geoffrey Hinton, su director de tesis, apenas podía contar nada sobre él, salvo un detalle importante: *Alex era probablemente el mejor programador que jamás he conocido".

Así, mientras que hoy día Hinton sigue activo como referente y Sutskever se convirtió nada menos que en cofundador de OpenAI, Krizhevsky ha elegido un perfil mucho más discreto, hasta el punto de dejar de publicar. Su último 'paper' salió a la luz hace seis años: "ChauffeurNet: Learning to Drive by Imitating the Best and Synthesizing the Worst".

El legado de AlexNet

Recordemos que el valor de lo logrado por Krizhevsky no se limita a un modelo de IA exitoso (al fin y al cabo, fue superado hace años). Por el contrario, reside en que su trabajo introdujo varias innovaciones técnicas que siguen vigentes:

  • Uso de GPUs para acelerar el entrenamiento de redes profundas.
  • Relu (Rectified Linear Units) como función de activación, que simplificó y aceleró el aprendizaje.
  • Dropout como técnica de regularización para reducir el sobreajuste.
  • Arquitecturas de convolución profunda que se convirtieron en la base de todos los modelos de visión por computadora posteriores.

En otras palabras: 'AlexNet' no fue solo una red neuronal, fue una caja de herramientas que impulsó la era moderna del deep learning.

Un héroe anónimo de la IA

La paradoja de Alex Krizhevsky es fascinante. Sin él, la historia del aprendizaje profundo habría tardado más en despegar... y, sin embargo, su nombre no aparece en conferencias, ni da charlas TED, ni es portada de revistas.

Imagen | Editado mediante IA a partir de este original

En Genbeta | Qué son y cómo funcionan las GAN, esas redes neuronales capaces de crear rostros de personas que no existen

utm_campaign=12_Sep_2025"> Marcos Merino .