¿Qué es deep learning (aprendizaje profundo)?

El deep learning (aprendizaje profundo) es una rama del machine learning que utiliza redes neuronales con muchas capas para aprender representaciones cada vez más abstractas de los datos. La palabra «profundo» alude justamente a esa gran cantidad de capas apiladas, que permiten al modelo descubrir por sí mismo qué características son relevantes sin que un humano las defina.

Cada capa transforma la información de la anterior: en una imagen, las primeras capas detectan bordes y texturas, y las siguientes combinan eso en formas, objetos y conceptos. Este enfoque revolucionó la visión por computadora, el reconocimiento de voz y el procesamiento del lenguaje, y solo se volvió práctico gracias a las GPU y a grandes volúmenes de datos.

El deep learning es la tecnología detrás de productos como ChatGPT, los generadores de imágenes y los asistentes de voz. Los grandes modelos de lenguaje actuales se basan en una arquitectura de deep learning llamada transformer.

Preguntas frecuentes

¿Cuál es la diferencia entre machine learning y deep learning?

El deep learning es un tipo de machine learning que usa redes neuronales profundas. La diferencia clave es que aprende automáticamente las características relevantes de los datos, mientras que el machine learning clásico suele requerir que un humano las diseñe a mano.

¿Por qué el deep learning necesita tanta potencia de cálculo?

Las redes neuronales profundas tienen millones o miles de millones de parámetros que se ajustan procesando enormes cantidades de datos. Ese cálculo intensivo requiere hardware especializado como GPU o TPU para entrenarse en un tiempo razonable.