Sesión 3: Algoritmos de IA

Introducción a la IA

▶

Video de la sesión

En desarrollo.

Los videos y el texto de esta sesión son complementarios. Los videos amplían el contexto histórico y conceptual; el texto va a los mecanismos y te pone a interactuar con ellos. Encontrarás ideas en los videos que el texto no repite exactamente. ¡Disfruta de esta dinámica!

Introducción

En esta sesión nos enfocaremos en darte un panorama global de los algoritmos más conocidos de la inteligencia artificial, y te ofreceremos una guía para saber cuándo debes usar cada uno de ellos, y por qué.

¿Por qué es importante aprender sobre distintos algoritmos? Empecemos con una analogía: cuando un carpintero va a la obra, lleva consigo una caja con múltiples herramientas. Del mismo modo, un médico recurre a distintos análisis según la sintomatología del paciente y el tipo de información que necesita obtener. Con la inteligencia artificial ocurre algo similar: existen muchos algoritmos y métodos, y cada uno resulta especialmente útil para ciertos tipos de problemas.

En esta sesión nos enfocaremos en 6 ejemplos representativos de modelos, algoritmos y arquitecturas de aprendizaje automático, con el objetivo de ofrecerte una visión general de cómo se organizan y para qué sirve cada uno.

Antes de elegir un método, es fundamental reconocer la naturaleza del desafío. Algunos sirven para predecir números, otros para clasificar imágenes o descubrir grupos en datos sin etiquetas. Entender qué tipo de problema tienes delante es lo que marca la diferencia al trabajar con IA.

La IA tiene muchas herramientas— aprendamos a usarlas poco a poco.

¿Por qué no existe un solo algoritmo para todo?

En inteligencia artificial, la elección del método influye directamente en el tipo de resultado que podemos obtener. Algunos algoritmos están pensados para prever valores, otros para reconocer patrones, otros para reunir datos con rasgos similares en grupos. Cada uno responde mejor a ciertos problemas y presenta limitaciones en otros.

Por eso, conocer distintas clases de algoritmos no consiste solo memorizar sus nombres. También implica entender qué hace cada uno, qué tipo de datos necesita y qué clase de respuesta puede ofrecer. Esa diferencia es importante porque, en la práctica, un método adecuado puede simplificar el análisis, mientras que uno poco apropiado puede volverlo más difícil o menos fiable.

Pensemos, por ejemplo, en la regresión lineal. Este método es útil cuando se quiere estimar una cantidad continua, como el precio de una vivienda o la evolución de una variable económica. En cambio, si el objetivo es separar correos entre “spam” y “no spam”, lo adecuado es un enfoque de clasificación. Y si lo que buscamos es descubrir grupos dentro de un conjunto de datos sin etiquetas, entonces tiene más sentido recurrir a técnicas de agrupamiento, como K-Means.

También hay casos en los que algunos modelos resultan desproporcionados para el tipo de tarea a resolver. Un transformer puede ser una opción potente para procesar texto, pero no siempre es la elección más sensata cuando se trata de problemas sencillos, estructurados y con pocos datos. En esos casos, un modelo más simple puede ofrecer resultados igual de buenos, con menos costo de entrenamiento, menos complejidad y mayor facilidad de interpretación.

A lo largo de esta sesión revisaremos precisamente eso: qué tipo de problemas resuelve mejor cada enfoque y qué criterios ayudan a elegir entre ellos. Comprender esa relación entre problema y método es la base para trabajar con inteligencia artificial de forma más rigurosa y más eficaz.

Un mapa de métodos

Antes de elegir un algoritmo, conviene detenerse un momento y mirar el problema con calma. En inteligencia artificial, la selección del método depende sobre todo de dos cosas: si los datos ya tienen respuestas correctas y qué tipo de resultado queremos obtener.

Esta distinción puede parecer simple, pero en realidad organiza gran parte del campo. No es lo mismo trabajar con ejemplos ya clasificados que con datos sin etiquetar, ni es igual predecir una cantidad continua que identificar una categoría, descubrir grupos ocultos o decidir una acción dentro de un entorno.

Por eso, una buena forma de orientarse es empezar con dos preguntas básicas:

¿Tus datos ya tienen respuestas correctas etiqutadas?

Si alguien ya etiquetó los ejemplos con la respuesta correcta, estás en el mundo del aprendizaje supervisado.

¿Qué forma tiene la salida que necesitas obtener?

Puede ser un número, una categoría, un grupo emergente o una acción dentro de un entorno.

Pregunta 1: ¿Tienes respuestas correctas etiquetadas en tus datos?

Sí, alguien ya etiquetó los ejemplos con la respuesta correcta. Eso se llama aprendizaje supervisado.
No, los datos no tienen etiqueta o el sistema aprende actuando en un entorno. Puede ser aprendizaje no supervisado o por refuerzo.

Pregunta 2: ¿Qué forma tiene la salida?

¿Un número continuo? → Regresión
¿Una categoría? → depende de si trabajas con texto, imágenes o datos estructurados
¿Grupos emergentes? → Clustering
¿Una acción que cambia dependiendo del entorno? → Refuerzo

Este esquema no pretende tener la respuesta a todos los problemas. Su función es ayudarte a reconocer el punto de partida correcto, porque elegir bien el tipo de problema es el primer paso para escoger el método adecuado.

Ejemplo paso a paso

Problema

"Quiero predecir cuánto tardará un pedido de UberEats."

Pregunta 1

¿Tienes respuestas etiquetadas? Sí — un historial de tiempos de entrega de UberEats de los últimos años.

Pregunta 2

¿Qué forma tiene la salida? Un número continuo (minutos).

Algoritmo

Regresión lineal. Predice un número a partir de datos etiquetados.

6 modelos, algoritmos y arquitecturas de aprendizaje automático

Ahora sí, pasemos de la orientación general a los casos concretos. En las siguientes páginas recorreremos los seis métodos del mapa anterior para entender qué problema aborda cada uno, qué tipo de salida produce y qué límites conviene tener presentes al aplicarlo.

Regresión lineal

La regresión lineal parte de una pregunta sencilla: si contamos con ejemplos previos y conocemos su resultado, ¿podemos encontrar una recta que los resuma razonablemente bien y usarla después para predecir nuevos casos? Este método no memoriza cada dato por separado, sino que aprende los parámetros que definen esa relación y los utiliza para generalizar.

📈

Cuando la salida es un número continuo

¿Para qué sirve?

Predecir un valor continuo a partir de datos variables de entrada.

¿Dónde lo ves?

Tiempo de llegada en Uber, vistas estimadas de un video, consumo eléctrico esperado.

¿Cuál es su limitación?

Funciona mejor cuando el patrón observado se parece a una recta. Si el patrón de la relación entre los datos de entrada es curvo, la recta se queda corta.

Árbol de decisión — el juego de las 20 preguntas

¿Alguna vez jugaste a “Adivina el personaje”? Una persona piensa en alguien y tú intentas descubrir quién es haciendo preguntas que solo admiten respuesta de sí o no: “¿Es hombre?”, “¿Tiene más de 40 años?”, “¿Es famoso?”. Con preguntas bien elegidas, cada respuesta te acerca un poco más a la solución.

Un árbol de decisión funciona de manera parecida, pero con datos. A partir del conjunto de entrenamiento, el algoritmo busca cuál es la primera pregunta que más ayuda a separar los ejemplos en grupos distintos. Después elige otra pregunta para refinar aún más esa separación, y continúa así hasta llegar a una clasificación final.

Ejemplo: si quisiéramos construir un clasificador de spam, el árbol podría aprender reglas como estas:

¿Contiene la frase “haz clic aquí para ganar”? → sí, probablemente es spam
¿El remitente está en tus contactos? → sí, es menos probablemente que sea spam
¿El asunto tiene más de 3 signos de exclamación? → sí, la probabilidad de que sea spam aumenta

Nadie programa esas reglas una por una. El árbol las aprende a partir de correos ya etiquetados, y usa esa experiencia para clasificar mensajes nuevos.

El árbol aprendió estas preguntas solo. Nadie escribió las reglas a mano.

🌳

Cuando quieres clasificar datos estructurados

¿Para qué sirve?

Clasificaciones con datos estructurados en forma de tabla: filas, columnas y variables claras.

¿Dónde lo ves?

Filtros de spam, decisiones de crédito, triage básico, detección de fraude simple.

¿Cuál es su limitación?

Puede sobreajustarse y fallar cuando los datos nuevos son muy distintos a los del entrenamiento.

K-Means

El clustering (agrupamiento) surge cuando tenemos muchos ejemplos, como canciones, compras o registros de pacientes, pero nadie los ha etiquetado. En ese escenario no buscamos una respuesta previa, sino descubrir si existen agrupaciones naturales a partir de las similitudes entre los elementos. K-Means aborda este problema colocando varios centros provisionales dentro del conjunto de datos, como si marcara puntos de referencia iniciales. A partir de ahí, calcula qué centro está más cerca de cada observación y le asigna esa observación a ese grupo. Después vuelve a calcular la posición de cada centro, esta vez usando el promedio de los puntos que quedaron asignados a él. Con los centros ya recalibrados, repite el mismo proceso: reasigna los puntos, recalcula los centros y vuelve a comparar. La idea es ir corrigiendo poco a poco la ubicación de esos centros hasta que los grupos apenas cambian y la partición final se vuelve estable.

🔵

Cuando quieres descubrir agrupaciones a partir de datos sin etiquetas

¿Para qué sirve?

Encontrar una estructura natural en datos sin respuestas predefinidas.

¿Dónde lo ves?

Segmentación de usuarios, agrupación de canciones, organización de noticias o clientes similares.

¿Cuál es su límite?

Tú decides cuántos grupos quieres (`k`). Si eliges mal ese número, los grupos dejan de tener sentido.

Aprendizaje no supervisado

K-Means: agrupar canciones sin etiquetas

Observa cómo el algoritmo toma una nube de canciones, propone centros iniciales y reorganiza grupos hasta encontrar una estructura estable.

Puntos sin etiqueta Centros iniciales Grupos emergentes

Vista previa del clustering

Primero solo hay canciones como puntos en una nube. Después el algoritmo propone centros y reorganiza los grupos hasta estabilizarlos.

Qué estás viendo

Qué significa

Redes neuronales convolucionales (CNN)

Al mirar una fotografía de un gato, normalmente no procesamos toda la imagen de golpe. Vamos reconociendo primero elementos sencillos, como bordes y contornos, y después otros más complejos, como texturas, formas y objetos completos. Las redes neuronales convolucionales siguen una lógica similar: sus capas aprenden a detectar rasgos visuales cada vez más complejos, desde detalles básicos hasta patrones que permiten identificar lo que aparece en la imagen.

Arquitectura de una Red Neuronal Convolucional: imagen de entrada, capas convolucionales y de pooling para extracción de características, y capas densas para clasificación

👁

Cuando el problema es visual

¿Para qué sirve?

Clasificar o detectar patrones en imágenes y video.

¿Dónde lo ves?

Face ID, filtros de Instagram, moderación de contenido, asistentes de diagnóstico por imagen.

¿Cuál es su limitación?

Necesita enormes cantidades de imágenes etiquetadas y mucho capacidad computacional. También puede fallar ante distorsiones inesperadas.

Transformers — el cerebro detrás de ChatGPT

¿No habíamos dicho que ChatGPT usa redes neuronales? Sí. Los transformers son una arquitectura de red neuronal que mantiene las ideas de pesos, neuronas y entrenamiento por retropropagación (backpropagation) que viste en la sesión 2. La diferencia está en la forma en que organiza la información y en el mecanismo que usa para procesar secuencias completas.

Arquitectura de un Transformer Encoder: tokens de entrada, bloque de auto-atención donde cada token atiende a todos los demás, red neuronal densa FFN, y predicciones de salida. El proceso se repite N veces.

Cuando alguien te manda un mensaje como “¿ya llegaste?”, entiendes que esa frase depende de un contexto previo, de un destino implícito y de una intención concreta. Un transformer intenta hacer algo parecido con el texto: procesa la secuencia completa y estima qué palabras son más relevantes para interpretar cada una de ellas. Ese mecanismo se llama atención.

En lugar de leer una oración solo de izquierda a derecha, el modelo compara palabras entre sí y aprende relaciones que pueden estar muy separadas dentro del texto. Por eso puede traducir, resumir, completar frases o responder preguntas con más contexto que muchos modelos anteriores.

💬

Cuando el contexto de una secuencia importa

¿Para qué sirve?

Traducción, generación de texto, resumen, chatbots, asistentes de código y otras tareas de lenguaje.

¿Dónde lo ves?

ChatGPT, Google Translate, Copilot, asistentes que completan frases o redactan respuestas.

¿Cuál es su limitación?

Es costoso de entrenar, puede alucinar y hereda sesgos del texto con el que aprendió.

Aprendizaje por refuerzo

El aprendizaje por refuerzo aborda un tipo de problema diferente: ¿qué ocurre cuando no contamos con datos etiquetados, pero sí podemos dejar que un sistema actúe, observe el resultado de sus acciones y aprenda a corregirse? Aquí el objetivo no es predecir un valor ni asignar una categoría, sino aprender a tomar decisiones paso a paso. Un agente actúa sobre un entorno, recibe una recompensa o una penalización según lo que hizo, y poco a poco ajusta su forma de actuar para obtener mejores resultados.

🎮

Cuando la IA aprende actuando

¿Para qué sirve?

Problemas donde no hay respuestas etiquetadas, pero sí un entorno para probar acciones y observar consecuencias.

¿Dónde lo ves?

Videojuegos, robótica, control industrial, optimización de rutas y simuladores complejos.

¿Cuál es su limitación?

Necesita millones de intentos y, casi siempre, un simulador seguro. Pasar de una simulación al mundo real sigue siendo difícil.

Aprendizaje por refuerzo

Mario aprende a saltar

Un agente aprende a jugar Mario repitiendo acciones y observando cuáles le resultan y cuáles no.

La mecánica

EstadoAgente + hueco + meta

AcciónCorrer o saltar

RecompensaPositiva o negativa

Vista previa del ciclo de refuerzo

Verás tres intentos. Lo importante no es solo si cruza o no, sino cómo la recompensa modifica la política del agente.

Panel del agente

Intento

Estado actual

Acción

Recompensa

Puntos acumulados

Política

Qué estás viendo

Qué significa

Actividad

A continuación encontrarás seis problemas cotidianos. Para cada uno, selecciona el método o arquitectura que mejor encaja según el mapa de la sesión. Cuando hayas asignado todos, verifica tus respuestas.

Actividad — mapa de métodos

¿Qué método usarías para cada problema?

Asigna un algoritmo a cada escenario. Recuerda las dos preguntas del mapa: ¿tienes respuestas etiquetadas? ¿qué tipo de salida necesitas?

🚗 Uber

📧 Spam

🎵 Spotify

📸 Video

🌐 Traducción

🎮 Bot

Vista previa de la actividad

Seis problemas esperan tu clasificación. Abre la actividad para empezar.

Qué estás viendo

Seis problemas cotidianos. Tu tarea es asignar el algoritmo de IA más apropiado a cada uno.

Qué significa

El objetivo es aprender a identificar qué tipo de problema se resuelve mejor con qué tipo de método.

💭

Antes de ver la tabla comparativa: ¿cuál sería la primera pregunta que harías antes de elegir un modelo de IA para un problema que encuentres en tu día a día?

Tabla comparativa

Aquí tienes un resumen de la sesión.

Método	Tipo de problema	Analogía	App que la usa	Limitación
Regresión lineal	Predecir un número continuo	Estimar algo con una recta	Uber, Google Maps	Solo captura relaciones lineales simples
Árbol de decisión	Clasificar con datos estructurados	Juego de preguntas de sí o no	Spam, riesgo, triage	Puede sobreajustarse y fallar fuera de distribución
K-Means	Agrupar sin etiquetas	Buscar zonas parecidas en una nube de puntos	Spotify, Netflix, segmentación de mercado	Tú eliges cuántos grupos quieres
CNN	Clasificar imágenes o video	Capas que ven bordes → formas → objetos	Face ID, filtros, moderación	Necesita muchos datos visuales etiquetados
Transformer	Entender o generar secuencias	Autocompletado que sí usa contexto	ChatGPT, Google Translate, Copilot	Es costoso y puede alucinar
Refuerzo	Aprender a actuar por ensayo y error	Practicar hasta que la recompensa mejore	Videojuegos, robótica, control y optimización	Necesita simulación y muchísimos intentos

Reflexión · 5 min

Actividad de reflexión

Elige una app que usas todos los días. ¿Qué tipo de problema resuelve su IA? Usa el mapa de las dos preguntas para ubicarla.
Piensa en un problema que quisieras resolver con IA. Puede ser algo de tu escuela, tu hobby o tu comunidad. ¿Qué método usarías? ¿Qué datos necesitarías?
Las limitaciones importan. Si tuvieras que explicarle a alguien por qué un transformer no es la solución a todo, ¿qué le dirías?
Condénsalo en una regla. Si tuvieras que resumir esta sesión en una frase práctica, ¿cuál sería?

No hay respuestas correctas o incorrectas. Lo importante es que el mapa empiece a formar parte de tu manera de pensar sobre la IA.

La idea central de esta sesión

Idea central · Sesión 3

El algoritmo correcto no es el más complejo ni el más famoso. Es el que mejor encaja con el tipo de problema, la forma de la salida y los datos disponibles. La clave está en aprender a formular la pregunta adecuada para elegir la mejor herramienta.

Recursos para explorar más sobre el tema

R2D3 — Visual intro to machine learning
Scrollytelling visual para entender cómo un árbol de decisión construye sus preguntas paso a paso.
MLU-Explain
Colección de ensayos visuales sobre algoritmos clave de machine learning.
Transformer Explainer
GPT-2 en vivo en tu navegador para observar atención, contexto y predicción de tokens.
Visualizing K-Means
Demo interactiva para ver cómo el clustering mueve centros y reagrupa puntos paso a paso.
TensorFlow Playground
Experimenta con redes neuronales y observa cómo cambian sus fronteras de decisión.
Elements of AI
Curso introductorio gratuito en español con contexto amplio sobre varios de los métodos que viste aquí.