Creencias en transformación: Visualizando cómo una máquina modifica sus certezas ante la experiencia
Descripción: Creencias en transformación: Visualizando cómo una máquina modifica sus certezas ante la experiencia.
Análisis interdisciplinario y emulación práctica del Perceptrón de Rosenblatt (1958) y el Perceptrón Multicapa. Visualización del aprendizaje automático, la modificación de sesgos y la gestión de la incertidumbre algorítmica, con enfoque accesible para profesionales de las ciencias sociales y el derecho.
Creencias en transformación: Visualizando cómo una máquina modifica sus certezas ante la experiencia
Marco Teórico y Aplicación
0. Antes de empezar: un vocabulario mínimo
Para el lector sin formación técnica: esta sección define cuatro palabras que aparecerán a lo largo del artículo. Si ya las conoce, puede saltearla. Si no, le tomará dos minutos y le permitirá entender todo lo demás.
1. Entrada (o «sensor»). Es un dato que la máquina recibe del mundo. En nuestro emulador, cada celda de la cuadrícula izquierda es una entrada: vale 1 si usted la pintó de negro, 0 si la dejó en blanco. Piense en ellas como los testigos que declaran en un juicio: cada uno aporta un fragmento de información.
2. Peso (o «potenciómetro»). Es la credibilidad que la máquina le otorga a cada entrada. Si un testigo suele decir la verdad, su testimonio tiene mucho peso; si suele mentir, su testimonio pesa poco (o incluso resta). En el emulador, los pesos se ven en la cuadrícula derecha: un número grande en verde significa «esta celda es evidencia fuerte a favor de Gato»; un número grande en rojo significa «esta celda es evidencia fuerte a favor de Perro». Al comenzar, todos los pesos valen cero: la máquina no le cree a nadie todavía.
3. Sesgo (o bias). Es la predisposición de la máquina antes de recibir prueba alguna. En derecho, sería la inclinación inicial de un juez antes de escuchar los testimonios. Un sesgo positivo significa «tiendo a creer que es Gato»; un sesgo negativo, «tiendo a creer que es Perro». El sesgo se ajusta con cada error, igual que un juez que, tras escuchar varios casos, reconoce sus propios prejuicios y los corrige.
4. Suma de evidencias. La máquina toma cada entrada, la multiplica por su peso, y suma todo junto con el sesgo. El resultado es un número: si es muy positivo, la máquina dice «Gato»; si es muy negativo, dice «Perro»; si está cerca de cero, la máquina duda. Esta operación —multiplicar y sumar— es toda la «inteligencia» del perceptrón de 1958. No hay magia, no hay misterio: es aritmética elemental.
5. Umbral de confianza. Es la exigencia probatoria. Si el umbral vale 2, la máquina exige al menos 2 puntos de evidencia neta para decidirse. Entre -2 y +2, dirá «no lo sé». Es el equivalente algorítmico de la duda razonable del derecho penal: si la prueba no alcanza el estándar, no hay condena. En el emulador, usted puede mover este umbral con un deslizador y ver cómo cambia la exigencia.
1. Fundamentos Conceptuales
El presente artículo constituye una complementación divulgativa del trabajo técnico publicado por Gustavo Salvini en su sitio personal, titulado «Fundamentos IA: Qué es el perceptrón» (junio de 2026). Mientras que dicho trabajo aborda la formulación matemática, el teorema de convergencia de Novikoff y las limitaciones demostradas por Minsky y Papert, el propósito de estas líneas es ofrecer una aproximación práctica y accesible para lectores sin formación técnica —abogados, cientistas sociales, humanistas— que deseen comprender, percibir y experimentar directamente el funcionamiento de la primera máquina capaz de «aprender» de la experiencia.
En 1958, el psicólogo y neurobiólogo Frank Rosenblatt publicó en Psychological Review su artículo fundacional: «The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain». Aquel trabajo no era sólo teoría: Rosenblatt había construido una máquina física, el Mark I Perceptron, capaz de distinguir patrones visuales simples mediante el ajuste automático de sus conexiones internas.
La idea central es extraordinariamente simple y guarda un parecido fascinante con la forma en que los seres humanos formamos nuestras primeras impresiones: la máquina parte de un estado de total ignorancia (todos sus «potenciómetros» internos en cero, como un juez sin prejuicios). Cuando se le muestra un ejemplo y se le indica la respuesta correcta, si se equivoca, ajusta sus conexiones en la dirección que corrige el error, igual que nosotros reforzamos o debilitamos una creencia tras una experiencia nueva. No requiere «entrenar un modelo» en el sentido contemporáneo —no hay gradientes, ni retropropagación, ni grandes volúmenes de datos—: basta con dos o tres ejemplos para que la máquina forme una memoria visualizable, transparente y debatible.
2. Desarrollo Metodológico
Se evaluaron dos lenguajes para la implementación del emulador: Python y JavaScript. La elección recayó sobre JavaScript embebido en HTML por razones prácticas vinculadas al contexto de uso previsto: computadoras de escasos recursos, usuarios sin conocimientos técnicos y necesidad de una percepción visual inmediata del aprendizaje.
JavaScript permite que un único archivo de menos de 5 KB se ejecute en cualquier navegador moderno sin instalación previa. Python, aunque excelente para cálculo matemático, exigiría la instalación de un intérprete y, para lograr interactividad visual, de librerías adicionales como tkinter o pygame, lo cual introduce complejidad innecesaria para el objetivo divulgativo.
2.1. Enfoque Inicial
El emulador replica los tres componentes originales del Mark I descritos por Rosenblatt: las Unidades S (sensoriales, una cuadrícula de 3×3 que oficia de «retina»), las Unidades A (asociativas, los nueve potenciómetros con pesos ajustables más un valor de sesgo o bias) y la Unidad R (de respuesta, la salida binaria). La regla de aprendizaje implementada es exactamente la de Rosenblatt (1958): si la máquina acierta, no hace nada; si se equivoca, suma o resta los valores de entrada a los pesos según corresponda, y también ajusta el sesgo, ese "prejuicio inicial" que inclina la balanza antes de ver prueba alguna.
2.2. Implementación interactiva
A continuación se presenta el emulador funcionando directamente en esta página. Los pesos se visualizan en tiempo real: verde indica que la máquina aprendió que ese píxel es evidencia a favor de la categoría «Gato»; rojo indica evidencia a favor de «Perro» (o en contra de «Gato»); gris indica indiferencia. El sesgo aparece como una celda adicional etiquetada como b.
🧠 El Perceptrón de Rosenblatt (1958)
Dibuja una forma en la cuadrícula izquierda. Luego, enseña a la máquina qué es.
Unidades S (Entrada)
Haz clic para activar/desactivar
Unidades A (Pesos + Sesgo)
La máquina ajusta esto automáticamente
¿Qué es este dibujo?
Con umbral 2, la máquina necesita al menos 2 puntos de evidencia neta para decidir. Entre -2 y 2, dirá «no lo sé» (duda razonable).
3. Casos de Estudio: el Perceptrón Simple
Cómo usarlo (Guía práctica). Esta sección está pensada para cualquier usuario que carezca de formación técnica. No se requiere ningún conocimiento de programación: basta con interactuar con el emulador embebido más arriba, siguiendo los pasos que se describen a continuación.
3.1. Paso 1 — Enseñar el primer concepto (el «Gato»)
En la cuadrícula izquierda (Unidades S), haga clic sobre las celdas para dibujar una forma simple, por ejemplo una «L» (active la columna izquierda completa y la celda inferior derecha). A continuación, pulse el botón verde «🐱 Enseñar que es un GATO». La máquina, que al inicio no sabe nada, se equivocará (o acertará por azar) y ajustará sus potenciómetros. Observe la cuadrícula derecha: verá cómo las celdas se tiñen de verde precisamente en la forma de la «L». Esos verdes son la memoria de la máquina: «cuando vea píxeles aquí, pensaré en un Gato». El sesgo también se habrá ajustado, como un juez que empieza a inclinarse por una de las partes.
3.2. Paso 2 — Enseñar el segundo concepto (el «Perro»)
Pulse «Borrar Dibujo». Ahora dibuje una forma distinta, por ejemplo una «T» invertida (fila superior completa más la celda central). Pulse el botón azul «🐶 Enseñar que es un PERRO». La máquina ajustará nuevamente sus pesos y verá aparecer celdas en rojo: ha aprendido que ciertos píxeles son evidencia en contra del Perro (o a favor del Gato). Los pesos negativos son tan informativos como los positivos: representan "pruebas de descargo".
3.3. Paso 3 — Probar el aprendizaje y la generalización
Borre el dibujo y trace una forma nueva, que se parezca un poco a la «L» original pero no sea idéntica. Pulse «🔍 PROBAR». La máquina sumará los valores de los píxeles activos multiplicados por los pesos que ella misma ajustó, sumará el sesgo, comparará el resultado con su umbral interno y emitirá un veredicto. Si la forma se parece más a la «L», dirá «Gato»; si se parece más a la «T invertida», dirá «Perro». La máquina ha generalizado a partir de apenas dos ejemplos, como un estudiante que infiere una regla a partir de un par de casos.
3.4. Lo que el usuario percibe: transparencia radical
A diferencia de las redes neuronales contemporáneas —que requieren grandes volúmenes de datos, potencia de cálculo y cuyos pesos internos son incomprensibles incluso para sus diseñadores—, aquí el usuario ve cómo la máquina piensa. La cuadrícula derecha es una representación literal de la «mente» del perceptrón: cada celda verde o roja es una creencia adquirida, y el sesgo es su predisposición inicial. Esta transparencia es precisamente lo que se perdió en el paso del perceptrón clásico al deep learning moderno.
3.5. La duda en la máquina: de 1958 a la actualidad
Si dibuja una forma completamente distinta a las enseñadas —por ejemplo, una diagonal— y pulsa «🔍 PROBAR», es muy probable que la máquina responda «🤷 NO LO SÉ». Esto ocurre cuando la suma de evidencias a favor y en contra casi se cancela, indicando insuficiencia de datos para tomar una decisión, de forma análoga a la "duda razonable" en un proceso judicial.
La realidad histórica (1958): En el Mark I original de Rosenblatt, la incertidumbre no existía como concepto operativo. Su función de activación era un «escalón» rígido: si la suma matemática era ≥ 0, la máquina «disparaba» (decía Gato); si era < 0, no lo hacía (decía Perro). Ante un dibujo ambiguo o desconocido, la máquina no dudaba: emitía un veredicto basado en el más mínimo sesgo residual de sus pesos (por ejemplo, una suma de 0.001 se interpretaba como una certeza absoluta de ser un Gato). Esta ausencia de "no lo sé" es comparable a un testigo que nunca admite no recordar un detalle.
Consecuencias históricas: Esta incapacidad para expresar duda tuvo un costo elevado. Cuando el perceptrón se enfrentaba a problemas complejos o datos no linealmente separables, ofrecía respuestas erróneas con total confianza, como un algoritmo de recomendación que siempre sugiere contenido sin medir su fiabilidad. Esta «sobredeterminación» fue uno de los argumentos centrales de Minsky y Papert (1969) para señalar las limitaciones del modelo, contribuyendo directamente al primer «invierno de la Inteligencia Artificial», donde se retiró gran parte del financiamiento a la investigación en el campo.
La modificación pedagógica: La incorporación del «umbral de confianza» y el deslizador en este emulador es una extensión didáctica, no una réplica histórica. Su propósito es hacer visible lo invisible: demostrar que la decisión no es mágica, sino el resultado de una suma de evidencias. Permitimos que la máquina exprese insuficiencia de datos para que el usuario comprenda la diferencia entre una decisión fundada y una conjetura. De hecho, al mover el deslizador se puede ver exactamente cómo cambia la exigencia probatoria.
Perspectiva actual: En la inteligencia artificial contemporánea, esta noción es fundamental. Los modelos modernos no emiten etiquetas binarias secas, sino distribuciones de probabilidad (por ejemplo, «85% Gato, 15% Perro»). En ámbitos críticos como el derecho, la medicina o la administración pública, los sistemas de vanguardia incorporan umbrales de abstención: si la confianza cae por debajo de cierto nivel, el algoritmo está programado para delegar la decisión a un humano. Esta capacidad de «saber que no se sabe» es hoy la base del debido proceso algorítmico y la explicabilidad que la sociedad exige a las máquinas.
4. Implicancias y Alcance
El emulador presentado tiene un alcance deliberadamente acotado: ilustra el principio fundacional del aprendizaje automático, pero no resuelve problemas del mundo real. Esta limitación no es un defecto de la implementación, sino una propiedad matemática del propio perceptrón de una sola capa, demostrada por Minsky y Papert en 1969.
1 Separabilidad lineal: el perceptrón sólo puede aprender categorías que puedan separarse mediante una línea recta (o un hiperplano, en dimensiones superiores). El problema XOR —demostrar que dos entradas son distintas— le resulta imposible, como detalló Salvini en su artículo. En términos sociales, es como intentar clasificar personas con dos rasgos que no admiten una frontera simple.
2 Teorema de convergencia de Novikoff (1962): si los datos son linealmente separables, la regla de Rosenblatt garantiza que la máquina encontrará una solución correcta en un número finito de ajustes. Esta elegancia matemática es la que justificó el entusiasmo original de Rosenblatt.
3 Recursos computacionales: el emulador ejecuta nueve multiplicaciones y sumas por predicción. Funciona sin inconvenientes en computadoras de hace quince años, en netbooks de bajos recursos o en dispositivos móviles antiguos, cumpliendo el objetivo de accesibilidad planteado.
Desde una perspectiva interdisciplinaria, el perceptrón de Rosenblatt plantea cuestiones que exceden la informática: ¿qué significa «aprender»? ¿Puede una máquina tener «creencias» (sus pesos) que se modifiquen por experiencia? Estas preguntas, formuladas en 1958 en una revista de psicología, siguen vigentes hoy y son de particular interés para las ciencias sociales y el derecho, ante el avance de sistemas algorítmicos que toman decisiones con impacto sobre personas.
5. Perspectivas Futuras
El perceptrón simple no desapareció: evolucionó. La superación de sus limitaciones dio lugar al perceptrón multicapa (MLP) y, eventualmente, a las arquitecturas que hoy dominan la inteligencia artificial contemporánea. Comprender el perceptrón original es, en palabras de Salvini, «entender el alfabeto del deep learning».
- Proyección 1 — Valor pedagógico: emuladores como el aquí presentado pueden incorporarse en programas de alfabetización digital dirigidos a profesionales del derecho, la sociología y las humanidades, para que comprendan los fundamentos de los sistemas que regulan.
- Proyección 2 — Extensión didáctica: el código puede ampliarse para incluir categorías adicionales, cuadrículas de mayor resolución o la visualización del «invierno de la IA» provocado por las críticas de Minsky y Papert.
- Proyección 3 — Reflexión ética: la transparencia del perceptrón (cuyos pesos son interpretables) contrasta con la opacidad de los modelos contemporáneos. Esta diferencia es central en los debates actuales sobre explicabilidad algorítmica y debido proceso en decisiones automatizadas.
6. El problema XOR: cuando una sola opinión no basta
Para el lector sin formación técnica: esta sección presenta el problema que hizo crisis al perceptrón de Rosenblatt. Se explica con una analogía cotidiana antes de mostrar la matemática. Si ya conoce el problema XOR, puede avanzar directamente a la sección 7.
6.1. Una analogía judicial
Imaginemos un juez que debe decidir si un acusado es culpable o inocente. Dispone de dos testimonios:
- Testigo A: «Vi al acusado en la escena del crimen» (sí / no).
- Testigo B: «El acusado tiene coartada verificada» (sí / no).
La regla razonable es: el acusado es culpable solo si exactamente uno de los testimonios es verdadero. Si ambos dicen la verdad (vio la escena y tiene coartada), hay contradicción y no se puede condenar. Si ambos mienten (no lo vio y no tiene coartada), tampoco hay prueba suficiente. Solo cuando uno afirma y el otro niega, la balanza se inclina.
Esta regla —que en lógica se llama XOR (o exclusivo)— parece sencilla de enunciar. Pero el perceptrón de 1958 es incapaz de aprenderla, por más ejemplos que le demos. Minsky y Papert lo demostraron matemáticamente en 1969.
6.2. ¿Por qué el perceptrón simple no puede?
Recordemos lo que hace el perceptrón: toma las entradas, las multiplica por sus pesos, suma todo y compara con un umbral. Esto equivale a trazar una línea recta en un plano que separa los casos positivos de los negativos.
En el problema XOR, los cuatro casos posibles son:
- (0, 0) → 0 (inocente)
- (0, 1) → 1 (culpable)
- (1, 0) → 1 (culpable)
- (1, 1) → 0 (inocente)
Si dibujamos estos cuatro puntos en un plano, veremos que los casos «culpables» están en esquinas opuestas, y los «inocentes» en las otras dos esquinas opuestas. No existe ninguna línea recta que separe a los culpables de los inocentes. Cualquier recta que trace dejará al menos un punto del lado equivocado. Por eso el perceptrón simple, que solo puede trazar rectas, fracasa.
6.3. El emulador comparador
A continuación, un pequeño emulador interactivo permite comprobar esto. Active las casillas A y B (1 = verdadero, 0 = falso) y pulse «Probar XOR». Los números que verá (20, -20, -10, etc.) son los pesos y sesgos que la red aprendió durante un entrenamiento previo. Pase el cursor sobre cualquier número para ver qué representa. Verá cómo el perceptrón simple siempre falla, mientras que el perceptrón multicapa —que veremos en detalle en la sección siguiente— acierta.
⚡ Comparador: Perceptrón Simple vs. Perceptrón Multicapa en XOR
Marque las casillas A y B. El resultado esperado es 1 solo si exactamente una es verdadera.
Una sola neurona, una sola opinión
Resultado: --
No puede trazar la frontera correcta.Un equipo de especialistas coordinados
Resultado: --
Capa oculta con 2 neuronas.La solución al problema XOR requiere introducir neuronas intermedias —una «capa oculta»— que transformen el espacio de entrada en uno donde sí sea posible trazar una línea separadora. Es como pasar de un juez solitario a un equipo de especialistas: cada especialista evalúa un aspecto distinto del caso, y un coordinador combina sus dictámenes para llegar a la respuesta final. Esto es exactamente lo que hace el Perceptrón Multicapa, que veremos a continuación.
7. El Perceptrón Multicapa: un equipo de especialistas
Para el lector sin formación técnica: esta sección presenta un emulador visual del Perceptrón Multicapa (MLP), la evolución natural del perceptrón de Rosenblatt. Verá la red neuronal completa: las neuronas de entrada, dos neuronas especialistas (capa oculta) y la neurona de salida que combina sus dictámenes, con sus conexiones y cálculos paso a paso.
7.1. La arquitectura: de un juez solitario a un equipo de especialistas
El Perceptrón Multicapa introduce una innovación sencilla pero poderosa: neuronas intermedias entre la entrada y la salida. Piense en ellas como un grupo de especialistas que analizan la información antes de que se tome una decisión final:
- Capa de entrada: los datos brutos (en nuestro caso, A y B).
- Capa oculta: dos «especialistas» que procesan la información. Cada uno examina los datos desde una perspectiva diferente y emite su propio dictamen.
- Capa de salida: el «coordinador» que combina los dictámenes y produce la respuesta final.
Cada neurona —sea de entrada, oculta o de salida— hace exactamente lo mismo que el perceptrón simple: multiplica sus entradas por sus pesos, suma todo y aplica una función de activación. La diferencia es que ahora hay varias neuronas trabajando en equipo, cada una especializada en un aspecto distinto del problema.
7.2. El emulador visual del MLP
A continuación, un emulador interactivo muestra la red neuronal completa. Active las casillas A y B, pulse «Calcular», y observe cómo la señal viaja desde la entrada, pasa por los dos especialistas de la capa oculta, y llega al coordinador. Los números que aparecen en cada neurona son sus activaciones: lo que esa neurona «piensa» tras procesar la información que recibe. Las conexiones más gruesas indican pesos más fuertes; las verdes son pesos positivos (evidencia a favor), las rojas son pesos negativos (evidencia en contra).
🏛️ El Perceptrón Multicapa (MLP) — Un equipo de especialistas
Active A y/o B, y observe cómo la señal viaja por la red. Los pesos están preentrenados para resolver XOR. Pase el cursor sobre los números para ver qué representan.
Entrada
Capa Oculta (Especialistas)
Salida (Coordinador)
Instrucciones: Active las casillas A y/o B arriba, luego pulse «Calcular paso a paso». Verá cómo cada neurona procesa la información y cómo el equipo de especialistas llega a la respuesta final.
7.3. ¿Qué aprende cada especialista?
Si experimenta con el emulador, notará algo fascinante: cada neurona de la capa oculta se especializa en un aspecto distinto del problema. En el caso XOR con los pesos preentrenados del emulador:
- Especialista 1 se activa solo si A=1 y B=0. Detecta el caso «A es verdadero, B es falso».
- Especialista 2 se activa solo si A=0 y B=1. Detecta el caso «B es verdadero, A es falso».
El coordinador combina ambos dictámenes: si algún especialista se activó (pero no ambos), emite «1» (XOR = 1); si ambos se activaron o ninguno se activó, emite «0» (XOR = 0). La combinación de dictámenes especializados resuelve lo que una sola neurona no podía. Esta es la idea fundamental del deep learning: muchas capas de transformaciones simples, combinadas, resuelven problemas complejos.
7.4. Las funciones de activación: ReLU y sigmoide
En el emulador, las neuronas de la capa oculta usan una función llamada ReLU (del inglés Rectified Linear Unit): si la suma es negativa, la neurona se «apaga» (vale 0); si es positiva, la neurona «deja pasar» el valor tal cual. Es como un especialista que solo emite dictamen cuando tiene evidencia a favor; si no la tiene, permanece inactivo.
La neurona de salida usa una función llamada sigmoide: comprime cualquier número al rango entre 0 y 1, interpretándose como una probabilidad o grado de certeza. Es como un coordinador que no emite un veredicto binario seco, sino un grado de certeza: «estoy un 92% seguro de que la respuesta es 1». Esta capacidad de expresar grados de certeza es lo que diferencia al MLP contemporáneo del perceptrón rígido de 1958.
7.5. ¿Cómo se entrenan estos pesos?
En el emulador, los pesos del MLP están preentrenados: ya están ajustados para resolver XOR correctamente. En la práctica, estos pesos se obtienen mediante un algoritmo llamado retropropagación (backpropagation), que generaliza la regla de Rosenblatt a redes con múltiples capas. La idea es similar: si la red se equivoca, el error se «propaga hacia atrás» desde la salida hasta la entrada, ajustando todos los pesos en la dirección que reduce el error. Pero este algoritmo, descubierto recién en 1986 por Rumelhart, Hinton y Williams, tardó casi tres décadas en popularizarse —de ahí el «invierno de la IA» entre 1970 y 1980—.
📚 Enlaces de interés
- Gustavo Salvini, «Fundamentos IA: Qué es el perceptrón» (2026) — Artículo técnico complementario
- Rosenblatt, F. (1958). «The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain». Psychological Review, 65(6), 386–408.
- Minsky, M. & Papert, S. (1969). Perceptrons: An Introduction to Computational Geometry. MIT Press.
- Novikoff, A. B. J. (1962). «On convergence proofs on perceptrons». Proceedings of the Symposium on the Mathematical Theory of Automata.
- Rumelhart, D. E., Hinton, G. E. & Williams, R. J. (1986). «Learning representations by back-propagating errors». Nature, 323, 533–536.
- «More Consideration for the Perceptron» — Revisión contemporánea en arXiv (2024).
Compromiso con la excelencia.