• Aarón Almansa

Cómo Aprenden las Máquinas ?

El Machine Learning (ML), es una disciplina de la Inteligencia Artificial que utiliza técnicas estadísticas para dar a las máquinas la capacidad de "aprender". Este proceso se conoce como "entrenamiento" de un algoritmo.


La capacidad de aprender es un aspecto fundamental de la "inteligencia". Hay otras competencias como la inteligencia creativa o la inteligencia emocional, pero el ML se ocupa específicamente de crear algoritmos que puedan mejorar el desempeño de una tarea a medida que “aprenden” a partir de cantidades cada vez mayores de datos.


Los principales métodos de aprendizaje que se utilizan en el ML para dotar de esta capacidad a los algoritmos son:


Aprendizaje Supervisado (Supervised Learning)


Consiste en recoger cantidades masivas de datos, procesarlos para pulirlos o transformarlos, y etiquetarlos (hacer que contengan los resultados). Una vez disponible esta información, el desarrollador o programador (es decir, un ser humano) actúa como guía para programar el algoritmo con la lógica que le permita obtener las conclusiones a las que debe llegar. El algoritmo se diseña específicamente para el caso de uso que se desee resolver.


Este tipo de aprendizaje es sencillo, cerrado y es el más común en ML, pero está muy lejos de la manera de aprender de una persona. Los humanos aprendemos principalmente de forma no supervisada y reforzada, utilizando la curiosidad y el resultado de prueba-error. También podemos aprender de forma supervisada, pero sin necesitar tantos datos, es decir, con muchas menos muestras nos es suficiente, ya que si en algo se distingue el ser humano es en su capacidad de generalizar y abstraer información.


Aprendizaje No Supervisado (Non Supervised Learning)


Con este método, una máquina aprende a identificar procesos y patrones complejos sin necesidad de que un ser humano le proporcione orientación a lo largo del proceso, y sin un conjunto de datos de entrenamiento previo.


Se aborda el problema de manera ciega, con deducciones a través de operaciones lógicas a partir de los datos recibidos y de las relaciones o posibles agrupaciones latentes entre ellos. Se evita así la necesidad de disponer de datos de referencia, pero resulta mucho más complejo su diseño.

A grandes rasgos, los algoritmos tratan de identificar en qué se parecen y en qué se diferencian los datos.

Con las 6 Ds del Machine Learning se visualizan de forma clara estas similitudes, diferencias y sus relaciones.




Aprendizaje Auto-Supervisado (Self-Supervised Learning)


Es una técnica de aprendizaje relativamente reciente en donde los datos de entrenamiento se etiquetan de forma automática. Sigue siendo aprendizaje supervisado, pero los conjuntos de datos no necesitan ser etiquetados manualmente por un humano, sino que pueden ser etiquetados, encontrando y explotando las relaciones o correlaciones entre diferentes señales de entrada.


Con este tipo de aprendizaje, las máquinas aprenden observando directamente el entorno, en lugar de que se les enseñe explícitamente a través de un conjunto de datos etiquetados como imágenes, texto, audio y cualquier otra fuente.


De alguna forma se intenta reproducir el modo de aprender de las personas, que obtienen información simultánea a través de diferentes sentidos y medios como la vista o el sonido, por ejemplo.


El objetivo es aprender de manera más general, consiguiendo máquinas que no sólo reconozcan a los animales/formas que se muestran en sus datos de entrenamiento, sino que también se adapten para poder reconocer nuevas criaturas/formas si les decimos cómo se ven.

La capacidad de aprender con este método es mucho mayor, ya que los datos son ilimitados y el feedback proporcionado por cada ejemplo es enorme.


Ejemplo

Supongamos que disponemos de un conjunto de datos donde hay hexágonos y pentágonos de color negro y de color blanco, y queremos que el algoritmo sea capaz de reconocerlos


Con el Aprendizaje supervisado, prepararíamos los datos existentes etiquetados, es decir, indicando cuales son hexágonos, cuales son pentágonos y de qué color es cada uno. El algoritmo aprendería con estos datos finitos de entrenamiento que:

– la forma con seis lados es un hexágono

– la forma con cinco lados es un pentágono

– determinados valores de luz en un píxel identifican el color negro o el color blanco


De esta manera el algoritmo aprende a distinguir sólo pentágonos blancos, pentágonos negros, hexágonos blancos, y hexágonos negros.


Con el Aprendizaje no supervisado, el algoritmo incorporaría la lógica para ser capaz de reconocer determinado número de lados y determinados píxeles de color. Así, no necesitaría datos de entrenamiento y cuando se le presenten cualquier forma, sabría reconocer los lados y colores para clasificarlos de manera correcta.


Con el Aprendizaje Auto-Supervisado el algoritmo aprendería también a través de los datos, pero no haría falta que el desarrollador indicara especificamente en ellos que una forma concreta es un hexágono, o un valor específico de color es negro, sino que este “etiquetado” se produciría de forma automática y la lógica del algoritmo identificaría las formas y colores según se vayan recibiendo los datos de entrada.


En este caso, el algoritmo no se limitaría a reconocer hexágonos o pentágonos blancos o negros, sino que sería también capaz de reconocer cuadrados azules por ejemplo.


Últimas Novedades


Los algoritmos basados en el Aprendizaje Auto-Supervisado han conseguido avances muy significativos y han tenido un enorme éxito en el procesamiento del lenguaje natural (NLP), como por ejemplo el modelo BERT de Google que es capaz de generar representaciones de texto excelentes.


El mayor obstáculo que ha habido hasta ahora en este tipo de aprendizaje, es la incapacidad para aprender simultáneamente con diferentes modalidades de datos como imágenes, voz, texto u otros. Por ejemplo, un algoritmo potente diseñado para aprender a través de imágenes no se puede aplicar directamente al aprendizaje vía texto, por lo que es difícil avanzar con varias modalidades en paralelo.


Para solventar este tema, la división de Inteligencia Artificial de Meta, ha anunciado recientemente un nuevo algoritmo de aprendizaje Auto-Supervisado que funciona para múltiples modalidades y al que han llamdo Data2vec. Este anuncio representa un nuevo paradigma y nos acerca a la construcción de máquinas que aprendan sin problemas sobre diferentes aspectos del mundo que nos rodea.


Se espera que en un futuro próximo se puedan usar videos, artículos y grabaciones de audio para aprender sobre temas complejos, lo que supone un paso enorme para conseguir que los algoritmos necesiten muy pocos datos etiquetados para realizar tareas. Este aspecto es relevante ya que a menudo resulta muy complicado (y a veces incluso imposible), recopilar datos etiquetados (por ejemplo, para entrenar modelos de reconocimiento de voz para miles de idiomas).


Este avance es un paso más hacia una Inteligencia Artificial más general y adaptable, que en un futuro próximo podrá realizar tareas mucho más allá de lo que pueden hacer los sistemas actuales.


21 visualizaciones0 comentarios

Entradas Recientes

Ver todo