Machine Unlearning

Aarón Almansa
15 may 2024
3 Min. de lectura

Aprender Olvidando !

Concepto

La Inteligencia Artificial (IA) es un conjunto de tecnologías que consiguen realizar funciones cognitivas que asociamos a la mente humana como percibir, razonar, aprender, interactuar con el entorno, y resolver problemas.

El aprendizaje automático o Machine Learning es una de esas tecnologías de IA que se basa en algoritmos capaces de realizar predicciones de comportamiento identificando patrones a partir de información suministrada en forma de datos.

Hacer que los algoritmos de machine learning aprendan ya tiene cierto nivel de complejidad, pero hacer que olviden algo que ya han aprendido, resulta aún más complicado.

El desaprendizaje automático o Machine Unlearning se refiere al proceso de eliminar selectivamente conjuntos de datos de entrenamiento específicos, y su influencia en un modelo/algoritmo ya entrenado. El objetivo final es conseguir que el modelo actualizado se comporte igual que un modelo que nunca hubiese sido entrenado con esos datos.

Este tema resulta paradójico ya que la idea es mejorar el modelo desaprendiendo. De manera general entendemos como "desaprender" el hecho de abandonar o renunciar a conocimientos, ideas o comportamientos, mientras que consideramos "aprender" el aumento de la capacidad para tomar medidas eficaces mediante la incorporación de nuevas habilidades o conocimientos”. En Machine Unlearning se pretende que el modelo aprenda olvidando.

Este desaprendizaje puede ser muy necesario en algunos casos en que los datos con los que se ha entrenado al modelo:

estén desfasados o anticuados
se hayan suministrado por error
constituyan información privada
sean datos sesgados o erróneos

No se trata de que el modelo olvide todo lo aprendido, sino sólo una parte. El objetivo es eliminar la influencia que uno o varios conjuntos de datos específicos puedan haber tenido en un sistema de machine learning

Funcionamiento

Parece evidente que si hay dudas sobre un conjunto de datos, baste con modificarlo o eliminarlo.

Pero cuando estos datos se han utilizado para entrenar a un modelo de IA, las cosas son algo más complejas debido al funcionamiento estilo “caja negra” de los modelos de machine learning. Esto significa que resulta complicado saber el impacto real que los conjuntos de datos han tenido sobre al modelo durante el entrenamiento, y por lo tanto, es muy difícil deshacer sus efectos.

La solución más sencilla para conseguir este desaprendizaje consiste en:

1. identificar los conjuntos de datos problemáticos

2. excluirlos del entrenamiento

3. entrenar el modelo de nuevo desde cero

Este enfoque es el método más sencillo, pero resulta poco práctico por el tiempo y costes que conlleva. Puede ser útil sólo como último recurso y en circunstancias muy determinadas, pero está muy lejos de ser la solución ideal.

Lo ideal es conseguir que cualquier herramienta de machine unlearning utilice menos recursos (tanto de cálculo <máquina>, como de tiempo) que los recursos que implicarían entrenar de nuevo al modelo.

Se ha avanzado bastante desde 2015 con diferentes métodos mucho más efectivos, pero a pesar de todo, todavía no se ha dado con una solución definitiva por los problemas que han ido surgiendo relacionados con la estandarización, la eficacia, la privacidad, la compatibilidad y la escalabilidad del proceso.

Futuro

El machine unlearning se está convirtiendo en una herramienta muy interesante y útil dada la creciente ola de regulaciones en cuanto a las implicaciones éticas, legales y de protección de datos que están apareciendo en torno a la IA, y que pueden requerir adaptar modelos existentes previamente entrenados.

También se le augura un gran recorrido a nivel empresarial, para que las compañías pueden llegar a gestionar cualquier problema que surja a causa de los datos utilizados en el entrenamiento de modelos de IA implementados.

Aprender Olvidando ¡!

alma

technologies

Machine Unlearning

Concepto

Funcionamiento

Futuro

Entradas recientes

Comentarios