Robots y mentes colmena

Aprendizaje automático: el algoritmo basado en los descartes de las hormigas

Científicos del Instituto de Investigación en Inteligencia Artificial del CSIC (IIIA-CSIC) en Barcelona demuestran que son capaces de aprender de ejemplos negativos, caminos por los que no conviene ir.

Hormigas
Aprendizaje automático: el algoritmo basado en los descartes de las hormigas.
Pixabay

Es conocido que las hormigas dejan a su paso un rastro de feromonas, lo que permite al resto del hormiguero seguir la misma ruta. Rutas más cortas al nido permiten un paso más frecuente de hormigas: en consecuencia, acumulan mayor rastro de feromonas y quedan reforzadas positivamente frente a las otras rutas. Esto permite a la comunidad hallar un camino muy corto. Este es un ejemplo de la 'inteligencia de enjambre' de comportamientos colectivos de animales como las hormigas, las abejas o las termitas, que inspira desarrollos de inteligencia artificial. De hecho, la técnica ACO (ant colony optimization) se basa en la forma en que las hormigas encuentran caminos cortos y tiene aplicaciones en logística, investigación médica o bioinformática.

Ahora, científicos del Instituto de Investigación en Inteligencia Artificial del CSIC (IIIA-CSIC) en Barcelona han mejorado la técnica ACO inspirándose en las hormigas faraón (Monomorium pharaonis), capaces de aprender de ejemplos negativos, caminos por los que no conviene ir. De esta forma, han podido mejorar un algoritmo de inteligencia artificial que tiene aplicaciones en la búsqueda de fármacos y la optimización de la gestión logística, entre otros sectores.

Christian Blum, científico del IIIA-CSIC que ha dirigido el trabajo, explica en este reciente artículo de la Agencia SINC que "el tipo de aprendizaje usado en ACO se limita a aprender de ejemplos positivos. Sin embargo, aprender de ejemplos negativos parece desempeñar un papel importante en sistemas biológicos autoorganizados, y las hormigas faraón usan feromonas de rastro negativo para desplegar señales de no-entrada para marcar caminos de alimentación poco gratificantes".

En el trabajo, del cual también es firmante el estudiante de doctorado Teddy Nurcahyadi, han diseñado el primer mecanismo general para incorporar el aprendizaje negativo de forma beneficiosa en la técnica ACO. Presentado en octubre en el congreso ANTS 2020 de Barcelona, uno de los principales del área, el estudio fue premiado como mejor artículo por su gran potencial de innovación. Los autores han modificado el algoritmo ACO para que incorpore el aprendizaje basado en ejemplos negativos: "Este tipo de aprendizaje complementa el positivo, que sigue siendo el más importante, pero en nuestro artículo mostramos que los dos juntos resultan en un algoritmo superior".

"Nuestros algoritmos son iterativos", explica Blum, es decir, se ejecutan las mismas instrucciones repetidamente una y otra vez. "En cada iteración es como si hubiera un cierto número de hormigas que, cada una, genera una posible solución válida al problema que se quiere resolver". Si en la naturaleza las hormigas se guían, de forma probabilística, por las feromonas que hallan en cada trozo de camino, en los algoritmos esas feromonas equivaldrían a valores numéricos que están en los componentes de las posibles soluciones. Y al igual que las feromonas, esos valores se refuerzan positivamente o negativamente en función de si aparecen o no en las soluciones buenas.

Este tipo de algoritmo se puede aplicar a numerosos problemas de optimización. Situaciones en las que hay muchas posibles soluciones y se trata de encontrar la mejor o, por lo menos, una que sea "lo suficientemente buena", dice el investigador, como en el caso de la combinación de moléculas para la búsqueda de nuevos fármacos o la logística. "La investigación en muchos campos no sería posible sin herramientas adecuadas de optimización", concluye Blum.

Mostrar comentarios