Premio a mejor artículo en computación en ROPEC 2024 para el INAOE
El artículo “Butterworth CNN: an improvement on memory use for Fourier Convolutional Neural Networks”, de Daniel Lima, egresado de la maestría en Ciencias Computacionales del INAOE, y la Dra. Pilar Gómez Gil, investigadora de este Instituto, obtuvo el primer premio al mejor artículo en el área de computación en la 2024 IEEE PES Generation, Transmission, and Distribution & IEEE Autumn Meeting on Power, Electronics and Computing Joint Conference (ROPEC 2024) que se llevó a cabo en Ixtapa del 12 al 13 de noviembre.
Acerca del artículo
La capacidad de las redes neuronales convolucionales (CNN) para identificar patrones en imágenes las hace adecuadas para muchas aplicaciones de visión por computadora. Sin embargo, la operación de convolución involucrada en su uso involucra un alto costo computacional, lo que dificulta la aplicación de CNN en dispositivos de gama baja o imágenes de alta resolución.
Para enfrentar este problema, se han propuesto arquitecturas conocidas como redes de Fourier, que aprovechan el teorema de convolución para sustituir la operación de convolución por el producto de Hadamard, trabajando con la representación en frecuencial de las imágenes. Desafortunadamente, esta solución aumenta el número de parámetros en los kernels.
En este trabajo se propone una nueva arquitectura, denominada Butterworth CNN (BW-CNN), enfocada a reducir el consumo de memoria de las redes de Fourier, reemplazando los kernels definidos en la representacióm frecuencial por una función de generación de kernels, basada en filtros Butterworth. Esta propuesta genera kernels parametrizados por cuatro valores, independientemente del tamaño de la imagen de entrada. Además, también se incluye una nueva capa de pooling para la representación frecuencial. Experimentos de clasificación de imágenes de alta resolución demostraron que BW- CNN utiliza menos parámetros que las redes de Fourier de última generación, e incluso menos que CNN en la representación espacial. Además, BW-CNN realiza menos operaciones de punto flotante que CNN durante la inferencia, a la vez que logra una precisión similar.
Los autores
Daniel Lima López es originario de Puebla. Desde joven se sintió atraído por las ciencias exactas. Estudió la licenciatura en Física en la Benemérita Universidad Autónoma de puebla (BUAP), donde tuvo la oportunidad de trabajar en proyectos de análisis de datos durante sus prácticas profesionales. Su primer acercamiento con el área de Inteligencia Artificial a través de talleres impartidos por investigadores despertaron en él un profundo interés por las ciencias computacionales, principalmente por la aplicación de las matemáticas en el área de Deep Learning. Por ello, se inscribió en la maestría en Ciencias Computacionales del INAOE. Durante sus estudios de posgrado se enfocó en el aprendizaje de diversas técnicas de Machine Learning, visión por computadora, incluyendo la compresión de imágenes, algoritmos evolutivos y redes neuronales.
La doctora María del Pilar Gómez Gil obtuvo la licenciatura en Ingeniería en Sistemas Computacionales de la Universidad de las Américas A. C. (hoy Universidad de las Américas, Puebla) en 1983. Obtuvo el grado de maestría en Ciencias de la Computación de la Texas Tech University, Estados Unidos en 1991, y el de doctorado en Computación en dicha universidad estadounidense en 1998. Sus líneas de investigación son redes neuronales artificiales, inteligencia computacional y reconocimiento de patrones.
Luis Enrique Erro # 1, Tonantzintla, Puebla, México, Código Postal 72840, Tel: (222) 266.31.00, difusion@inaoep.mx
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 Mexico License.