Oficina de Vinculación

Premio a mejor artículo en computación en ROPEC 2024 para el INAOE

El artículo “Butterworth CNN: an improvement on memory use for Fourier Convolutional Neural Networks”, de Daniel Lima, egresado de la maestría en Ciencias Computacionales del INAOE, y la Dra. Pilar Gómez Gil, investigadora de este Instituto, obtuvo el primer premio al mejor artículo en el área de computación en la 2024 IEEE PES Generation, Transmission, and Distribution & IEEE Autumn Meeting on Power, Electronics and Computing Joint Conference (ROPEC 2024) que se llevó a cabo en Ixtapa del 12 al 13 de noviembre.

Acerca del artículo

La capacidad de las redes neuronales convolucionales (CNN) para identificar patrones  en  imágenes  las  hace  adecuadas  para  muchas  aplicaciones  de  visión por computadora.  Sin embargo, la operación de convolución involucrada en su uso involucra un alto costo computacional, lo que dificulta la aplicación de CNN en dispositivos de gama baja o imágenes de alta resolución.  

Para enfrentar este problema, se han propuesto arquitecturas conocidas como redes de Fourier, que aprovechan el teorema de convolución para sustituir la operación de convolución por el producto de Hadamard, trabajando con la representación en frecuencial de las imágenes.    Desafortunadamente,  esta  solución  aumenta  el  número de parámetros en los kernels.  

En este trabajo se propone una nueva arquitectura, denominada Butterworth CNN (BW-CNN), enfocada a reducir el consumo de memoria de las redes de Fourier, reemplazando los kernels definidos en la representacióm frecuencial por una función de generación de kernels, basada en filtros Butterworth. Esta propuesta genera kernels parametrizados por cuatro valores, independientemente del tamaño de la imagen de entrada.  Además, también se incluye  una  nueva  capa  de  pooling  para  la  representación  frecuencial.   Experimentos  de  clasificación  de  imágenes  de  alta  resolución  demostraron  que  BW- CNN  utiliza menos  parámetros  que  las redes  de Fourier  de última generación, e  incluso  menos  que  CNN  en  la  representación  espacial.   Además,  BW-CNN realiza menos operaciones de punto flotante que CNN durante la inferencia, a la vez que logra una precisión similar.

Los autores

Daniel Lima López es originario de Puebla. Desde joven se sintió atraído por las ciencias exactas. Estudió la licenciatura en Física en la Benemérita Universidad Autónoma de puebla (BUAP), donde tuvo la oportunidad de trabajar en proyectos de análisis de datos durante sus prácticas  profesionales.  Su  primer  acercamiento  con  el área  de Inteligencia Artificial  a través de  talleres impartidos por  investigadores despertaron en él un profundo interés por las ciencias computacionales, principalmente por la aplicación de las matemáticas en el área de Deep Learning. Por ello, se inscribió en la maestría en Ciencias Computacionales del INAOE. Durante sus estudios de posgrado se enfocó en el aprendizaje de diversas técnicas de Machine Learning, visión por computadora, incluyendo la compresión de imágenes, algoritmos evolutivos y redes neuronales.

La doctora  María del Pilar Gómez Gil obtuvo la licenciatura en Ingeniería en Sistemas Computacionales de la Universidad de las Américas A. C. (hoy Universidad de las Américas, Puebla) en 1983. Obtuvo el grado de maestría en Ciencias de la Computación de la Texas Tech University, Estados Unidos en 1991, y el de doctorado en Computación en dicha universidad estadounidense en 1998. Sus líneas de investigación son redes neuronales artificiales, inteligencia computacional y reconocimiento de patrones.

Última actualización:
09-12-2024 a las 12:32 por Guadalupe Rivera Loy

 

Luis Enrique Erro # 1, Tonantzintla, Puebla, México, Código Postal 72840, Tel: (222) 266.31.00,  difusion@inaoep.mx


This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.5 Mexico License.

Creative Commons License