Abstracto

Machine Learning 2018: Deep learning: una aplicación del aprendizaje automático para clasificar imágenes - Aisha Al Owais-Sharjah Center for Astronomy and Space Sciences

Aisha Al Owais

En el siglo XXI, la tecnología es el arma más poderosa de la humanidad. El campo de la tecnología que nos interesa es la informática, en concreto la IA (IA). Como su nombre indica, la IA consiste en convertir dispositivos en agentes inteligentes que realizan acciones en función del entorno que perciben. También son flexibles en cuanto a la capacidad de ajustar su objetivo (lo que se supone que deben intentar hacer) y de ajustar sus acciones en función de los cambios del entorno. Lo que hace peculiares a los agentes de IA es su capacidad de aprender y recordar sus errores. Además, el aprendizaje automático (ML) es una de las aplicaciones de la IA que permite a los sistemas descubrir automáticamente, mejorar a través de la experiencia y ajustar sus acciones sin intervención humana. Esto nos lleva al aprendizaje profundo (DL), un subcampo de reemplazo del ML que se ocupa de algoritmos inspirados en la estructura y el rendimiento del cerebro humano, denominados redes neuronales artificiales. Se trata de redes que son capaces de aprender datos obtenidos a partir de datos instruidos o no etiquetados; por ello, también se las conoce como redes neuronales profundas (DNN). Todos estos términos nos llevan a lo que más nos interesa, las redes neuronales convolucionales (CNN), que son redes neuronales profundas que están particularmente adaptadas a las paredes para clasificar imágenes, en nuestro caso para clasificar imágenes de meteoritos. La clasificación de imágenes es un problema de aprendizaje supervisado: definir un conjunto de clases objetivo (objetos para identificar en imágenes) y entrenar un modelo para reconocerlas usando fotos de ejemplo etiquetadas. Los primeros modelos de visión por computadora dependían de datos de píxeles sin procesar como entrada al modelo. Sin embargo, como se muestra en la Figura 2, los datos de píxeles sin procesar por sí solos no proporcionan una representación lo suficientemente estable como para abarcar las innumerables variaciones de un objeto tal como se captura en una imagen. La posición del objeto, el fondo detrás del objeto, la iluminación ambiental, el ángulo de la cámara y el enfoque de la cámara pueden producir fluctuaciones en los datos de píxeles sin procesar; estas diferencias son lo suficientemente significativas como para que no se puedan corregir tomando promedios ponderados de los valores RGB de los píxeles. Para modelar objetos de manera más flexible, los modelos clásicos de visión por computadora agregaron nuevas características derivadas de los datos de píxeles, como histogramas de color, texturas y formas. La desventaja de este enfoque fue que la ingeniería de características se convirtió en una verdadera carga, ya que había muchos datos que ajustar. Para un clasificador de gatos, ¿qué colores eran los más relevantes? ¿Qué tan flexibles deberían ser las definiciones de forma? Debido a que las características debían ajustarse con tanta precisión, la creación de modelos robustos fue bastante desafiante y la precisión se vio afectada. Los autos que se conducen solos son un gran ejemplo para comprender dónde se utiliza la clasificación de imágenes en el mundo real. Para permitir la conducción autónoma, podemos crear un modelo de clasificación de imágenes que reconozca varios objetos, como vehículos, personas, objetos en movimiento, etc. en la carretera. Veremos un par de casos de uso más más adelante en este artículo, pero hay muchas más aplicaciones a nuestro alrededor.Utilice la sección de comentarios que se encuentra debajo del artículo para informarme qué posibles casos de uso se le ocurren. Los datos son oro en lo que respecta a los modelos de aprendizaje profundo. Su modelo de clasificación de imágenes tiene muchas más posibilidades de funcionar bien si tiene una buena cantidad de imágenes en el conjunto de entrenamiento. Además, la forma de los datos varía según la arquitectura o el marco que usemos.  

Biografía :

Aisha Al Owais se licenció en Ciencias Informáticas en la Facultad de Ingeniería de la Universidad Americana de Sharjah. Actualmente trabaja como asistente de investigación en el Centro de Meteoritos del Centro de Astronomía y Ciencias Espaciales de Sharjah.

Descargo de responsabilidad: este resumen se tradujo utilizando herramientas de inteligencia artificial y aún no ha sido revisado ni verificado.

Indexado en

Google Académico
Academic Journals Database
Open J Gate
Academic Keys
ResearchBible
CiteFactor
Biblioteca de revistas electrónicas
Búsqueda de referencia
Universidad Hamdard
director académico
Factor de impacto de revistas innovadoras internacionales (IIJIF)
Instituto Internacional de Investigación Organizada (I2OR)
Cosmos

Ver más