Prajakta Bastawade, Prof. Bharati Dixit
La detección de texto en imágenes de escenas naturales es una tarea importante para aplicaciones como la navegación asistida, la lectura auxiliar, la recuperación de imágenes, la comprensión de escenas, etc. Este documento explora un nuevo marco para detectar cadenas de texto en imágenes de escenas naturales complejas que consta de dos pasos: A) partición de imágenes para encontrar candidatos de caracteres de texto en función de las características de gradiente local y la uniformidad de color de los componentes de los caracteres y 2) agrupación de candidatos de caracteres para detectar cadenas de texto en función de las características estructurales conjuntas de los caracteres de texto. En Boundary Clustering se desarrolla un nuevo método basado en la uniformidad de color de bigramas para modelar tanto el texto como la superficie del archivo adjunto, y agrupar los píxeles de los bordes en función de pares de colores y posiciones espaciales en capas de límites que se proporcionan como entrada para todo el marco. El marco dado supera los resultados de última generación en el RRD público que contiene texto solo en orientación horizontal y es más efectivo en MSRA-TD500 que contiene texto en orientaciones arbitrarias.