Ching Y Suen
La escritura a mano es uno de los medios más importantes para la comunicación humana. Escribimos y leemos todos los días. Aunque la escritura a mano puede variar considerablemente en cuanto a moda y pulcritud, reconocemos fácilmente los materiales escritos a mano. En realidad, los seres humanos desarrollan su habilidad para escribir en su infancia y la perfeccionan gradualmente a lo largo de sus vidas. Este artículo examina las formas en que los seres humanos escriben (desde la escuela primaria hasta la escritura adulta) y las formas de enseñar a la computadora personal a reconocer (tecnología de escritura a mano) lo que producen desde la antigüedad (como escrituras talladas, libros y documentos antiguos) hasta la época actual (como formularios de entrada de puertos de inmigración, cheques, recibos de pago, sobres y diferentes tipos de notas y mensajes). Se analizarán métodos como el aprendizaje automático y las estructuras de clasificadores profundos, la extracción de espacios y márgenes, la inclinación y la dirección de la línea, el ancho y la estrechez, las conexiones y desconexiones de los trazos con grandes cantidades de datos. Se presentarán tanto los procedimientos de entrenamiento como los principios de aprendizaje, por ejemplo, las metodologías para permitir que las computadoras proporcionen tasas de reconocimiento sólidas para aplicaciones prácticas en la oficina y en los teléfonos móviles. Además, se revisará el arte y la ciencia de la grafología, y se ilustrarán las técnicas de informatización de la grafología con ejemplos interesantes. El reconocimiento de escritura a mano (HWR), también conocido como reconocimiento de texto escrito a mano (HTR), es la capacidad de una computadora para generar y descifrar textos escritos a mano comprensibles a partir de fuentes como documentos en papel, fotografías, pantallas táctiles y otros dispositivos. La imagen de la traducción también se puede detectar "desconectada" de un trozo de papel mediante lectura óptica (reconocimiento óptico de caracteres) o reconocimiento de palabras inteligente. Por otro lado, los movimientos de la punta del bolígrafo también se pueden detectar "en línea", por ejemplo, mediante una pantalla táctil basada en bolígrafo, una tarea generalmente más sencilla ya que hay más signos disponibles. Un sistema de reconocimiento de caligrafía maneja la escritura, realiza la división correcta en caracteres y encuentra las principales palabras posibles. Descifrar físicamente una gran cantidad de información escrita a mano es un proceso complicado que seguramente estará lleno de errores. El reconocimiento de caracteres robóticos puede reducir drásticamente el tiempo necesario para interpretar grandes volúmenes de texto y, además, crear una base para el desarrollo de futuros usos de la IA. El reconocimiento de caracteres transcritos es un campo de estudio continuo que abarca la IA, la visión artificial y el reconocimiento de patrones. Un sistema que realiza el reconocimiento de caracteres puede capturar y distinguir caracteres de imágenes, dispositivos de pantalla táctil y convertirlos en una estructura legible por máquina. Hay dos tipos básicos de sistemas de reconocimiento de caracteres: en línea y fuera de línea.El reconocimiento de caligrafía en línea es diferente a las tareas de denominación de conjuntos, ya que el generador oculto de la información observada, por ejemplo, el movimiento de la pluma, se registra directamente. Sin embargo, la información suele ser difícil de descifrar porque cada letra se distribuye en muchas áreas de la pluma. Como resultado, se requiere una preparación previa moderna para obtener entradas adecuadas para los cálculos de marcado de sucesión habituales, como los HMM. En este artículo, describimos un sistema capaz de traducir correctamente información de caligrafía en línea sin procesar. El sistema consta de un sistema neuronal intermitente preparado para el nombramiento de grupos, combinado con un modelo de lenguaje probabilístico. El reconocimiento de caligrafía desconectado, la interpretación de imágenes de contenido escrito a mano, es una tarea estimulante, ya que combina la visión por computadora con el aprendizaje de sucesión. En muchos sistemas, los dos componentes se manejan de forma independiente, con métodos de preprocesamiento complejos que eliminan los aspectos destacados de las imágenes y los modelos sucesivos como los HMM deben proporcionar las traducciones. Al consolidar dos avances en curso en sistemas neuronales, sistemas neuronales repetitivos multidimensionales y orden mundial conexionista, este artículo presenta un reconocedor de caligrafía desconectada preparado integral que acepta información de píxeles crudos como información.