Sistema de reconocimiento de patrones
Descripción general
 Fácil de hacer mejoras y mejoras apropiadas mediante factores de discriminación (causa) de los resultados de reconocimiento (lectura regular, rechazo, lectura incorrecta). Un sistema de reconocimiento de patrones que lee un patrón grabado en una hoja incluye un dispositivo de reconocimiento de patrones 10 para emitir información de factores que indica qué tipo de proceso de procesamiento se ha determinado el resultado de leer un patrón, junto con un resultado de lectura, Un resultado de lectura muestra la sección 30 en el sistema anfitrión 12 para visualizar el resultado de lectura emitido desde el sistema principal 12 y mostrar la notificación en el resultado de lectura de acuerdo con la información del factor.
Campo técnico
La presente invención se refiere a un aparato de reconocimiento de patrones adecuado para un lector óptico de caracteres (OCR), un lector de marca, un lector de texto, un OCR de tarjeta de visita y similares.
Antecedentes de la técnica
Generalmente, en un dispositivo de reconocimiento de patrones como un lector de caracteres ópticos (OCR), resultados de reconocimiento (códigos de caracteres de un personaje candidato de primer rango) y una pluralidad de cadenas de códigos de caracteres (caracteres candidatos después de un segundo candidato) , Y el grado de similitud (que se obtiene en comparación con un diccionario preestablecido) a partir del cual se determina el orden de cada carácter candidato se envía al lado del sistema host.
En el sistema host, la visualización se emite según el resultado de la lectura desde el lado del dispositivo de reconocimiento de patrones, y el resultado del procesamiento se notifica al usuario. Como resultados de reconocimiento para cada personaje, generalmente hay una lectura correcta correctamente reconocida, rechazada que no puede obtener el suficiente resultado de reconocimiento, y una lectura errónea erróneamente reconocida.
Convencionalmente, con respecto a los caracteres rechazados o mal interpretados, era imposible distinguir claramente los resultados de lectura del procesamiento de la causa. Con respecto al rechazo, es posible distinguir hasta cierto punto en el lado del sistema host emitiendo un código especial que indica el proceso que causa el rechazo desde el lado del dispositivo de reconocimiento de patrones, pero no se distinguió claramente. En particular, con respecto a la lectura incorrecta, no fue posible determinar en absoluto qué proceso se produjo un error.
Tarea de solución
Como se describió anteriormente, en el sistema de reconocimiento de patrones convencional, es imposible discriminar claramente en qué proceso ocurrió un error para los caracteres rechazados o leídos erróneamente, por ejemplo, es un problema de operación (ingreso de caracteres) o un problema de un diccionario , O era un problema de procesamiento de reconocimiento.
Por lo tanto, incluso si el proceso de lectura se mejoró, el evaluador lo decidió a juicio (estimación) y solo fue una mejora o mejora en general. RESUMEN DE LA INVENCIÓN La presente invención se ha realizado a la vista de las circunstancias anteriores, y es fácil mejorar y mejorar de forma apropiada un factor (causa) de un resultado de reconocimiento (lectura regular, rechazo, lectura incorrecta). Y para proporcionar un sistema de reconocimiento de patrones.
Solución
Según la presente invención, se proporciona un sistema de reconocimiento de patrones para leer un patrón grabado en una hoja, que comprende medios de reconocimiento de patrones para emitir información de factores que indica qué tipo de proceso de procesamiento se ha determinado el resultado de leer el patrón, junto con el resultado de lectura. Y leer los medios de visualización de resultados para visualizar el resultado de lectura emitido desde los medios de reconocimiento de patrones y visualizar una notificación en el resultado de lectura correspondiente a la información de factores.
De acuerdo con dicha configuración, dado que la información del factor que indica la causa del resultado del reconocimiento de caracteres final se envía junto con el resultado de reconocimiento, es posible determinar cómo se determina el resultado de reconocimiento de cada carácter. Por lo tanto, al referirse a la información del factor sobre el carácter erróneamente leído o rechazado, es posible determinar claramente qué tipo de operación se debe realizar, corrección o similar es necesaria en el momento del procesamiento futuro. Además, al mostrar una notificación (mensaje) correspondiente a la información del factor, es posible determinar fácil y claramente el estado del sistema.
Una realización de la presente invención se describirá a continuación con referencia a los dibujos. La figura 1 es un diagrama de bloques que muestra una configuración de un sistema de reconocimiento de patrones de acuerdo con esta realización. Como se muestra en la figura 1, el sistema de reconocimiento de patrones de acuerdo con la presente realización incluye un aparato de reconocimiento de patrones 10, un sistema anfitrión 12, una unidad de visualización 14 y una unidad de entrada 15.
El aparato de reconocimiento de patrones 10 incluye una unidad de control 20, una unidad de almacenamiento FC 21, una unidad de escáner 22, una unidad de almacenamiento intermedio 23 y una unidad de procesamiento de reconocimiento 24. La unidad de control 20 es responsable del control global del aparato de reconocimiento de patrones 10 en respuesta a una instrucción del sistema servidor 12. La unidad de control 20 almacena información (información de control de formato: abreviada como información de FC) que define el funcionamiento del dispositivo de reconocimiento de patrones 10 desde el sistema host 12 en la unidad de almacenamiento FC 21 y se refiere apropiadamente a la información de acuerdo con el proceso.
La unidad de almacenamiento FC 21 almacena información que define una operación de procesamiento en cada unidad e incluye información (posición de carácter, tipo de carácter, etc.) sobre caracteres descritos en una hoja (formulario) a procesar, etc., así como una unidad de procesamiento de reconocimiento 24 , Se incluye información de control de salida de información de factor 21a para designar la información del factor de reconocimiento de salida para el sistema anfitrión 12 para cada proceso.
La unidad de escáner 22 explora ópticamente el papel (forma o similar) a procesar, y detecta una imagen que incluye un patrón tal como caracteres. La unidad de memoria intermedia 23 es una memoria para almacenar la imagen detectada por la unidad de escáner 22.
La unidad 24 de procesamiento de reconocimiento reconoce el patrón de caracteres incluido en la imagen almacenada en la unidad 23 tampón según la información FC almacenada en la unidad 21 de almacenamiento de información FC bajo la unidad 20 de control. La unidad de procesamiento de reconocimiento 24 incluye una unidad de recorte de caracteres 25, una unidad de reconocimiento de caracteres 27 y una unidad de almacenamiento de diccionarios 29.
La unidad de corte de caracteres 25 detecta un patrón de caracteres de un carácter a partir de la imagen almacenada en la unidad de almacenamiento intermedio 24 (proceso de detección de inspección). En esta realización, las letras se introducen en el cuadro de caracteres proporcionado en la forma, y ​​la unidad de corte de caracteres 25 ejecuta básicamente el procesamiento de extracción de patrones de caracteres en base a la posición del cuadro de caracteres. Además, la unidad de recorte de caracteres 25 está provista de una unidad de control de información de factor de procesamiento de corte 25a que realiza el procesamiento relacionado con la información de factor que indica la causa de influencia en el resultado de reconocimiento de caracteres final en el proceso de detección.
La unidad de reconocimiento de caracteres 27 obtiene la similitud para cada patrón de diccionario comparando el patrón de caracteres recortado por la unidad de recorte de caracteres 25 con el patrón de diccionario almacenado en la unidad de almacenamiento de diccionario 29 y calcula el resultado de reconocimiento en función del valor de similitud . La unidad de reconocimiento de caracteres 27 está provista de una unidad de control de información de factores de procesamiento de reconocimiento 27a que realiza el procesamiento relacionado con la información de factores que indica la causa del resultado de reconocimiento de caracteres final en el procesamiento de reconocimiento de caracteres.
La unidad de almacenamiento de diccionario 29 es para almacenar información de patrón de diccionario de las categorías de caracteres a reconocer. (La estructura específica del diccionario se describirá más adelante). El sistema anfitrión 12 controla el aparato de reconocimiento de patrones 10 para mostrar el resultado de lectura de caracteres sobre la base del resultado de reconocimiento, el grado de similitud de caracteres candidatos y la información del factor de reconocimiento como resultado de lectura de caracteres obtenidos a través de la unidad de control 20 . En el sistema anfitrión 12, la sección de visualización de resultados de lectura 30 opera para controlar la visualización del resultado de lectura. Además, en la sección 30 de visualización de resultados de lectura, la sección 32 de visualización de información de factores controla la visualización relacionada con la información del factor de reconocimiento correspondiente a cada carácter. La unidad de visualización de información de factores 32 tiene un archivo de mensajes 32a para almacenar mensajes correspondientes a la información de factores, y hace que se visualice un mensaje correspondiente a la información de factores según sea necesario.
La unidad de visualización 14 muestra el resultado de lectura de caracteres bajo el control de la unidad de visualización de resultados de lectura 30 del sistema principal 12. La unidad de entrada 15 es para introducir una instrucción o similar de un usuario en el sistema anfitrión 12, e introduce, por ejemplo, un rechazo en un resultado de lectura de caracteres y una instrucción de corrección para un carácter mal interpretado o similar.
A continuación, se describirá la operación de esta realización. En primer lugar, el documento que debe procesarse es escaneado ópticamente por la unidad de escáner 22, y la imagen obtenida por este se almacena en la unidad de memoria intermedia 23. La unidad de control 24 ordena a la unidad de procesamiento de reconocimiento 24 que ejecute el procesamiento de reconocimiento de caracteres en la imagen almacenada en la unidad de almacenamiento intermedio 23.
La unidad de procesamiento de reconocimiento 24 primero realiza un proceso de detección en la imagen en la unidad de almacenamiento intermedio 23 por la unidad de extracción de caracteres 25 y extrae un patrón de caracteres. En este momento, la unidad de control de información de factor de procesamiento de detección 25a de la unidad de extracción de caracteres 25 registra el resultado de procesamiento que causa el resultado de lectura de carácter final como información de factor en el procesamiento de extracción de caracteres.
En la presente realización, (1) información de desconexión forzada, (2) información de conexión, (3) información de rechazo, (3) información de rechazo, (3) información de rechazo, 4) otra información, debe estar presente.
La unidad de control de información de factor de procesamiento de corte 25a genera información de factor de procesamiento de detección / desconexión determinada por el procesamiento de detección en una palabra (32 bits) como se muestra en la figura 2, por ejemplo. Es decir, cada información (1) (4) está representada por 1 byte. Cada información muestra los siguientes contenidos.
(1) La información de desconexión forzada es una relación entre la posición del cuadro de caracteres (arriba-abajo, izquierda-derecha) y el trazo (por ejemplo, el número de trazos que se cruzan, etc. ) Por ejemplo, como se muestra en la figura 3, si existe una carrera que intersecta el lado derecho del cuadro de caracteres en el patrón de caracteres (figura 3 (a)), el valor se establece en el bit correspondiente (figura 2 (b)) . Dado que se asignan dos bits a cada lado en la información de desconexión forzada, se pueden establecer cuatro estados como información de desconexión forzada (por ejemplo, si es '0' es normal, si es otro valor, cruza el marco El número de golpes que se están tomando).
(2) Cuando el trazo del patrón de caracteres está conectado al patrón de caracteres en otro cuadro de caracteres, la información de conexión se establece en el bit correspondiente que indica el destino de la conexión.
(3) En la información de rechazo, en la etapa de realizar el proceso de detección, el valor se establece en el bit correspondiente que indica la causa del rechazo para el patrón de caracteres determinado que no está sujeto al proceso de reconocimiento. Por ejemplo, cuando un trazo de un patrón de caracteres es borroso, aplastado y similares, y el procesamiento de detección apropiado no puede ejecutarse, se determina que no debe someterse al procesamiento de reconocimiento (rechazo).
(4) La otra información incluye resultados de procesamiento que causan causas de lectura de caracteres en otro proceso de detección, y se establece en un bit predeterminado definido previamente como información de factor.
La unidad de control de información de factor de procesamiento de detección 25a establece la información de factor de procesamiento de inspección configurada de acuerdo con los contenidos descritos anteriormente en asociación con el patrón de caracteres de un carácter a procesar, y lo envía a la unidad de control 20 .
A continuación, la unidad de procesamiento de reconocimiento 27 compara el patrón de caracteres extraído por la unidad de extracción de caracteres 25 con el patrón de diccionario almacenado en la unidad de almacenamiento de diccionario 29, obteniendo de este modo similitudes para cada patrón de diccionario. Entonces, la unidad de procesamiento de reconocimiento 24 determina el resultado de reconocimiento del patrón de caracteres que es el objetivo de reconocimiento en función del valor de similitud de cada patrón de diccionario.
En este momento, en el procesamiento de reconocimiento de caracteres, la unidad de control de información de factores de procesamiento de reconocimiento 27 a de la unidad de reconocimiento de caracteres 27 registra el resultado de procesamiento como la información de factor que hace que el resultado final de lectura de caracteres sea la información de factor.
En la presente realización, (1) número de subconjunto, (2) número de entrada, (3) información de similitud, (4) información de atributo (4) como información de factor (información de factor de procesamiento de reconocimiento) que afecta el resultado final de lectura de caracteres por procesamiento de reconocimiento de caracteres ) Otra información (información de rechazo, etc.) debe estar presente.
Se supone que el diccionario almacenado en la unidad 29 de almacenamiento de diccionario está configurado como se muestra en la figura 4, por ejemplo. Es decir, el diccionario está compuesto por una pluralidad de subconjuntos, y además, un diccionario correspondiente a una pluralidad de categorías de caracteres de un tipo de carácter predeterminado se almacena en un subconjunto.
En la figura 4, se muestran un subconjunto numérico (subconjunto número 3) y una parte del subconjunto kana (subconjunto número 4). Como se muestra en la figura 4, los diccionarios para una pluralidad de caracteres se preparan en cada categoría de caracteres, y un diccionario de un carácter se especifica mediante un número de subconjunto y un número de entrada.
Como se muestra en la figura 2, por ejemplo, la unidad de control de información de factor de procesamiento de reconocimiento 27a genera información de factor de procesamiento de reconocimiento determinada por el procesamiento de reconocimiento en una palabra (32 bits) de la misma manera que en el caso del procesamiento de detección. Es decir, cada información (1) (4) está representada por 1 byte.
La unidad de control de información de factor de procesamiento de reconocimiento 27a establece el conjunto de información de factor de procesamiento de reconocimiento según el contenido descrito anteriormente en asociación con el resultado de reconocimiento de un carácter a procesar, y lo envía a la unidad de control 20. Cuando se obtiene una pluralidad de candidatos de reconocimiento por procesamiento de reconocimiento de caracteres, se establece información de factor de procesamiento de reconocimiento para cada candidato de reconocimiento.
Por ejemplo, se supone que el resultado como se muestra en la figura 5 se obtiene mediante el procesamiento de reconocimiento. La figura 5 muestra el resultado de reconocimiento para el número '9' (patrón de caracteres mostrado en la figura 6). Los candidatos de reconocimiento de caracteres se obtienen como caracteres candidatos desde el primer lugar hasta el quinto lugar, y se obtienen el número de subconjunto, el número de entrada y la similitud correspondiente a cada carácter candidato. El número de subconjunto, el número de entrada y la similitud se establecen como información del factor de reconocimiento de cada carácter candidato.
La unidad de control 20, como resultado de lectura carácter del resultado del reconocimiento (el primer código de caracteres candidata) y una pluralidad de cadena de código de caracteres (caracteres candidatos del segundo candidato más tarde), y con la similitud de cada personaje candidato, más Y agrega la información del factor establecida para cada carácter candidato al sistema host 12 (y también emite los datos de la parte de la imagen para ser reconocidos por el sistema host 12).
Al recibir el resultado de lectura de caracteres del sistema anfitrión 12 y el dispositivo de reconocimiento de patrones 10, la unidad de visualización de resultados de lectura 30 hace que la unidad de visualización 14 muestre una pantalla como se muestra en la figura 6, por ejemplo.
En la pantalla de visualización mostrada en la figura 6, la imagen 40 a reconocer, el resultado de reconocimiento 41 (primer candidato de reconocimiento) correspondiente a la imagen a reconocer, el carácter candidato para el personaje en la posición indicada por el cursor 42 (segundo Incluyendo caracteres candidatos después de la posición) 43 se visualiza. Además, la unidad de visualización de información de factor 32 muestra la información de factor 44 relacionada con el carácter candidato visualizado como el resultado de reconocimiento 41 y el mensaje 45 correspondiente a la información de factor según sea necesario (en la figura 6, positivo). Debido a que el mensaje se está leyendo, el mensaje no se muestra).
Para el mensaje 43 correspondiente a la información del factor, por ejemplo, se visualiza un mensaje preparado previamente en el archivo de mensajes 32 a de la unidad de visualización de información de factores 32 según la información del factor. Por ejemplo, el archivo de mensaje 32a es un archivo de texto en el que se almacena un mensaje tal como se muestra en la figura 7.
Por ejemplo, el mensaje 'El diccionario de reconocimiento está roto, contáctese con su trabajador de mantenimiento más cercano' que se muestra en la Figura 7 indica que el número de subconjunto o número de entrada en la información del factor de reconocimiento no existe originalmente en la unidad de almacenamiento del diccionario 29 En el caso de indicar un diccionario, se supone que el diccionario es anómalo y solicita la sustitución de la unidad 29 de almacenamiento de diccionario y similares.
Además, el mensaje 'Por favor oscurezca la entrada de letras' que se muestra en la figura 7 se detecta como una imagen como se muestra en la figura 8 (b), por ejemplo, como se muestra en la figura 8 (a) Como resultado, como se muestra en la figura 8 (c), se muestra cuando se rechaza el segundo carácter.
Cabe señalar que el mensaje no necesita estar preparado de acuerdo con toda la información de factores (combinación de bits). Además, el contenido del mensaje puede prepararse arbitrariamente, por ejemplo, para el personal de mantenimiento que gestiona el sistema o para el usuario, y si se puede establecer arbitrariamente el mensaje o no.
De esta manera, como se muestra en la figura 6, al mostrar la información del factor y el mensaje basados ​​en la información del factor en el procesamiento de detección y el procesamiento de reconocimiento, es posible determinar qué tipo de procesamiento se determinó el resultado del reconocimiento. Tu puedes hacer Por lo tanto, cuando ocurre una mala lectura o un rechazo, la causa puede discriminarse adecuadamente, y una parte del problema puede tratarse en el procesamiento futuro. Por ejemplo, problemas de operación (descripción de caracteres con respecto a la forma), problemas de detección de imagen (cambio del estado de detección de imagen en la sección de escáner 22 si hay borrosidad o colapso), problemas de patrones de diccionario almacenados en la sección de almacenamiento de diccionario 29 , Es posible mejorar la calidad (precisión de reconocimiento) del reconocimiento de caracteres y la eficiencia del trabajo de mantenimiento respondiendo de acuerdo con el mensaje.
En la descripción anterior, la información de factor correspondiente a cada carácter candidato se devuelve desde el aparato de reconocimiento de patrones 10 al sistema anfitrión 12. Sin embargo, la información de control de salida de información de factores 21a se puede definir en la unidad de almacenamiento de información FC 21 , La unidad de control 20 puede controlar la salida de la información del factor al sistema principal 12.
En la información de control de salida de información de factor 21a, designa si se genera o no información de factor en la unidad de procesamiento de reconocimiento 24, designación de procesamiento específico para generar información de factor o si se envía o no la información de factor generado al sistema principal 12 . Por ejemplo, la información del factor relativa a los caracteres que se leen o leen mal se comprueba selectivamente en la pantalla. La unidad de procesamiento de reconocimiento 24 ejecuta el procesamiento de información de factor de acuerdo con los contenidos de ajuste de la información de control de salida de información de factor 21a. Además, la unidad de control 20 envía información de factor específica al sistema anfitrión 12 según los contenidos de designación. Aquí, la unidad de control 20 puede emitir la información del factor incondicionalmente con respecto al carácter rechazado, y emitir selectivamente otros caracteres, es decir, caracteres que se leen o se leen erróneamente .
De esta manera, limitando la información del factor a devolver al sistema anfitrión 12, se puede reducir la carga de transferencia de datos entre el aparato de reconocimiento de patrones 10 y el sistema anfitrión 12.
En la descripción anterior, el sistema principal 12 muestra mensajes correspondientes a la información del factor del dispositivo de reconocimiento de patrones 10, pero también es posible visualizar un resultado de lectura específico de acuerdo con una instrucción de la unidad de entrada 15 Se le puede indicar que muestre selectivamente un mensaje (información del factor). Por ejemplo, la unidad 32 de visualización de información de factores muestra un mensaje sobre el resultado de lectura del carácter rechazado y sobre la información de factores relativa al carácter de lectura normal o erróneamente leído, la información de hechos debido a la depresión de la tecla especial establecida en la unidad de entrada 15 Para confirmar selectivamente en la pantalla de acuerdo con las instrucciones.
De esta forma, al mostrar selectivamente los mensajes según la información del factor que se mostrará, es posible hacer que la pantalla sea fácil de ver. En la realización anterior, se toma como ejemplo un dispositivo para leer caracteres grabados en un formulario, pero también es aplicable a un lector de marca, un lector de texto japonés (no se especifica un formato de grabación de caracteres), un OCR de tarjeta de visita, etc. Es posible
Efecto de la invención
Como se describió anteriormente en detalle, de acuerdo con la presente invención, se agrega un proceso de procesamiento que afecta el resultado de lectura final como información de factor, y el resultado de reconocimiento (lectura normal, rechazo, lectura errónea) se muestra en base a la información de factor Para que sea fácil hacer mejoras y mejoras apropiadas.
La figura 1 es un diagrama de bloques que muestra una configuración de un sistema de reconocimiento de patrones de acuerdo con una realización de la presente invención.
La figura 2 es un diagrama que muestra un ejemplo de un formato de información de factores en esta realización.
La figura 3 es un diagrama para explicar la desconexión forzada de un patrón de caracteres.
La figura 4 es un diagrama para explicar un ejemplo de una configuración de un diccionario.
La figura 5 es un diagrama que muestra un ejemplo de un resultado de reconocimiento.
La figura 6 es un diagrama que muestra un ejemplo de una pantalla de visualización en esta realización.
La figura 7 es un diagrama que muestra un ejemplo de un mensaje en esta realización.
La figura 8 es una vista para explicar un ejemplo de visualización de mensajes en esta realización.
10: dispositivo de reconocimiento de patrones 12: sistema anfitrión 14: unidad de visualización 15: unidad de entrada 20: unidad de control 21: unidad de almacenamiento FC 21a: información de control de salida de información de factores 22: unidad de escáner 23: unidad de memoria intermedia, 24: unidad de procesamiento de reconocimiento, 25: unidad de extracción de caracteres, 25 a: unidad de control de información de corte de detección, 27: unidad de reconocimiento de caracteres, 27 una unidad de control de información de factor de reconocimiento, 29: unidad de almacenamiento de diccionario, 30: unidad de visualización de resultado de lectura, 32 ... sección de visualización de información de factor, 32a ... archivo de mensaje.
Dibujo :
Application number :1996-153159
Inventors :株式会社東芝
Original Assignee :寺崎正則