Método de procesamiento de reconocimiento de documentos
Descripción general
 De este modo, se mejora el trabajo de corrección del resultado del procesamiento de reconocimiento de documentos. ] Cuando se reconoce una línea del documento de entrada 13, el dispositivo de reconocimiento 11 envía el resultado de reconocimiento al dispositivo de corrección. El dispositivo de modificación almacena una línea en una región procesable que puede modificarse y permite al operador realizar un proceso de modificación. El dispositivo de reconocimiento 11 ejecuta el procesamiento de reconocimiento para la segunda segunda línea mientras tanto. Cuando se completa el procesamiento de reconocimiento de la segunda línea, el resultado se envía al dispositivo de corrección. El resultado de reconocimiento de la primera línea se combina con el resultado de reconocimiento de la segunda línea y se almacena en el área de procesamiento de corrección nuevamente. El operador puede así modificar la primera y la segunda línea. A través de dicho estado P 1 P 4, se completa el procesamiento de reconocimiento de todos los documentos de entrada 13. Como el operador puede corregir el resultado del reconocimiento de caracteres en una línea, se reduce el tiempo de espera innecesario.
Campo técnico
La presente invención se refiere a un método de procesamiento de reconocimiento de documentos para leer una imagen de personaje descrita en un documento y reconocer y procesar la imagen de personaje.
Antecedentes de la técnica
Se han desarrollado diversos aparatos para reconocer y procesar imágenes de caracteres descritos en documentos con el fin de automatizar la tarea de introducir información en la computadora, etc. (Solicitud de Patente Japonesa abierta a inspección pública Nº 195488). En este tipo de aparato, una imagen de personaje en un documento leído se corta un carácter a la vez, se reconoce el patrón, se compara con un diccionario preparado para reconocer el carácter correspondiente y se obtiene el código de carácter. Cuando se realiza dicho procesamiento de reconocimiento, generalmente se incluye un error en el resultado de reconocimiento. Por esta razón, el resultado del reconocimiento se muestra en una pantalla o similar, y el operador recopila el documento original con el resultado de reconocimiento y corrige el error de reconocimiento. No solo se incluyen en el objetivo de corrección los meros errores de reconocimiento, sino también los caracteres que no pueden reconocerse que no están incluidos en el diccionario o los caracteres que no pueden reconocerse debido a la escritura a mano, etc.
En dicho dispositivo, cuando el procesamiento de reconocimiento de un documento se inicia normalmente, el resultado del reconocimiento se muestra en la pantalla una vez que se ha completado el procesamiento de reconocimiento, y el resultado del reconocimiento se puede corregir o similar. Además, durante el proceso de reconocimiento, los resultados se muestran secuencialmente en la pantalla, y cuando se completa el proceso de reconocimiento, la pantalla cambia a la pantalla para aceptar el trabajo de corrección. El operador espera que se complete dicho procesamiento de reconocimiento e inicia la operación de corrección o similar.
Tarea de solución
Incidentalmente, el método de procesamiento de reconocimiento de documentos convencional como se describió anteriormente tiene los siguientes problemas por resolver. En el caso donde el operador corrige el resultado del procesamiento de reconocimiento del aparato de procesamiento de reconocimiento de documentos, como se describió anteriormente, en el aparato convencional, es posible iniciar el procesamiento de corrección a menos que el procesamiento de reconocimiento se haya completado para todos los caracteres en el documento de entrada No puedo Por lo tanto, por ejemplo, cuando se describe una gran cantidad de caracteres en una página, debe esperar mucho tiempo hasta que el operador inicie el proceso de corrección. Además, al procesar documentos que cubren varias páginas, el operador espera la finalización del procesamiento para cada proceso de reconocimiento de una página, y cuando se completa el proceso de corrección, el proceso de reconocimiento de la página siguiente se ejecuta nuevamente. Existe el problema de que se genera mucho tiempo muerto en el trabajo mismo del operador.
Solución
La presente invención adopta la siguiente constitución para resolver el punto mencionado anteriormente. El método de la presente invención es para el procesamiento de reconocimiento de una imagen de personaje descrita en un documento de entrada, y es posible dividir un documento en ciertas unidades, y cada vez que finaliza el reconocimiento de caracteres en el documento de una unidad, Transferencia del resultado de reconocimiento al área de procesamiento de corrección que puede corregirse y corregirse utilizando el dispositivo de corrección, combinándolo con el resultado de reconocimiento de caracteres ya procesado y volviendo a almacenarlo en el área corregible, y al mismo tiempo, convirtiendo el personaje Y comienza el procesamiento de reconocimiento.
Al reconocer una línea de un documento de entrada, el dispositivo de reconocimiento envía el resultado de reconocimiento al dispositivo de corrección. El dispositivo de modificación almacena una línea en una región procesable que puede modificarse y permite al operador realizar un proceso de modificación. El dispositivo de reconocimiento 11 ejecuta el procesamiento de reconocimiento para la segunda segunda línea mientras tanto. Cuando se completa el procesamiento de reconocimiento de la segunda línea, el resultado se envía al dispositivo de corrección. El resultado de reconocimiento de la primera línea se combina con el resultado de reconocimiento de la segunda línea y se almacena en el área de procesamiento de corrección nuevamente. El operador puede así modificar la primera y la segunda línea. A través de dicho estado, se completa el proceso de reconocimiento de todos los documentos de entrada. Como el operador puede corregir el resultado del reconocimiento de caracteres en una línea, se reduce el tiempo de espera innecesario.
Sucesivo, la presente invención se describirá en detalle con referencia a la realización de la fig. La figura 1 es un diagrama explicativo de un método de procesamiento de reconocimiento de documentos de la presente invención. Antes de esta explicación, la configuración del sistema para implementar la presente invención se describirá con referencia a las figuras 2 y 3. La figura 2 es un diagrama de bloques del sistema para implementar la presente invención. Este sistema comprende un escáner 1, un dispositivo de reconocimiento 11 y un dispositivo de corrección 12. El escáner 1 es un aparato para leer ópticamente un documento de entrada y capturar los datos de imagen. El dispositivo de reconocimiento 11 está provisto de una memoria de imagen 2, una memoria de resultado de reconocimiento 3 y una unidad de reconocimiento 4. La memoria de imagen 2 está compuesta por un dispositivo de almacenamiento para almacenar temporalmente imágenes de caracteres leídas por el escáner 1.
La unidad de reconocimiento 4 es una parte que tiene una función de reconocimiento de caracteres bien conocida de cortar la imagen de carácter almacenada en la memoria de imagen 2 para cada carácter en una posición correspondiente y realizar un proceso de reconocimiento de patrón o similar. La memoria de resultado de reconocimiento 3 almacena los códigos de caracteres y similares obtenidos como resultado del procesamiento de reconocimiento, y está compuesto por un dispositivo de almacenamiento. El dispositivo de corrección 12 está compuesto por una memoria de caracteres de visualización 5, una unidad de visualización 6, una unidad de control 7 y una unidad de entrada 8. La memoria de caracteres de visualización 5 es un dispositivo de almacenamiento para almacenar resultados de reconocimiento de caracteres enviados desde la memoria de resultados de reconocimiento 3, por ejemplo, resultados de reconocimiento de caracteres para varias líneas para el procesamiento de corrección. La unidad de visualización 6 incluye una pantalla para visualizar el resultado de reconocimiento de caracteres almacenado en la memoria de caracteres de visualización 5. La unidad de entrada 8 está compuesta por un teclado y otros dispositivos para operar el operador y corregir el resultado de reconocimiento mostrado en la unidad de visualización 6 por un operador. La unidad de control 7 está compuesta de un procesador para controlar dicho trabajo de corrección.
Volviendo a la figura 1 nuevamente, en el método de la presente invención, el documento de entrada 13 se lee primero usando el sistema de la configuración de la figura 2 descrita anteriormente y el procesamiento de reconocimiento de la imagen de personaje se realiza usando el dispositivo de reconocimiento 11. En este caso, la unidad de procesamiento se selecciona, por ejemplo, en unidades de una fila. Es decir, cada vez que el documento de entrada 13 se divide en líneas una por una y se completa el reconocimiento de caracteres para una línea, el resultado se envía al dispositivo de corrección 12. El dispositivo de corrección 12 está provisto de la memoria de caracteres de visualización 5 descrita anteriormente. El resultado de reconocimiento de caracteres enviado desde el dispositivo de reconocimiento 11 se almacena aquí y se visualiza en la pantalla. El lado derecho P1 P1 mostrado en la figura 1 muestra el estado al final del reconocimiento de la primera línea, el estado al final del reconocimiento de la segunda línea, el estado al final del reconocimiento de la tercera línea y el estado al final del último reconocimiento de línea Respectivamente En el estado P1, se completa el reconocimiento de la primera línea y se muestra el resultado de reconocimiento de la primera línea en la unidad de visualización. En el estado P2, se completa el reconocimiento de la segunda línea, y el resultado de reconocimiento de la segunda línea se muestra adicionalmente aquí.
La figura 3 es un diagrama para explicar un método de procesamiento de resultados de reconocimiento. Como se describió anteriormente, el proceso de agregar el resultado de reconocimiento de la línea siguiente al resultado de reconocimiento que ya se ha enviado al dispositivo de corrección cada vez que se completa el reconocimiento de una línea se realiza de la manera que se muestra en esta figura. Es decir, cuando se reconoce la primera línea del documento de entrada 13, se emite el resultado de reconocimiento de la primera línea, y en el estado P1, se muestra la primera línea del mismo. A continuación, cuando se reconoce la segunda línea y se emite la segunda línea, la salida de la segunda línea se agrega a la salida de la primera línea. Es decir, en este estado P2, el procesamiento se realiza de manera que la salida de la segunda línea se agrega a la salida de la primera línea que se envía al dispositivo de corrección y debe corregirse o similar. Tal procesamiento se ejecuta hasta la última línea.
De esta forma, los resultados de reconocimiento se apilan en orden en la memoria de caracteres de visualización 5 del dispositivo de corrección, y finalmente se almacenan los resultados de reconocimiento de todas las filas. El objeto a modificar por la unidad de entrada 8 es el contenido de la memoria de caracteres de visualización 5. En este caso, cuando el reconocimiento se completa hasta el final, el resultado de reconocimiento de que el proceso de corrección se completa por el operador se almacena en la memoria de caracteres de visualización 5. Por lo tanto, transfiriendo finalmente esto a la memoria 3 de resultados de reconocimiento y actualizando el resultado de reconocimiento, el resultado de reconocimiento corregido se almacena en la memoria 3 de resultados de reconocimiento.
En la presente invención, la memoria de caracteres de visualización 5 se denomina región de procesamiento de corrección que puede corregirse y corregirse usando un dispositivo de corrección. Por supuesto, la configuración de la memoria de resultados de reconocimiento 3 puede reescribirse directamente dependiendo de la configuración del sistema. De esta manera, el resultado de realizar nuevamente el procesamiento de reconocimiento en el resultado de reconocimiento de caracteres ya procesado se combina y se almacena nuevamente en el área corregible, como la memoria de caracteres de visualización 5, y se realiza el procesamiento de reconocimiento de caracteres de la siguiente línea Si se ejecuta en paralelo con la operación de corrección, el tiempo de espera del operador se reduce, y el proceso de reconocimiento de caracteres y su trabajo de corrección pueden acelerarse en conjunto.
La figura 4 muestra un diagrama de flujo de operación de la primera realización como se describió anteriormente. Primero, en la etapa S1, cuando se ingresa una imagen de un documento de entrada usando el escáner 1 mostrado en la figura 2, esto se almacena en la memoria de imagen 2 del dispositivo de reconocimiento 11, y el análisis de imagen se realiza en la etapa S2. Luego, en el paso S3, se establece el parámetro j del número de líneas en la imagen y se establece en el valor inicial 1. En el paso S4, se reconoce la línea j-ésima, y ​​en el paso S5, el resultado de reconocimiento se transfiere a la memoria 5 de caracteres de visualización y se almacena. En el paso S6, el parámetro j se incrementa, y en el paso S7, se determina si j excede o no el número máximo de líneas i en la imagen. Paso S4 El paso S7 se repite dentro del rango del número de líneas, y una vez que se completa el reconocimiento de esa línea, el procedimiento pasa al paso S8 y finaliza el proceso de reconocimiento.
Por otro lado, cuando el resultado de reconocimiento se almacena en el paso S5, el proceso de corrección se inicia en paralelo con el proceso de reconocimiento de caracteres descrito anteriormente (paso S9). En el paso S10, se muestra el resultado de reconocimiento, y en el paso S11, el operador ejecuta el trabajo de confirmación y corrección. En la etapa S12, el resultado de la corrección se almacena en la memoria de caracteres de visualización 5. En la etapa S13, se determina si se ha completado o no todo el procesamiento de corrección. Cuando se completa el proceso de corrección, se completa el trabajo en esa línea. Cuando se almacena el resultado de reconocimiento de la siguiente línea, se inicia nuevamente la operación de la etapa S 9 etapa S 13, y se habilita el trabajo de corrección de cada fila.
Obsérvese que el resultado de reconocimiento de la tercera línea y posteriormente del documento de entrada 13 mostrado en la figura 1 se desplaza utilizando la barra de desplazamiento 15 cuando solo se pueden mostrar dos líneas debido a la configuración de la pantalla mostrada por el resultado de reconocimiento. Como se muestra en la FIG. Por supuesto, esto puede ser de un formato en el que todas las líneas se muestran colectivamente.
La figura 5 muestra un ejemplo modificado del método de visualización de reconocimiento de caracteres de la presente invención. El documento de entrada 13 en la figura no está formateado horizontalmente escrito una línea a la vez como se describió anteriormente, sino en un formato estructurado en una región hasta la sección R1 R4. En tal caso, el dispositivo de reconocimiento 11 realiza reconocimiento de caracteres para cada sección de una determinada unidad como se muestra en la figura, no para cada fila. Por lo tanto, en este ejemplo, el resultado de reconocimiento de caracteres relativo a la sección R1 se envía primero al aparato de corrección 12. En el estado X1, se muestra el resultado de reconocimiento para la sección de caracteres R1 y es posible modificarlo. En el siguiente estado X2, el resultado de procesamiento de reconocimiento para otra sección de caracteres R2 se transfiere al aparato de corrección 12 y estas modificaciones son posibles Es el procedimiento para convertirse. A continuación, el resultado del procesamiento de reconocimiento de la sección de caracteres siguiente se agrega uno después de otro de la misma manera, y finalmente, para todas las secciones, se puede corregir el resultado del reconocimiento. Entonces, de la misma manera que se ha descrito anteriormente, se realiza la escritura de nuevo en la memoria de resultados de reconocimiento 3 o similar.
La figura 6 es un diagrama para explicar el funcionamiento de la segunda realización. Este diagrama de flujo es casi el mismo procesamiento que la figura 4, tal como entrada de imagen en el paso S1 en el dibujo, análisis de imagen en el paso S2, inicialización del parámetro j en el paso S3, pero los parámetros en el paso S3 no están en línea Se establece de manera diferente para cada sección. El paso S4 ejecuta el procesamiento de reconocimiento de la sección j-ésima, almacena el resultado de reconocimiento en el paso S5 e incrementa j en el paso S6. En el paso S7, se juzga si j excede o no de todas las particiones y, como resultado, se avanza en el procesamiento de reconocimiento de todas las secciones incluidas en el documento. Cada vez que se completa el procesamiento de cada sección, el flujo continúa al paso S9, y se lleva a cabo el procesamiento de corrección del paso S9 paso S13. Esto es exactamente lo mismo que el procesamiento mostrado en la figura 4, y la descripción redundante se omitirá.
Efecto de la invención
En el método de procesamiento de reconocimiento de documentos de la presente invención descrito anteriormente, cuando se reconoce una imagen de carácter descrita en un documento de entrada, el documento se divide en ciertas unidades y se finaliza el reconocimiento de caracteres en la unidad del documento Cada resultado de reconocimiento se transfiere a una región de procesamiento de corrección que puede corregirse y corregirse utilizando un dispositivo de corrección y combinarse con el resultado de reconocimiento de caracteres ya procesado y almacenarse nuevamente en la región corregible para su corrección. Por ejemplo, cada vez que se completa el reconocimiento de una línea, se debe corregir el resultado del reconocimiento de caracteres al que se agregó el resultado de reconocimiento de caracteres, y se puede realizar el trabajo de corrección. Además, durante dicha modificación, el dispositivo de procesamiento de reconocimiento de caracteres ejecuta el procesamiento de reconocimiento de caracteres en el documento de la siguiente unidad en paralelo, de modo que no solo se reduce el tiempo de espera del operador sino que también se acelera el procesamiento de reconocimiento de caracteres de todo el documento. La eficiencia del trabajo mejora.
Breve descripción de los dibujos La figura 1 es un diagrama explicativo de un método de procesamiento de reconocimiento de documentos de la presente invención.
La figura 2 es un diagrama de bloques del sistema para implementar la presente invención.
La figura 3 es un diagrama explicativo de un método de procesamiento de resultados de reconocimiento.
La figura 4 es un diagrama de flujo de operación de la primera realización.
La figura 5 es un diagrama explicativo de un ejemplo modificado del método de procesamiento de reconocimiento de documentos de la presente invención.
La figura 6 es un diagrama de flujo de operación de la segunda realización.
11 dispositivo de reconocimiento
12 Modificador
13 Documento de entrada
Reclamo
Reivindicaciones: lo que se reclama es: 1. Un método de reconocimiento de caracteres para reconocer una imagen de personaje descrita en un documento de entrada, que comprende los pasos de: dividir el documento en ciertas unidades y cada vez que termina el reconocimiento de caracteres en el documento de una unidad, Al área de procesamiento de corrección que puede corregirse y corregirse utilizando el dispositivo de corrección, se combina con el resultado de reconocimiento de caracteres ya procesado y se vuelve a almacenar en el área corregible, y también se procesa el reconocimiento de caracteres en el siguiente documento de unidad Para iniciar el procesamiento de reconocimiento de documentos.
Dibujo :
Application number :1997-006918
Inventors :沖電気工業株式会社
Original Assignee :石原清志、中村哲夫