Dispositivo de reconocimiento de imágenes de documentos
Descripción general
 De este modo, es posible reducir el tiempo de corrección y la carga de la información de diseño. ] El aparato de reconocimiento de imágenes de documentos, gráficos de separación de la imagen del documento almacenado en la unidad de almacenamiento de documentos de imagen 1, el análisis de la Tabla, multi-columna línea de separación de separación de línea de separación, y la segmentación de caracteres, la sección de análisis de la distribución para la extracción de información de diseño 2, el error de separación entrada de la tabla, el error de separación de la línea, para determinar la parte de la línea que separa el error, la unidad de disposición de almacenamiento de información 4 para el almacenamiento de una unidad de detección candidato error disposición 3 someter un indicador que indica el tipo de error, una marca con información de diseño . Además, una sección de almacenamiento de información de caracteres 6 para almacenar la imagen del documento un código de carácter reconocido por la unidad de reconocimiento de caracteres 5, como información de pantalla para el candidato de diseño La imagen del documento y el código de caracteres con banderas, información de re-análisis para seleccionar el candidato correcta disposición salida como una sección de procesamiento de corrección 7 para corregir el código de caracteres de error, y re-análisis unidad de control 9 para iniciar la repetición de procesamiento de análisis de la distribución de la información de reanálisis a la sección de análisis de la capa 2, una unidad de visualización de imagen para la visualización de la información en pantalla .
Campo técnico
La presente invención se refiere a un aparato de reconocimiento de imágenes de documentos, y más particularmente a un aparato de reconocimiento de imágenes de documentos para reconocer una imagen de documento para el control electrónico de un documento.
Antecedentes de la técnica
Convencionalmente, en este tipo de aparato de reconocimiento de imágenes de documentos, el trabajo de corrección de errores de reconocimiento es indispensable. Para el trabajo de corrección eficiente, y los dispositivos para corregir mostrar el carácter candidato en el resultado de reconocimiento de caracteres, volver a reconocer el dispositivo y la porción de error únicamente los resultados de reconocimiento de caracteres mediante la limitación de los tipos de caracteres, la porción de error de la separación carácter Se ha propuesto corregir las posiciones de los delimitadores de caracteres y reconocerlos nuevamente.
Este tipo de aparato de reconocimiento de imagen del documento, por ejemplo como se describe en la Solicitud de Patente Japonesa No. 5 62 008 Pat, incluso si se ha producido un error en el resultado de reconocimiento en el curso del reconocimiento de caracteres, el candidato en vez de introducir manualmente el carácter correcto Existe la ventaja de que es posible seleccionar la respuesta correcta de entre y corregirla.
La descripción de la Solicitud de Patente Japonesa Nº 62008 se describirá a continuación con referencia al diagrama explicativo que se muestra en la FIG. La figura 6 es una pantalla para seleccionar candidatos de caracteres visualizados en la pantalla. Para cada imagen de personaje especificada en el rango de corrección, se envían caracteres candidatos superiores en el resultado de reconocimiento original. El carácter de respuesta correcta se puede seleccionar al especificarlo con el cursor.
A continuación, un ejemplo de corregir los errores del resultado del reconocimiento por la re-reconocimiento mediante la limitación de los tipos de caracteres, como la solicitud de patente japonesa No. 5 62 008 Pat se describirá con referencia al diagrama mostrado en la figura. La figura 7 es una pantalla para seleccionar un candidato de corrección en el reconocimiento de tipo de carácter limitado visualizado en la pantalla. Si especifica un rango de corrección en la imagen original, se muestra un menú de corrección. El carácter es alfabético en la imagen original, como se muestra en la Fig. 7, si un error se reconoce en Hirakana ocurre, porque 'carta reafirman' es apropiado, alfabético recordado el sitio especificado a ser especificado por el cursor Y el contenido del resultado de reconocimiento de caracteres se puede actualizar.
A continuación, los errores de segmentación de caracteres se dieron cuenta de nuevo cambiando la posición del carácter delimitado, un ejemplo de corregir los errores del resultado de reconocimiento, también la solicitud de patente japonesa No. 5 62 008 Pat, usando una ilustración mostrada en la Fig. 8 describe . La figura 8 es una pantalla de corrección de interrupción de caracteres mostrada en la pantalla. Cuando 'delimitado modificado', como se muestra en la Fig. 7 se selecciona como el rango de corrección, es posible que ser delimitado muestra pantalla de corrección en la Fig. 8 aparecen, especifica el candidato delimitador de caracteres en el cursor. Por ejemplo, las barras verticales en la figura 8 la línea continua Caduca carácter allí, línea de puntos representa no hay caracteres rotos en el mismo, puede cambiar las posiciones de los caracteres de segmentación en especificando el cursor.
De esta forma, el usuario puede volver a reconocer corrigiendo el resultado de reconocimiento de caracteres, corrigiendo el delimitador de caracteres, seleccionando el diccionario.
Tarea de solución
El aparato de reconocimiento de imágenes de documentos convencional, en la modificación del resultado de reconocimiento de caracteres, o especifica el candidato personaje es correcta, o modificar errores delimitados, tales como la modificación y re-reconocida como una limitación del diccionario Aunque la capacidad de modificar caracteres individuales se realizan, zona o columna como elemento de la tabla contenida en el documento, la capacidad de modificar la información de diseño tales como la disposición del subrayado o subrayado no se ha realizado. Es decir, debido a errores en la información de diseño en la tecnología anterior, cuando se produce un error en el carácter o secuencia de caracteres interpretación es necesario que el usuario dé el resultado correcto análisis de la distribución de la mano de modificación. Además, aumenta el tiempo y la carga para corregir el error de reconocimiento de dicha información de diseño.
Un objeto de la presente invención, reducir el tiempo y las cargas de la modificación de la información de diseño, proporcionando la adición de indicador de error de la disposición correspondiente al tipo de error disposición análisis basados ​​de nuevo en las limitaciones de diseño de función correspondientes Y para proporcionar un posible aparato de reconocimiento de imágenes de documentos.
Solución
aparato de reconocimiento de imágenes de documentos de la presente invención, una unidad de almacenamiento de documentos de imagen para almacenar una unidad de documento de entrada de imagen para introducir un documento como datos de imagen cuantificados, una imagen de documento introducida desde la unidad de entrada de imagen del documento, diagramas con respecto a la imagen del documento separación, análisis de la tabla, multi-columna de separación de línea de separación de la línea de separación, se somete a la segmentación de caracteres, la sección de análisis de la distribución para la extracción de información de diseño, entre la información de diseño obtenido en la sección de análisis de diseño, las líneas que constituyen la entrada de la tabla dictaminó , El error de separación del segmento de línea se determina mediante verificación usando el tono de carácter y el ancho del carácter, y se utilizan el paso de línea y el ancho de línea verificada por error determinada separación fila, respectivamente, y la unidad de detección candidato error disposición para añadir un indicador de error de disposición que indica el tipo de error, Leia se añade dicho indicador de error de diseño Una unidad de diseño de almacenamiento de información para almacenar la información de puerta, reconoce una imagen de carácter obtenida en la sección de análisis de la distribución, y la sección de reconocimiento de caracteres para obtener un código de carácter, un carácter de almacenamiento de información para almacenar los códigos de caracteres obtenidos por la unidad de reconocimiento de caracteres partes y la unidad de entrada de instrucciones de corrección para la entrada de una operación del usuario, la tabla de área de entrada de dirección división y el número de la división región que los candidatos de diseño para los errores de separación, dirección segmento como los candidatos de diseño para el error separación de la línea, y el error de separación fila almacenar previamente la dirección de la cadena de caracteres como candidatos para la disposición, dijo que los candidatos de diseño que recibe una salida de cada uno de dicha unidad de almacenamiento de información de diseño y la unidad de almacenamiento de imágenes de documentos de la unidad de almacenamiento de información de carácter, que corresponde a la marca de error de diseño Salida de la imagen del documento y el código de carácter como información de visualización, siguiendo la salida de la unidad de entrada de la instrucción de corrección Salida como información de reanálisis para seleccionar el candidato diseño correcto de entre los candidatos diseño también incluye una unidad de procesamiento de corrección para corregir un código de caracteres que tiene un error de acuerdo con la salida de dicha unidad de entrada de instrucción de corrección, designado por la unidad de procesamiento de corrección sobre la base de la información re-análisis, y la unidad de control de re-análisis para iniciar la nueva ejecución del procesamiento de análisis de la distribución de la sección de análisis de la distribución, y una unidad de visualización de imagen para la visualización de la salida de información de la pantalla de la unidad de procesamiento de corrección .
A continuación, la presente invención se describirá con referencia a los dibujos. Haciendo referencia a la figura 1 que muestra una realización de la presente invención en el bloque, el aparato de reconocimiento de imágenes de documentos de esta realización incluye una unidad de documento de entrada de imagen 10 para la introducción de un documento como datos de imagen cuantificados se introduce desde la unidad de entrada de imagen del documento 10 una sección de almacenamiento de imagen del documento 1 para el almacenamiento de una imagen de documento, tabla separa a esta imagen del documento, el análisis de tablas, multi-columna de separación de línea de separación de la línea de separación, se somete a la segmentación de caracteres, y la sección de análisis de la distribución 2 para la extracción de información de diseño de la información de diseño obtenido en esta sección de análisis de distribución 2, se trata de un error de separación entrada de la tabla usando el contorno de la forma de las líneas rayadas que constituyen las entradas de la tabla para determinar la parte alta, con el paso de los caracteres, la anchura de los caracteres determinar el error de separación de la línea mediante la verificación, también para determinar el error separación de la línea por la verificación con paso de fila, las anchuras de fila, respectivamente, la adición de un indicador de error de disposición que indica el tipo de diseños de error Ri y detección candidato unidad 3, se añade una información de diseño unidad 4 de almacenamiento para almacenar la información de diseño bandera de error de la disposición, para reconocer una imagen de carácter obtenida en la sección de análisis de la disposición 2, una unidad de reconocimiento de caracteres 5 para obtener un código de carácter una sección de almacenamiento de información de caracteres 6 para almacenar los códigos de caracteres obtenidos por la unidad de reconocimiento de caracteres 5, una unidad de entrada de instrucción de corrección 8 para introducir una operación del usuario, la dirección de la división de área y la división de área que los candidatos de diseño para error mesa de separación entrada número, línea de dirección de la línea de separación como candidato diseño de los errores, y, por adelantado y almacena la dirección de la cadena de caracteres como candidatos de diseño para el error de separación fila, la unidad de diseño de almacenamiento de la información 4 y la sección de almacenamiento de imágenes de documentos 1 y el almacenamiento de la información de carácter sección 6 , Introduce el candidato de diseño correspondiente al indicador de error de disposición, la imagen del documento y el código de carácter De salida como se muestra información, y da salida a la información de reanálisis para seleccionar el candidato disposición correcta de entre el diseño candidato de acuerdo con la salida de la unidad de entrada de instrucción de corrección 8, también corrige los códigos de caracteres según errónea con la salida de la sección de entrada de instrucción de corrección 8 una unidad de procesamiento de corrección 7 que, basándose en la información reanálisis especificado en esta sección de procesamiento de corrección 7, una unidad de control reanálisis 9 para iniciar el re-ejecución del procesamiento de análisis de diseño para la sección de análisis de la distribución 2, la sección de procesamiento de corrección de 7 Y una unidad de visualización de imágenes 20 para visualizar la información de visualización emitida desde la unidad de visualización de imágenes 20.
sección de análisis Layout 2, el área de texto del documento se divide en los componentes de la área de la gráfica, la separación de gráfico, análisis de la tabla, multi-columna de separación de línea de separación de la línea de separación, se somete a la segmentación de caracteres, la relación de secuencia, las relaciones de contención de error disposición Y lo envía a la unidad de detección de candidatos 3. Por espacio de tabla como región determinada, por ejemplo, por el contorno proceso de rastreo para extraer la columna de la partida de la tabla, la alimentación de la disposición de columna de elemento de la tabla, los campos de elementos correspondientes que describen cuestiones en una sección de la disposición de detección de error candidato 3 . Para ello se determina que el área de región de texto, eliminando filas regiones que constituyen el área de texto, la extracción de la zona de la unidad de caracteres que constituye el área de la línea se realiza, arreglo de filas, la disposición de caracteres candidata error de diseño Y enviado a la unidad de detección 3. Si se extrae de subrayado o subrayar la discriminación utilizando la zona de unión, un segmento de línea de relación disposición, la correspondencia entre el segmento y los caracteres son emitidas como la información de diseño se envía a la sección de detección de error candidato disposición 3.
De la información de diseño obtenido en la sección de análisis de distribución 2, el error de separación entrada de la tabla, el error de separación de la línea, y la porción es probable que sea un error de separación de la línea se determina por la unidad de detección candidato error disposición 3, respectivamente Se agrega un indicador de error de diseño que indica el tipo de error. En la sección de análisis de la distribución 2, cuando una pluralidad de entradas de tabla de la columna se extrae como una sola columna de artículo, verifica con el contorno de la forma de las líneas rayadas que constituyen la entrada de la tabla, o no su forma de contorno es rectangular, vertical y horizontal , El indicador se agrega como una porción que es altamente probable que sea un error de separación de elementos de tabla. Además, si el segmento de línea y el carácter se extrae como una única masa en contacto, se realiza la verificación mediante el paso de los caracteres y el ancho de carácter, el paso de caracteres, ancho de carácter otro tono promedio carácter, mayor que la anchura de los caracteres , La bandera se agrega como una porción que es altamente probable que sea un error de separación de segmento. Si varias filas se extraen como una sola línea, se realiza la verificación utilizando un paso de línea y el ancho de línea, paso de línea, ancho de línea otro paso de la línea media, es mayor que el ancho de línea, ser una línea que separa el error La bandera se agrega como una parte alta. Aquí, la información de disposición a la que se añade el indicador de error de disposición también se almacena en la unidad de almacenamiento de información de disposición 4.
Por otra parte, la imagen de un personaje que se determina como un área de carácter se emite como un código de carácter reconocido por la unidad de reconocimiento de caracteres 5 de la sección de análisis de la distribución 2, se almacenan en la sección de almacenamiento de información de caracteres 6. información de diseño bandera de error de la disposición adicional, la sección de procesamiento de corrección 7, la imagen del documento se envía desde la unidad de almacenamiento de documentos de imagen 1, y, asociado con el código de carácter enviado desde la unidad de almacenamiento de información de caracteres 6, la unidad de visualización de imágenes 20 y se muestra. Al mismo tiempo, almacenado previamente, los errores de separación de entrada de tabla en la correspondiente dirección división de área y el número de la división región de candidatos, el candidato línea de dirección segmento correspondiente a los errores de separación de segmento de línea y, en la dirección de la cadena de caracteres correspondiente a la fila de separación errores Se envían a la unidad de visualización de imágenes 20 como candidatos de diseño y se muestran. En este caso, la sección de procesamiento de corrección de 7, de acuerdo con una instrucción de una operación de usuario obtenida en la unidad de entrada de instrucciones de corrección 8 para seleccionar los candidatos diseño correcto de entre los candidatos de diseño mostrados. Además, si la información del personaje es incorrecta, se corrige.
El candidato de disposición seleccionado por la unidad de procesamiento de corrección 7 se envía a la unidad de control de reanálisis 9 como información de reanálisis. controlador Reanálisis 9 basa en la entrada de información de reanálisis, y da salida a una instrucción de re-ejecución de análisis de la distribución de las regiones relevantes, la sección de análisis de diseño 2 recibe esta realiza reanálisis. Resultados de reanálisis, similar a los resultados del primer momento del análisis, la disposición de detección de error unidad 3, la unidad de almacenamiento de información de diseño 4, una sección de reconocimiento de caracteres 5, una sección de almacenamiento de información de caracteres 6, y la unidad de visualización de imágenes a través de la unidad de proceso de ajuste 7 20.
La figura 2 y la figura 3 son diagramas que muestran un ejemplo de corrección del error de separación de elementos en la tabla. En la Fig. 2, a fin de romper la línea que separa se ha producido la columna elemento de la tabla, la sección de análisis de la disposición 2, columna elemento en el que dos adyacentes se extraen como una columna artículo. En la disposición unidad de detección candidato error 3, ya que el indicador de error de diseño se añade por verificación usando el contorno de la forma de la columna de elemento, la imagen del documento y el código de carácter se visualiza en la unidad de visualización de imágenes 20 como en la figura. Además, también se muestran los candidatos de disposición correspondientes a indicadores de error de disposición almacenados en la unidad de procesamiento de corrección 7. En este caso, la columna artículo porque se piensa que es presente en las dos etapas de la horizontal, el usuario de entre los candidatos de diseño a través de la unidad de entrada de instrucción de corrección 8, selecciona las dos etapas horizontal separación entradas de la tabla. La unidad de re-análisis de control 9, mediante la adición de una limitación para re-análisis que se divide en dos etapas en el horizontal, dividiendo correctamente la región como en la Fig. 3 mediante el uso de información de la proyección de un píxel.
4 y 5 son diagramas que muestran un ejemplo de corrección de errores de separación de segmentos de línea. En la Fig. 4, se genera para el contacto con el carácter y el segmento de línea, la sección de análisis de la disposición 2, una cadena de caracteres y el subrayado se extrae como una sola masa. Por lo tanto, se reconoce como un carácter y no se obtiene el código de carácter correcto. En la disposición unidad de detección candidato error 3, ya que el indicador de error de diseño se añade por verificación usando la imagen del documento paso de los caracteres y el ancho de carácter, y el código de carácter se visualiza en la unidad de visualización de la imagen 20 como en la figura. Además, también se muestran los candidatos de disposición correspondientes a indicadores de error de disposición almacenados en la unidad de procesamiento de corrección 7. En este momento, el usuario puede seleccionar la letra subrayada del candidato de diseño a través de la unidad de entrada de instrucción de corrección 8 mediante la separación de línea. Existe la unidad de control de re-análisis 9, cuando los errores de separación subrayadas, mediante la adición de una limitación para la re-análisis que sólo ponen de relieve el carácter, la separación de los caracteres de la línea como se muestra en la Fig. 5 mediante el uso de una información de la proyección.
De esta manera, el análisis de disposición se puede realizar nuevamente según el tipo de error para obtener resultados correctos.
Efecto de la invención
Como se ha descrito anteriormente, de acuerdo con la presente invención, cuando la corrección de errores análisis de la distribución, es posible obtener un resultado correcto realizó el análisis de nuevo diseño para seleccionar el tipo de error y reduce significativamente el proceso de corrección por el usuario Es posible
La figura 1 es un diagrama de bloques que muestra una configuración de una realización de la presente invención.
La figura 2 es un diagrama para explicar una operación para corregir un error de separación de elementos de tabla en esta realización.
La figura 3 es un diagrama para explicar la finalización de la corrección del error de separación de elementos de tabla en esta realización.
La figura 4 es un diagrama para explicar una operación para corregir un error de separación de segmentos de línea de acuerdo con esta realización.
La figura 5 es un diagrama para explicar la finalización de la corrección del error de separación del segmento de línea de acuerdo con esta realización.
La figura 6 es un diagrama para explicar una operación para corregir una parte erróneamente reconocida en el ejemplo convencional.
La figura 7 es un diagrama para explicar una operación en la selección de candidatos de caracteres en el ejemplo convencional.
La figura 8 es un diagrama para explicar una operación en una corrección del delimitador de caracteres en el ejemplo convencional.
1 unidad de almacenamiento de imágenes de documentos
2 Unidad de análisis de diseño
3 Unidad de detección de candidatos de error de diseño
Unidad de almacenamiento de información de diseño 4
Parte de reconocimiento de 5 caracteres
Parte de almacenamiento de información de 6 caracteres
7 Unidad de procesamiento de corrección
8 Unidad de entrada de instrucción de corrección
9 Unidad de control de reanálisis
10 Unidad de entrada de imagen del documento
unidad de visualización de imágenes 20
Dibujo :
Application number :1996-153161
Inventors :日本電気株式会社
Original Assignee :白川洋一、上村健、津雲淳