Sistema de procesamiento de información de texto, método y sistema de archivo de imágenes que almacena la imagen
Descripción general
 En un sistema de procesamiento de información de caracteres que reconoce esto al ingresar caracteres, hace que sea fácil comparar los caracteres ingresados ​​por el usuario y los caracteres reconocidos por el sistema. ] Envíe la imagen del personaje en el formato especificado por el primer FAX, recíbalo con el segundo FAX, léalo e introdúzcalo. Con referencia a la información de reconocimiento de caracteres de esta imagen de entrada, la imagen correspondiente al personaje se convierte en el código correspondiente, y se convierte en la imagen de la fuente. Luego, refiriéndose a la información de formato del formato, la imagen sintetizada se genera combinando la imagen del carácter de entrada y una o más imágenes de fuente convertidas. Y transmite la imagen sintetizada desde el segundo FAX al primer FAX.
Campo técnico
La presente invención se refiere a un sistema de archivo de imagen para el almacenamiento de sistema de procesamiento de información de caracteres, el método y la imagen, un sistema de procesamiento de la información caracteres reconocer lee los caracteres escritos a mano, en particular, envía una imagen de formulario utilizando un FAX , Un sistema de procesamiento de información de caracteres y un método adecuado para leer y reconocer la imagen enviada y confirmar el resultado de reconocimiento en la fuente de transmisión, y un sistema de archivo de imágenes para almacenar la imagen compuesta creada.
Antecedentes de la técnica
2. Descripción de la técnica relacionada. Convencionalmente, se conoce un sistema que transmite caracteres por facsímil o similar y los lee y reconoce utilizando medios ópticos.
En primer lugar, se describirá un sistema de acuerdo con una técnica convencional con referencia a las figuras 1 y 2. La figura 1 es un diagrama de configuración del sistema de un sistema FAX OCR. La figura 2 es un diagrama esquemático que muestra un ejemplo de un formato de formulario utilizado en un sistema FAX OCR convencional.
Este sistema está configurado para enviar cartas desde FAX 11 (facsímil) y leerlas por fax OCR 12 (facsímil-lector óptico de caracteres).
En primer lugar, los caracteres manuscritos se escriben en la forma 21 mostrada en la figura 2 y se transmiten desde el facsímil 11. Para saber si se pueden leer o no estos datos, el FAX OCR 12 lo verificó enviando el resultado de lectura como una imagen de resultado de lectura.
Alternativamente, se han adoptado medios para marcar o devolver caracteres ilegibles y devolver los caracteres.
Como tal técnica, el 'aparato de procesamiento de comunicación de reconocimiento de caracteres' de JP-A 5 274 463 JP, cuando no reconoce el carácter, enviar de vuelta un resultado de reconocimiento que no puede ser reconocido caracteres en la fuente, la reentrada Se insta a alentar.
Tarea de solución
En la técnica convencional anterior, cuando un sitio para ingresar caracteres y un sitio para reconocer el carácter están separados el uno del otro, es un método para verificar en el lado emisor si el personaje se transmitió correctamente.
Sin embargo, con la técnica convencional antes mencionada, es imposible comparar caracteres realmente escritos y transmitidos con caracteres reconocidos por el sistema, y ​​es difícil para el usuario comparar los caracteres transmitidos y leer los resultados como imágenes y es difícil de entender Hubo un problema.
También, convencionalmente, una imagen leída como una imagen por OCR y un personaje reconocido se guardan en diferentes formas, y es incómodo de buscar y es difícil hacer coincidir los caracteres reconocidos como entrada como caracteres. Hubo un punto.
La presente invención se ha realizado para resolver los problemas de la técnica anterior, y su objeto es al texto de entrada, en el reconocimiento de caracteres sistema de procesamiento de información de este carácter y una entrada de sistema por el usuario es reconocido Y para comparar fácilmente personajes entre sí.
Es otro objeto de la presente invención proporcionar un sistema de archivo de imágenes capaz de verificar simultáneamente caracteres reconocidos cuando se busca una forma de entrada o similar.
Solución
Con el fin de lograr el objeto anterior, de acuerdo con un sistema de procesamiento de información de caracteres de la presente invención, un sistema de procesamiento de información de caracteres para ingresar un carácter formateado predeterminado como una imagen y procesar el carácter, la información de formato del formato y , Medios para ingresar un personaje como una imagen, significa reconocer un personaje y convertirlo en un código correspondiente, medios para convertir el código en una imagen y medios para sintetizar la imagen Medios para introducir un carácter como una entrada de imagen significa introducir una imagen de carácter de un formato predeterminado y hacer referencia a dicha información de formato de dicho formato desde dicha imagen de personaje para generar un personaje , Medios para reconocer el carácter y convertirlo en el código correspondiente se refiere a la información de reconocimiento de caracteres y corresponde a la imagen correspondiente a un personaje Medios para convertir dicho código en una imagen y convertir dicho código en una imagen convirtiendo dicho código convertido en una imagen de una fuente correspondiente haciendo referencia a información de fuente y medios para sintetizar dicha imagen, Un medio para referirse a la información de formato para sintetizar la imagen de caracteres ingresada y una o más imágenes de la fuente convertida para generar una imagen combinada y generar la imagen sintetizada, Y saca una imagen.
Más específicamente, en el sistema de procesamiento de información de caracteres, el formato predeterminado se determina de modo que la imagen de carácter que se va a ingresar y la imagen de la fuente correspondiente al personaje se colocan en una posición comparable, y el formato De acuerdo con la información, se genera una imagen compuesta que se puede comparar con la imagen del carácter de entrada y la imagen de la fuente correspondiente al carácter.
Más específicamente, el sistema de procesamiento de información de caracteres tiene un primer FAX y un segundo FAX que están conectados por una línea de comunicación y pueden intercambiar imágenes, y por el primer FAX, Recepción de la imagen del personaje transmitido por el segundo FAX, ingreso de la imagen del personaje recibido y salida de la imagen sintetizada emitida desde el segundo FAX al primer FAX Y lo transmite al FAX.
Además, la invención del sistema de archivo de imágenes según la presente invención se caracteriza por comprender medios para almacenar una imagen y medios para buscar una imagen, en donde dicha imagen generada es almacenada y recuperada por dicho sistema de procesamiento de información de caracteres .
A continuación, la configuración de la invención de acuerdo con el método de procesamiento carácter de la presente invención, el método de procesamiento de información de caracteres para los caracteres de entrada en un formato definido como una imagen, procesa los caracteres, y la información de formato del formato, la información de reconocimiento de caracteres Medios para ingresar un personaje como imagen, significa reconocer un personaje y convertirlo en un código correspondiente, medios para convertir el código en una imagen, medios para sintetizar la imagen, medios para combinar (1) un procedimiento en el que los medios para ingresar caracteres como imágenes ingresan una imagen de carácter de un formato predeterminado, (2) se refiere a la información de formato del formato de la imagen de personaje (3) Un medio para reconocer el carácter y convertirlo en el código correspondiente se refiere a la información de reconocimiento de caracteres y corresponde a la imagen correspondiente a un personaje (4) un procedimiento para convertir el código en una imagen, convirtiendo el código convertido en una imagen de una fuente correspondiente con referencia a la información de la fuente, (5) sintetizando la imagen Un paso de referirse a la información de formato del formato para sintetizar la imagen del personaje ingresado y una o más imágenes de la fuente convertida para generar una imagen sintetizada, (1) a (6) se llevan a cabo en este orden, y los medios para emitir la imagen que se enviará incluyen un procedimiento para emitir la imagen compuesta.
Más específicamente, la presente invención se refiere a un método de procesamiento de información de carácter que incluye un primer FAX y un segundo FAX que están conectados por una línea de comunicación y pueden intercambiar imágenes, cada paso del método de procesamiento de información de caracteres y (0) (1) 'un procedimiento de introducción de la imagen de carácter recibida, (7) un procedimiento para transmitir la imagen de carácter del formato predeterminado transmitiendo la imagen de carácter del formato predeterminado y recibiendo la imagen de carácter transmitida por el segundo FAX, (1) ', los procedimientos de (2) a (6), el procedimiento de (1)', 7) se llevan a cabo en este orden.
De acuerdo con la presente invención, se sintetiza una imagen introduciendo caracteres y reconociendo los caracteres de entrada en una forma comparable. Por lo tanto, al confirmar, los caracteres ingresados ​​y sus resultados de reconocimiento son obvios.
En particular, cuando el sitio de entrada y el sitio que reconoce caracteres son sitios remotos, por ejemplo, cuando el lado de entrada es el sistema FAX OCR que es FAX, la ventaja que puede confirmarse en la fuente de transmisión es grande.
Además, al buscar esta imagen compuesta usando un disco óptico o similar, es conveniente ya que puede buscar y comparar la imagen de entrada y el resultado de reconocimiento al mismo tiempo.
Descripción detallada de las realizaciones preferidas A continuación, se describirá una realización de la presente invención con referencia a las figuras 1 y 3 a 7. La FIG.
[FAX OCR System] En lo sucesivo, se describirá una realización de acuerdo con la presente invención con referencia a la figura 1 y a las figuras 3 a 6. La fig. En primer lugar, se describirá la configuración del sistema de FAX OCR de acuerdo con la presente invención con referencia a las figuras 1 y 3. La figura 1 es un diagrama de configuración del sistema de un sistema FAX de FAX como se describió anteriormente. La figura 3 es un diagrama esquemático que muestra un ejemplo de un formato de formulario utilizado en el sistema FAX de FAX de acuerdo con la presente invención.
En este sistema, FAX 11 (facsímil) y FAX OCR 12 (facsímil-lector óptico de caracteres) están conectados por una línea de comunicación, como una línea telefónica, y es posible el intercambio de información. FAX OCR 12 generalmente se encuentra en la sede, la sede, la sede, etc., donde se supervisa la información, mientras que cada sucursal, sucursal o departamento de sucursal tiene FAX 11.
Luego, desde el FAX 11, la forma preparada se transmite al FAX OCR 12. El FAX OCR 12 lee caracteres de una imagen de datos recibidos y realiza el procesamiento de datos y la acumulación de datos y similares.
Ahora tomemos el ejemplo que se muestra en la Fig. 3 como ejemplo y expliquemos el funcionamiento de este sistema.
El usuario escribe caracteres por escritura a mano en la aplicación n. ° 32, nombre 34 y dirección 36, que son elementos necesarios de este formulario 31. Este personaje debe estar escrito en un tipo de letra estándar en la medida en que la lectura mecánica sea posible. Luego, este formulario se transmite desde el FAX 11 al FAX OCR 12 a través de una línea de comunicación.
El FAX OCR 12 reconoce los caracteres en los que se describen la aplicación Nº 32, el nombre 34 y la dirección 36 a leer de la imagen recibida. A continuación, el carácter se busca con el código correspondiente del personaje, y la fuente creada con antelación crea los datos de la imagen. Entonces, los datos de caracteres reconocidos como el mismo carácter que el usuario escribió, aplicación No32, el nombre 34, correspondiente a la dirección 36, respectivamente, la lectura de aplicación resultado No33, cada columna del nombre de resultado de lectura 35, lee resultado Dirección 37 . Después de eso, los datos sintetizados como se muestra en la figura 3 (b) se envían de vuelta al facsímil 11 que es la fuente de envío para que el usuario verifique si el usuario puede leerlo correctamente.
A continuación, con referencia a la figura 4 y la figura 5, se describirá en detalle el procedimiento de procesamiento del FAX OCR 12. La figura 4 es un diagrama esquemático que muestra cada parte del FAX OCR 12 y el flujo de datos. La figura 5 es un diagrama de flujo que muestra el procedimiento de procesamiento del FAX OCR 12. La figura 6 es un diagrama que resalta que el carácter manuscrito no pudo leerse. En primer lugar, la unidad de recepción de imágenes 41 recibe una imagen del facsímil 11 a través de una línea de comunicación (S 501).
imagen forma 412 La sección de reconocimiento de forma 42, con base en la información de formato 421, cortó de la imagen recibida 411, reconoce la posición del borde forma, la inclinación de la forma, tal como la distorsión de la forma a (S502).
En este ejemplo, se supone que el fondo de la forma es negro. Sin embargo, dado que el fondo de la imagen de FAX es normalmente blanco, en muchos casos, la posición de la forma a menudo se reconoce utilizando otros medios, por ejemplo, una marca de esquina.
Entonces, la posición de campo de la unidad 43 de corrección, la información de la imagen de formulario 412 reconocido por la sección de reconocimiento de formas (posición de forma borde, la inclinación de la forma, la forma de la cepa) 42 de acuerdo con una información de lectura de posición de campo incluido en la información de formato, campo de lectura 413 está corregido y calculado (S 503).
A continuación, la unidad de segmentación de caracteres 44, de acuerdo con la información de posición de lectura incluido en la información de formato 421, cortar un patrón de caracteres del campo de lectura de imágenes 413 en unidades de carácter (S504), genera el patrón de caracteres 451.
A continuación, la unidad de reconocimiento de caracteres 451 entradas del patrón de caracteres 451 cortado por la sección 44 de desconexión carácter, de acuerdo con el diccionario de reconocimiento 452 registrado previamente, el patrón 'como el personaje' reconoce (S505). Aquí, en el diccionario de reconocimiento, se almacena información sobre la forma del patrón de caracteres estándar de cada personaje. Además, reconocer 'como caracteres' significa comparar y comparar el patrón de un carácter 451 con este diccionario de reconocimiento y dar como resultado de lectura el código del carácter coincidente 453.
A continuación, la imagen de código de la sección 46 de conversión recibe el resultado de lectura 453 emitida por la unidad de reconocimiento de caracteres 45, una imagen de puntos que corresponde al código de la lectura de los resultados de las búsquedas de datos 453 de la fuente 461, la imagen del código de memoria intermedia 462 de conversión Y lo emite (S 506).
A continuación, la unidad de corrección de posición de campo 47 realiza el cálculo de corrección de posición del campo de pegado de resultado de lectura 414 en la imagen recibida 411 de acuerdo con la posición de pegado de resultado de lectura incluida en la información de formato 421 (S 507). Este proceso es el mismo proceso que el proceso de cálculo de corrección de posición de campo del campo de lectura en S 503.
A continuación, la unidad de síntesis de imagen 48, en referencia a los datos de posición obtenidos por el anterior S507, la síntesis de la imagen de puntos de la imagen de formulario 412 y la memoria intermedia de imagen de código de 462, y envía la imagen compuesta en la memoria intermedia de imagen compuesta (S508).
Finalmente, en la unidad de transmisión de síntesis de imágenes 49, la imagen compuesta en la memoria intermedia de imágenes compuestas 481 se devuelve al FAX 11 (S 509).
Aquí, como se muestra en la Fig. 6, la imagen de lectura, si no se puede reconocer como un carácter, que carácter, sombreado, puede devolver sometido a procesamiento, como inversión de tono imagen al remitente .
Además, en la presente realización, cuando se crea una imagen compuesta se muestra en la Fig. 3, la lectura de un ejemplo se ha demostrado que sólo el resultado composición de pasta, información adicional tal como OCR número de recepción Te fijada para crear una imagen compuesta También es bueno
Por ejemplo, si es una aplicación para la solicitud de membresía, pegue el número de membresía en el formulario recibido al momento de finalizar el proceso de inscripción y responda al remitente del formulario de solicitud para adquirir el número de miembro en el lugar y usarlo Se puede usar para.
Además, además de pegar el resultado de lectura, el resultado corregido por el operador en el lado de OCR se puede enviar nuevamente al FAX 11.
[Sistema de archivo de imágenes] A continuación, se describirá un sistema de archivo de imágenes para almacenar y recuperar imágenes creadas de acuerdo con la presente invención con referencia a la figura 7. La figura 7 es un diagrama de configuración de sistema del sistema de archivo de imágenes según la presente invención.
Para archivar imágenes sintetizadas, se pueden usar medios de gran capacidad como discos ópticos, discos magnetoópticos, etc.
Luego, ingresando un número de formulario o un nombre de formulario en un dispositivo de entrada, como un teclado, un mouse, etc. y buscando, se recupera y visualiza la imagen sintetizada. En este momento, si se utiliza el formato que se muestra en la figura 3, se ingresan los caracteres escritos a mano y el resultado de la lectura se puede verificar de inmediato, lo que es conveniente.
Efecto de la invención
De acuerdo con la presente invención, es posible proporcionar un sistema de procesamiento de información de caracteres capaz de comparar fácilmente caracteres introducidos por un usuario y caracteres reconocidos por el sistema en un sistema de procesamiento de información de caracteres que reconoce caracteres introduciendo caracteres.
Además, es posible proporcionar un sistema de archivo de imágenes capaz de verificar simultáneamente caracteres reconocidos cuando se busca una forma de entrada o similar.
La figura 1 es un diagrama de configuración del sistema de FAX OCR.
La figura 2 es un diagrama esquemático que muestra un ejemplo de un formato de formulario utilizado en un sistema FAX de FAX de acuerdo con la técnica anterior.
La figura 3 es un diagrama esquemático que muestra un ejemplo de un formato de formulario utilizado en un sistema FAX de FAX de acuerdo con la presente invención.
La figura 4 es un diagrama esquemático que muestra cada parte del FAX OCR 12 y un flujo de datos.
La figura 5 es un diagrama de flujo que muestra el procedimiento de procesamiento de FAX OCR 12.
La figura 6 es un diagrama que resalta que el carácter manuscrito no pudo leerse.
La figura 7 es un diagrama de configuración del sistema de un sistema de archivo de imágenes según la presente invención.
11 ... Fax, 12 ... OCR FAX, 21 ... de formato de forma convencional, 25 ... formatos de resultado de lectura convencionales, 31 ... formato de forma de la presente invención, 411 ... OCR recibido imagen, 412 ... forma de imagen en el OCR recibido de imagen, 413 ... Campo de lectura de la imagen del formulario en la imagen recibida por OCR, 414 ... lectura del resultado de la imagen del formulario en el campo pegado imagen recibida OCR, 462 ... leer el búfer de la imagen del resultado de la lectura, 481 ... buffer de composición de la imagen.
Reclamo
1. Un sistema de procesamiento de información de caracteres que ingresa caracteres formateados definidos como imágenes y procesa los caracteres, que comprenden información de formato de caracteres, información de reconocimiento de caracteres e información de fuentes, donde los caracteres se ingresan como imágenes Medios para reconocer un personaje y convertirlo en un código correspondiente, significa convertir el código en una imagen, medios para combinar la imagen y medios para generar la imagen sintetizada, El medio de entrada ingresa una imagen de carácter de un formato predeterminado, se refiere a la información de formato del formato de la imagen de personaje, corta una imagen correspondiente a un carácter, reconoce el carácter, reconoce el código correspondiente , Significa convertir una imagen correspondiente a un carácter en un código correspondiente al referirse a la información de reconocimiento de caracteres y convertir el código en una imagen, Convertir el código en una imagen de una fuente correspondiente con referencia a la información de fuente y los medios para sintetizar la imagen se refiere a la información de formato del formato y convierte la imagen de carácter de entrada y uno o más Y sintetizar la imagen de la fuente convertida para generar una imagen compuesta, y los medios para generar la imagen sintetizada generan la imagen compuesta.
2. Aparato de procesamiento de imágenes según la reivindicación 1, en el que el formato predeterminado se determina de modo que la imagen de carácter a ingresar y la imagen de la fuente correspondiente al personaje se coloquen en una posición comparable, y de acuerdo con la información de formato, Y la imagen de la fuente correspondiente al personaje se compara entre sí, la imagen sintetizada que se va a comparar se emite.
Atadas en la línea de comunicación reivindicación 3, y un primer fax e imágenes segundo número de fax de intercambio pueden ser transportadas por el primer fax, enviar una imagen de texto del formato prescrito, la primera Recepción de la imagen del personaje transmitido por el segundo FAX, ingreso de la imagen del personaje recibido y transmisión de la imagen combinada emitida desde el segundo FAX al primer FAX Y el sistema de procesamiento de información de caracteres de acuerdo con la reivindicación 1 o 2.
4. Sistema de procesamiento de información de caracteres según la reivindicación 1, que comprende medios para almacenar una imagen y medios para buscar una imagen, en el que dicha imagen generada puede almacenarse y recuperarse mediante dicho sistema de procesamiento de información de caracteres de acuerdo con una cualquiera de las reivindicaciones 1 a 3 Sistema de archivo de imágenes presentado.
5. Un método de procesamiento de información de carácter para ingresar un carácter formateado prescrito como una imagen y procesar el personaje, el método de procesamiento de información de carácter que comprende: formatear información de un formato, información de reconocimiento de caracteres e información de fuente, donde los caracteres se ingresan como imágenes Medios para reconocer un personaje y convertirlo en un código correspondiente, significa convertir el código en una imagen, medios para sintetizar la imagen y medios para generar la imagen sintetizada, en donde (1) un personaje (2) un procedimiento de referencia a la información de formato del formato de la imagen de personaje para cortar una imagen correspondiente a un carácter, (3) un procedimiento para ingresar una imagen de carácter de un formato predeterminado, ) Medios para reconocer dicho carácter y convertirlo en un código correspondiente comprende los pasos de referirse a la información de reconocimiento de caracteres y convertir la imagen correspondiente a un carácter en el código correspondiente, (4) Medios para convertir el código convertido en una imagen de la fuente correspondiente con referencia a la información de la fuente, (5) el paso de sintetizar la imagen se refiere a la información de formato del formato Un paso de sintetizar la imagen del personaje ingresado y una o más imágenes de la fuente convertida para generar una imagen compuesta, (6) un paso de generar la imagen sintetizada, (1) a (6) se realizan en este orden, en el que los pasos (1) a (6) se realizan en este orden.
6. Aparato de formación de imágenes según la reivindicación 5, que comprende además: un primer FAX y un segundo FAX que están conectados por una línea de comunicación y son capaces de intercambiar imágenes, en el que cada paso según la reivindicación 5 y (0) transmite un formato de imagen de carácter que es, por el segundo FAX, etapa de recepción de la imagen de carácter transmitido, procedimiento, la imagen sintética emitida (7) para introducir una imagen de carácter la recibió (1) ' , El procedimiento de (0), el procedimiento de (1) ', el procedimiento de (2) a (6), el procedimiento de (7) anterior, y una etapa de transmisión de dicho segundo FAX a dicho primer FAX, Se realizan en este orden.
Dibujo :
Application number :1997-016753
Inventors :株式会社日立製作所
Original Assignee :鈴木和美、小林康二