Dispositivo de transmisión
Descripción general
 También es posible eliminar la necesidad de indicar la imagen de imagen al usuario por el usuario que designa el rango, además, para reducir la cantidad de datos en el momento de la transferencia y para ser editable como texto en la computadora. ] Al transferir los datos de imagen recibidos a una memoria como una computadora o un dispositivo de almacenamiento, todos los datos de imagen recibidos se envían a los medios 15 de reconocimiento de caracteres, y los que pueden reconocerse como caracteres son los datos de texto, los demás son datos de mapa de puntos .
Campo técnico
La presente invención se refiere a un aparato de transmisión tal como un aparato facsímil utilizado como un dispositivo de automatización de oficina (OA).
Antecedentes de la técnica
Convencionalmente, en un aparato de transmisión tal como una máquina de fax, es imposible imprimir los datos de imagen recibidos y no hay suficiente espacio libre en la memoria interna para almacenar los datos, y los datos se transmiten a una computadora o similar. Como método para separar los datos de imagen recibidos en datos de texto y otros datos cuando se transfieren los datos de imagen a una memoria o un dispositivo de almacenamiento, por ejemplo, se conoce un método descrito en la Solicitud de Patente Japonesa abierta a inspección pública Nº 6-36070 . En este método, el usuario designa un rango para reconocer como texto en los datos recibidos, y solo la parte designada por el rango se convierte en datos de texto mediante el aparato de descifrado de caracteres, y los datos se almacenan en una memoria como una computadora o un dispositivo de almacenamiento Como se muestra en la FIG.
Tarea de solución
Sin embargo, en la configuración convencional, es necesario que el usuario realice una operación complicada de designar el rango a reconocer como datos de texto en los datos de imagen recibidos por el dispositivo de transmisión, y para realizar esta operación, una vez Es necesario mostrar una imagen de imagen en una pantalla, una hoja de impresión o similar.
Sumario de la invención La presente invención pretende resolver los problemas descritos anteriormente, y es un objeto de la presente invención proporcionar un aparato de reconocimiento de caracteres capaz de transmitir todos los datos de imágenes recibidos a un dispositivo de reconocimiento de caracteres y transferir los datos de imágenes recibidos por el dispositivo de transmisión a una memoria o dispositivo de almacenamiento La transferencia de otros datos como datos de texto como datos de mapas de puntos elimina la necesidad de la designación de rango por parte del usuario, así como la necesidad de indicar la imagen de imagen al usuario y reduce aún más la cantidad de datos en el momento de la transferencia , Y puede ser editado como texto en una computadora.
Solución
Para lograr este objetivo, cuando se transfieren datos desde un dispositivo de transmisión a una memoria o un dispositivo de almacenamiento de un dispositivo de almacenamiento, los caracteres y otras partes se discriminan con respecto a todos los datos de imagen recibidos usando medios de reconocimiento de caracteres, Tiene una estructura en la que los datos se convierten en un formato de archivo de texto y los datos que no sean se convierten en un formato de archivo de mapa de puntos y los datos se transfieren al dispositivo de almacenamiento.
Con esta configuración, es posible reducir el tamaño de los datos transferidos desde un dispositivo de transmisión a una memoria como una computadora o un dispositivo de almacenamiento sin trabajo complicado, y hacer que los datos transferidos se puedan editar en la computadora como texto.
Una realización de la presente invención se describirá a continuación.
La figura 1 es un diagrama que muestra un sistema de un aparato de transmisión que incluye una computadora y un dispositivo de almacenamiento conectado a la misma de acuerdo con una realización de la presente invención.
1 es un dispositivo de transmisión, el dispositivo de transmisión 1 convierte una imagen de un documento establecido en una señal eléctrica del formato de mapa de bits por el dispositivo de lectura de imágenes y transmite la señal eléctrica al terminal externo 3 a través de la línea telefónica 2 y desde el terminal externo 3 La señal eléctrica del formato de datos de mapa de bits que se ha creado se formatea e imprime. 4 es una computadora conectada al aparato de transmisión 1 a través de la interfaz 5 y la computadora 4 tiene una memoria 6 y un dispositivo de almacenamiento 7 para grabar datos de documentos transferidos desde el aparato de transmisión 1.
Se describirá el funcionamiento del sistema como se describió anteriormente. Cuando el aparato de transmisión 1 recibe los datos del documento enviados desde el terminal externo 3 a través de la línea telefónica 2, el aparato de transmisión 1 normalmente imprime los datos del documento en el conjunto de papel. Sin embargo, cuando el papel no está configurado y el espacio libre de la memoria para almacenar temporalmente datos de documentos incorporados en el dispositivo de transmisión 1 también es insuficiente, o cuando la memoria en sí misma no existe, Cuando se editan los datos del manuscrito en la computadora 4 o similar, los datos del manuscrito enviados desde el terminal externo 3 se envían a los medios de reconocimiento de caracteres proporcionados en el dispositivo de transmisión electrónica 1, y los datos se reconocen como caracteres en los datos de texto , Los datos no reconocidos se transfieren como datos originales, es decir, datos de mapa de bits, a la memoria 6 de la computadora 4 o al dispositivo de almacenamiento 7 conectado a la computadora 4 también. Al transferir datos mediante dicho método, no es necesario que el usuario distinga entre datos de texto y datos de mapa de bits. Además, en cuanto al tamaño de los datos del documento original a transferir, si solo son los datos de mapa de bits convencionales, es 1 M de bytes para el original de tamaño A4 Al usar este método, los datos del mapa de bits se reducen a aproximadamente 500 K bytes, los datos de texto se reducen a 4 K bytes Tu puedes Después de la transferencia a la memoria 6 de la computadora 4 y el dispositivo de almacenamiento 7, la porción de datos de texto se puede editar en la computadora 4 usando el software de procesamiento de textos existente o similar.
A continuación, se describirá el funcionamiento del aparato de transmisión 1 en el sistema de la configuración anterior con referencia a la figura 2. La figura 2 es un diagrama de bloques de control del aparato de transmisión 1 conectado a la computadora 4 que tiene los medios de almacenamiento.
El número de referencia 8 indica medios de control de línea para realizar el procesamiento de línea entre la línea telefónica 2 a la que está conectado el aparato de transmisión 1 y el aparato de transmisión 1 y 9 un módem para realizar la modulación de demodulación de la señal de transmisión / recepción desde el terminal externo 3 al aparato de transmisión 1 La señal transmitida es demodulada por el módem 9 controlado por los medios de control de línea 8 y llevada al aparato de transmisión 1. Por el contrario, la señal enviada desde el dispositivo de transmisión 1 al terminal externo 3 se transmite después de que sea modulada por el módem 9. El número de referencia 10 indica medios de procesamiento de imágenes, y los medios de procesamiento de imágenes 10 realizan además un procesamiento de decodificación predeterminado y similares en la señal demodulada por el módem 9 para crear una imagen del documento. El número de referencia 11 denota una memoria de imagen que acumula datos de la imagen del documento creado por la unidad de procesamiento de imágenes 10. Cuando se establece la hoja, el medio de control de impresión 12 controla la impresora 20 para imprimir una imagen del documento que se crea mediante los medios de procesamiento de imágenes 10 y se almacena en la memoria de imágenes 11 en una hoja . El medio 13 de conmutación está previsto en la superficie del dispositivo 1 de transmisión, y en un modo de impresión en el que se realiza la impresión cuando se envía una señal desde el exterior y se transfiere una señal en la que se aplica un proceso predeterminado al ordenador 4 Y el modo de transferencia que se cambiará. El número de referencia 14 denota una unidad de control que controla las unidades respectivas tales como la unidad de control de línea 8 y la unidad de procesamiento de imágenes 10 para accionar el aparato de transmisión 1. Cuando la unidad de control 14 determina que es necesario transferir la señal enviada desde el exterior a la computadora 4 conectada al dispositivo de transmisión 1, la unidad de control 14 realiza un proceso predeterminado en la señal desde el terminal externo 3 Y luego lo transfiere a la memoria 6 de la computadora 4 y al dispositivo de almacenamiento 7.
15 es un medio de reconocimiento de caracteres controlado por la sección de control 14, 16 es un primer medio de almacenamiento conectado a los medios 15 de reconocimiento de caracteres y que almacena un programa de reconocimiento de caracteres, etc. 17 también está conectado a los medios 15 de reconocimiento de caracteres y realiza reconocimiento de caracteres Segundos medios de memoria para almacenar datos de un patrón de caracteres a ejecutar y similares, un documento convencional de tamaño A4 que está 1 Mbyte está conectado a aproximadamente 500 K bytes de aproximadamente 500 K bytes, 18 está conectado al medio de reconocimiento de caracteres 15, Este buffer de línea se usa para reconocimiento y tiene una capacidad capaz de almacenar al menos algunas líneas de escaneo principales. La unidad de control 14 hace que la unidad de reconocimiento de caracteres 15 determine primero la parte considerada carácter basada en los datos de la memoria intermedia de línea 18 y lea el programa de reconocimiento de caracteres de la primera unidad de almacenamiento 16. En cuanto a la parte determinada Con los datos del patrón de caracteres leídos desde el segundo medio de almacenamiento 17, se lleva a cabo el reconocimiento de caracteres de la línea de texto. Luego, la parte reconocida como carácter se convierte en datos de texto, mientras que la parte restante es datos de mapa de bits, los dos tipos de datos se envían por separado a la memoria de reconocimiento 19 una vez, después de que se completa el reconocimiento de todos los datos originales. , Salida a la computadora 4 a través de la interfaz 5, y grabada en la memoria 6, el dispositivo de almacenamiento 7 y similares.
Al transferir los datos del manuscrito a la computadora mediante dicho método, resulta innecesario designar el rango para que el propio usuario lo reconozca como un personaje, lo que lo hace más fácil de usar.
A continuación, el método de reconocimiento de caracteres se describirá con más detalle. Existen varios métodos para el reconocimiento de caracteres, pero aquí, como un ejemplo que utiliza el reconocimiento óptico de caracteres (en lo sucesivo denominado OCR) como el método más general, no se establece papel en el aparato de transmisión 1 , Un caso en el que la unidad de control 14 detecta que el espacio libre de la memoria de imágenes 11 es igual o menor que una cantidad predeterminada se describirá con referencia al flujo de control como ejemplo. 3 y 4 son diagramas de flujo del aparato de transmisión en una realización de la presente invención.
Para reconocer los datos del documento en el formato de mapa de puntos enviado desde el exterior, la unidad de control 14 controla primero los medios de reconocimiento de caracteres 15 para iniciar el reconocimiento de caracteres. La unidad de control 14 lee los datos del documento almacenados en la memoria de imágenes 11 en un formato de mapa de bits y los transfiere a la memoria intermedia de línea 18. Entonces, la línea de exploración principal de los datos del documento transferidos a la memoria tampón de línea 18 se examina uno por uno. Cuando se juzga que todas las líneas de escaneo principales de los datos originales son datos que representan blanco, la línea de escaneo principal luego se escanea en orden y la línea de escaneo principal en la cual los datos que representan negro están presentes debido a la presencia de caracteres o figuras Si se detecta una línea de exploración, se considera que existe un grupo de línea de exploración principal, es decir, un espacio de primera fila donde solo existen datos que representan el blanco continuo que existe sobre la línea de exploración principal, incluidos los datos que representan el negro. A partir de entonces, la línea de escaneo principal se investiga más a fondo, la línea de escaneo principal donde solo existen datos que representan blanco, y luego, cuando aparece la línea de escaneo principal donde aparecen los datos en negro, esta reaparición de blanco continuo se representa El grupo de líneas de exploración principal que solo tiene datos se considera como el segundo espacio entre líneas, y se considera que la línea entre el primer espacio de línea y la segunda línea es una línea, y el carácter o bloque de figura que forma esta línea La parte a considerar se denomina en lo sucesivo parte de personaje. Cuando aparece esta parte del carácter, la parte de control 14 interrumpe temporalmente la transferencia de los datos del documento desde la memoria de imágenes 11 a la memoria intermedia de línea 18.
A continuación, con respecto a los datos en la dirección de subescaneado en la parte de carácter, es decir, datos de una columna en lugar de una fila, casi la misma determinación que la dirección de exploración principal, es decir, un bloque de caracteres o figuras se determina con referencia a datos de bits negros en el subtema La parte de solapamiento de la porción de carácter en la dirección de exploración principal y la parte de carácter en la dirección de exploración secundaria se determina como un carácter. El número de caracteres incluidos en la parte del personaje se determina a partir del tamaño de la parte superpuesta. Con respecto a la porción juzgada como este único carácter (en lo sucesivo denominado carácter de reconocimiento), el medio 15 de reconocimiento de caracteres lee el programa OCR desde el primer medio 16 de almacenamiento y lo activa, y realiza el reconocimiento de caracteres en el carácter de reconocimiento. En ese momento, el programa OCR lee el patrón de caracteres almacenado en los segundos medios de almacenamiento 17 y realiza la coincidencia de patrones con el carácter reconocido. Cuando se realiza la coincidencia de patrones, se presta atención a la longitud de la línea del personaje reconocido, el punto donde se unen la línea y la línea, el punto inicial, el punto final y similares de la línea, de modo que las características del carácter también se capten y mientras se usa esta información Realice la coincidencia de patrones. En ese momento, si el tamaño del patrón de caracteres almacenado en los segundos medios de almacenamiento 17 es diferente del tamaño del carácter reconocido, el patrón de caracteres se amplía o reduce para que coincida con el tamaño del carácter reconocido y se lo ajusta en tamaño. Después de ajustar el tamaño de esta manera, solo se llama al patrón de caracteres similar a este carácter desde el segundo medio de almacenamiento 17 a partir de la información del carácter del carácter de reconocimiento y se lleva a cabo la coincidencia de patrón. En este momento, incluso si se trata del mismo personaje, existen varios hábitos, por lo que la característica se desvía principalmente de la del patrón de caracteres. Por lo tanto, si la tasa de coincidencia de patrones entre el carácter reconocido y el patrón de caracteres es del 70% o más, el carácter reconocido se considera como un carácter. Además, al usar la función de aprendizaje de una red neuronal o similar, la característica del carácter reconocido puede aprenderse mediante los segundos medios de almacenamiento que almacenan el patrón de caracteres, y posteriormente, con respecto a los caracteres que tienen varios hábitos. , La coincidencia de patrones después del reconocimiento de características se puede realizar fácilmente y se puede aumentar la tasa de reconocimiento de caracteres.
Cuando esta operación es repetida por el número determinado de caracteres repetidamente y se completa el reconocimiento de una parte del carácter, la sección de control 14 determina qué línea de exploración en los datos del documento es la línea de exploración principal en la parte superior del personaje Es decir, información sobre la posición de la porción de carácter en los datos del documento y la posición de la línea de exploración superior de la línea de exploración secundaria en el encabezado de la parte del carácter, es decir, la posición del personaje en la parte superior del carácter , Y convierte los caracteres reconocidos en datos de texto. Con respecto a la parte no reconocida, mientras se mantienen los datos de mapa de bits, los datos de una porción de caracteres se convierten en archivo de texto y archivo de mapa de bits Y los transfiere por separado a la memoria de reconocimiento 19.
Luego, después de determinar el tamaño de una parte de personaje y espacio de línea desde el tamaño de la parte de personaje, el primer espacio de línea y el segundo tamaño de línea, el procedimiento descrito anteriormente se repite tantas veces como el número de caracteres para el que se confirmó el reconocimiento de caracteres , Y finaliza el reconocimiento de los datos del documento.
A diferencia de la realización descrita anteriormente, cuando los datos del documento enviado no tienen el formato estándar, los datos de imagen originales a la memoria intermedia de línea 18 desde la memoria de imagen 11 que se interrumpió temporalmente en el momento de determinar la porción de carácter. Se reanuda la transferencia de datos, la parte del personaje se confirma nuevamente mediante el método mencionado anteriormente, y se realiza el reconocimiento de caracteres para esa parte.
Al detectar que se ha completado el reconocimiento de los datos del documento, la unidad de control 14 transmite los datos del documento mezclados con el formato de texto reconocido y el formato del mapa de bits, que están almacenados en la memoria de reconocimiento 19, a través de la interfaz 5 , Y lo envía a la computadora 4. En este momento, como el archivo de texto y el archivo de mapa de bits se almacenan por separado en la memoria de reconocimiento 19, al detectar que el reconocimiento de los datos del documento se completa, la sección de control 14 convierte los datos de formato de archivo de texto de cada página de los datos del documento Los datos del formato de mapa de bits para cada página también se recopilan y transfieren a la computadora 4 a través de la interfaz 5 de una manera similar. Tras la transferencia, el archivo de texto de la primera página se transfiere primero, luego el archivo de mapa de bits de la primera página, el archivo de texto de la segunda página, el archivo de mapa de bits, el archivo de texto de la enésima página, el mapa de bits de la enésima página Y los archivos se transfieren a la computadora 4 en este orden.
Los datos del documento transferidos a la computadora 4 se almacenan en la memoria 6 incorporada en la computadora 4, el dispositivo de almacenamiento 7 conectado a la computadora 4 y similares almacenando alternativamente el archivo de texto y el archivo de mapa de bits para cada página Ha sido hecho. Al restaurar estos datos originales, puede restaurarse fácilmente ajustando la parte del carácter del archivo de texto de la enésima página que tiene la información de posición entre los archivos de mapa de bits de la enésima página .
Como se describió anteriormente, en el aparato de transmisión de la presente invención, todos los datos del documento se reconocen automáticamente utilizando el OCR como medio de reconocimiento de caracteres, de modo que es necesario designar el rango de la porción a reconocer como caracteres en el documento Para que sea un dispositivo de transmisión eléctrica conveniente para el usuario.
Efecto de la invención
Al transferir datos desde un dispositivo de transmisión a una memoria de un dispositivo de almacenamiento o un dispositivo de almacenamiento, la presente invención identifica caracteres y otros para todos los datos de imágenes recibidos utilizando medios de reconocimiento de caracteres, y los datos de caracteres son texto Al convertir los datos al formato de archivo y el otro al formato de archivo de mapa de puntos y transferir los datos al dispositivo de almacenamiento, es posible transferir los datos desde el dispositivo de transmisión a la memoria de la computadora o el dispositivo de almacenamiento sin trabajo molesto Es posible reducir el tamaño de los datos a convertir a un tamaño de aproximadamente 500 K bytes, que es aproximadamente la mitad del tamaño del original de tamaño A4 convencional que es de 1 M de byte y hacer que los datos transferidos se puedan editar en la computadora como texto , Es posible reducir en gran medida el trabajo del usuario.
Breve descripción de los dibujos La figura 1 es un diagrama que muestra un sistema que incluye un dispositivo de transmisión en una realización de la presente invención.
La figura 2 es un diagrama de bloques de control de un dispositivo de transmisión en una realización de la presente invención.
La figura 3 es un diagrama de flujo de un aparato de transmisión en una realización de la presente invención.
La figura 4 es un diagrama de flujo del aparato de transmisión en una realización de la presente invención.
1 dispositivo de transmisión
2 línea telefónica
3 terminal externo
4 computadoras
5 interfaz
6 memoria
7 Dispositivo de almacenamiento
8 líneas de control de línea
9 módem
10 Procesamiento de imágenes significa
11 memoria de imagen
12 Medios de control de impresión
13 medios de conmutación
14 Unidad de control
15 reconocimiento de caracteres significa
16 primeros medios de almacenamiento
17 segundos medios de almacenamiento
18 Line buffer
19 memoria de reconocimiento
20 impresora
Reclamo
Una unidad de reconocimiento de caracteres que realiza el reconocimiento de caracteres escaneando los datos del manuscrito y una unidad de control que controla la unidad de reconocimiento de caracteres para reconocer los datos del manuscrito y hace que los datos del manuscrito sean reconocidos por los datos del manuscrito. Convirtiendo la porción reconocida como caracteres de los datos en datos de formato de texto y para partes no reconocidas como caracteres como datos de formato de mapa de bits y transfiriendo los datos de formulario de texto y los datos de formulario de mapa de bits a la transferencia de datos Medios para hacer que el dispositivo externo emita la señal eléctrica por los medios.
2. El aparato de transmisión de acuerdo con la reivindicación 1, en el que los datos en un formato de texto y los datos en un formato de mapa de bits se envían por separado a archivos separados.
3. Dispositivo de electrotransmisión según la reivindicación 1 o 2, en el que el medio de reconocimiento de caracteres es un reconocimiento óptico de caracteres.
Dibujo :
Application number :1996-317118
Inventors :松下電器産業株式会社
Original Assignee :山田太一