Aparato de traducción y método de procesamiento de traducción utilizado en el mismo
Descripción general
 Traduzca correctamente una oración que tenga una palabra especial tal que las letras mayúsculas y las minúsculas coexistan, y genere el resultado de la traducción que el usuario está solicitando. ] Sólo letras mayúsculas en el texto a traducir, o, si hay una palabra de la primera lengua en la que se mezcló al azar el caso (A11, A12), de la palabra basado en el primer carácter sustituidos por normas innecesarias Si se deben convertir letras que no sean el primer carácter en minúsculas (A 14) o convertir todos sus caracteres en minúsculas (A 15). Luego, se realiza una búsqueda del diccionario utilizando las palabras de la palabra de conversión (A 16), y se obtiene un resultado de traducción (A 17 A 22).
Campo técnico
La presente invención está, por ejemplo, Inglés-Japonés se refiere desde el primer idioma como traducción en el dispositivo de traducción para la traducción de la segunda lengua, adecuado para uso en la traducción de los datos de texto que tiene una palabras particularmente especiales como caso mixto Y un método de procesamiento de traducción utilizado para el aparato de traducción.
Antecedentes de la técnica
Convencionalmente, los aparatos de traducción traducen oraciones escritas en inglés al japonés. Esto se realiza al referirse a un diccionario de traducción inglés-japonés. Por cierto, por ejemplo, las revistas y la publicidad, en el Inglés escrito para el periódico, hay un caso en el que o capitalizados a propósito todos toda la carta y la declaración de la palabra, se representa de forma irregular en letras mayúsculas y minúsculas de la palabra. Esto tiene como objetivo el efecto que apela a la visión del lector.
Por lo general, un diccionario para su uso en traslación según una notación común, a excepción de los nombres propios y abreviaturas tienen la información, tales como las partes del discurso y abreviaturas para cada palabra escrita en minúsculas. Por lo tanto, al traducir una oración que tiene la palabra de notación especial como se describió anteriormente, la traducción se realizó utilizando los dos métodos siguientes.
(1) Realice un proceso de traducción convirtiendo el comienzo de una palabra o frase en letras minúsculas.
(2) Todas las palabras y oraciones se convierten en letras minúsculas y se realiza el procesamiento de la traducción.
Tarea de solución
Sin embargo, en el método anterior (1), dado que solo el primer carácter se convierte en letras minúsculas, dependiendo de la notación de la palabra,
(A) El comienzo es letras minúsculas, pero de lo contrario son letras mayúsculas
(B) El comienzo es letras minúsculas, pero las otras son secuencias irregulares de mayúsculas y minúsculas. Por esta razón, la palabra no coincide con la palabra registrada en el diccionario y se vuelve imposible de buscar, con el tiempo estas palabras se consideran desconocidas y no están registradas en el diccionario.
Al observar el resultado de la traducción en este caso, la palabra que se considera como no traducible se da como está. En este caso, si la palabra está en mayúscula o es una secuencia irregular de letras mayúsculas y minúsculas, al ver el resultado de la traducción, el usuario puede entender que la otra parte está traducida.
Sin embargo, por ejemplo, en el caso en que todas las oraciones están escritas en mayúsculas, si se presentan como resultados de traducción al usuario tal como están, el usuario desconfía del sistema.
Además, como en el método de la anterior (2), en el caso de las letras minúsculas de todas las palabras y frases, incluso los nombres propios que no están registrados en el diccionario (tales como nombre comercial) está en el texto traducido, es un nombre propio Es obligatoriamente traducido sin ser tratado como. Por esta razón, se pierde el significado original del nombre propio, y así sucesivamente.
La presente invención se ha realizado en vista de los problemas descritos anteriormente, de caso frases traducidas correctamente con palabras especiales como coexisten, capaz de dar salida el aparato de traducción y el resultado de la traducción aparato de la búsqueda de usuario Para el método de procesamiento de traducción.
Solución
El aparato de traducción de la presente invención comprende un diccionario de traducción que almacena palabras de un primer idioma y palabras de un segundo idioma correspondiente al mismo, medios de entrada para ingresar datos de oraciones que se deben traducir, medios de entrada algunos datos de texto en mayúsculas solamente, o, si hay una palabra en la primera lengua cuyo caso irregularmente mezclado, para convertir a minúsculas letra no inicial de las palabras basándose en una regla predeterminada, Un medio de conversión de caracteres en minúsculas para convertir todos los caracteres en letras minúsculas, medios de traducción para buscar las palabras convertidas por los medios de conversión de minúsculas del diccionario de traducción y traducirlas a palabras del segundo idioma, Y una pantalla significa para mostrar el resultado de la traducción de la cadena de caracteres.
Además, cuando no hay una palabra que corresponda al diccionario de traducción, la traducción significa devolver la palabra a la notación original y refleja la palabra en el resultado de la traducción. También, un medio de almacenamiento para almacenar una palabra dada como un término insaturado traducción, dichos medios de traducción, la traducción previa determina palabra almacenada en los medios de almacenamiento como un nombre propio, es una representación de la palabra .
Según la configuración anterior, único caso en los datos de texto a traducir, o, si hay una palabra en el primer idioma cuyo caso irregularmente mezclado, de las palabras basándose en una regla predeterminada Aparte del primer carácter se convierte a letras minúsculas o todos se convierten a minúsculas. Si la palabra convertida existe en el diccionario de traducción, se lee la palabra correspondiente del segundo idioma y se lleva a cabo el proceso de traducción.
Si no hay una palabra correspondiente en el diccionario de traducción, la palabra se devuelve a la notación original y se envía como un resultado de traducción con la notación tal como está. Además, si hay una palabra designada como traducción desconocida en los datos de la oración que se traducirá, esa palabra se juzgará como un nombre propio y se dará como está.
Una realización de la presente invención se describirá a continuación con referencia a los dibujos. La figura 1 es un diagrama de bloques que muestra una configuración de un aparato de traducción de acuerdo con una realización de la presente invención. Este aparato tiene una unidad de entrada 11, una unidad de control de traducción 12, una unidad de visualización 13, un diccionario de traducción 14 y una unidad de almacenamiento 15.
La unidad de entrada 11 es para ingresar una oración a traducir y designarla como un nombre propio. Como la unidad de entrada 11, por ejemplo, además de un teclado, hay un OCR (dispositivo óptico de lectura de caracteres) y similares. En el caso de OCR, se ingresará un resultado obtenido al leer una oración a traducir.
La unidad de control de traducción 12 controla todo el aparato, y en este caso, el procesamiento de traducción del primer idioma al segundo idioma se realiza con referencia al diccionario de traducción 14. La unidad de visualización 13 es para mostrar el resultado de la traducción. La unidad de visualización 13 incluye, por ejemplo, un CRT (tubo de rayos catódicos).
El diccionario de traducción 14 es un diccionario utilizado para el procesamiento de la traducción, y almacena información tal como palabras del primer idioma y palabras del segundo idioma correspondiente al mismo. La unidad de almacenamiento 15 es para almacenamiento de información necesaria para el proceso de traducción, en su reemplazo innecesario tabla de reglas primer carácter 16, la cadena de caracteres antes de la conversión memoria intermedia 17 que sostiene, que tiene una mesa de nombres propios traducible 18.
El primer carácter reemplazado por tabla de reglas innecesarias 16, solamente letras mayúsculas en una frase que se ha introducido para la traducción, o, si hay una palabra que el caso se mezcló al azar, no reemplaza la primera letra de la palabra en minúsculas La regla prescrita en ese momento es memorizada. La figura 2 muestra un ejemplo de esta tabla de reglas innecesarias 16 de reemplazo de caracteres de cabeza.
La memoria temporal que retiene la cadena de caracteres 17 es para mantener una palabra que se convertirá en un estado antes de la conversión a letras minúsculas. En la figura 3 se muestra un ejemplo de la memoria tampón de retención de cadena de caracteres antes de la conversión.
La tabla de sustantivo propio de traducción-innecesario 18 almacena la palabra designada como una traducción desconocida como nombre propio. En la figura 4 se muestra un ejemplo de esta tabla de sustantivos propios innecesarios para la traducción.
La figura 2 es un diagrama que muestra el contenido de la tabla 16 de reglas innecesarias de sustitución de primer carácter en la realización. La tabla de reglas innecesarias 16 reemplazó el primer carácter, por ejemplo, 'incluye un caso que no sea el primer carácter, que incluye además la minúscula' o 'está detrás de la palabra, tales como' 'S (s) 'y nuestra (nuestro)' ' Y similares se almacenan de antemano. Cuando se convierten palabras con notación especial en letras minúsculas, se hace referencia a esta tabla de reglas innecesarias de sustitución de caracteres principales.
La figura 3 es un diagrama que muestra el contenido de la memoria tampón de retención de cadena de caracteres de preconversión 17 en esta realización. En esta cadena de caracteres de preconversión que contiene la memoria tampón 17, las palabras que se convertirán en letras minúsculas se conservan como notación original. Se hace referencia a esta cadena de caracteres que contiene el almacenamiento intermedio 17 antes de la conversión cuando se produce un error realizando una búsqueda del diccionario en palabras en minúscula.
La figura 4 es un diagrama que muestra el contenido de la tabla de nombres propios innecesarios para la traducción 18 en la realización. En esta tabla innecesaria de nombres propios de traducción 18, las palabras designadas como traducir palabras innecesarias por adelantado se almacenan como sustantivos propios. Cuando se da salida a un nombre propio como lo es como un resultado de traducción, se hace referencia a esta tabla de nombres propios innecesarios de traducción 18.
Antes de explicar el funcionamiento de la realización, los procesos de traducción (1) y (3) de la presente invención se describirán con ejemplos específicos.
(1) Supongamos que hay una oración en inglés como la siguiente.
(A) TOMA CONTROL DE TU FUTURO
(B) VIRTUDES VIVIENTES
(C) NO SERÍA AGRADABLE si su computadora pudiera
(D) KID PIX, el primer programa de pintura
Estos son casos en los que la cadena de caracteres de la palabra (o frase) que se va a traducir consta solo de letras mayúsculas o si aparecen mayúsculas irregulares en ella. Tras la traducción, si cada una de estas palabras en inglés no corresponde a la tabla 16 de reglas innecesarias de sustitución de primer carácter, todas las palabras se convierten en letras minúsculas, y si corresponde a la tabla de reglas innecesarias 16 de reemplazo de primer carácter, El procesamiento de la traducción se realiza convirtiendo los caracteres no iniciales a la secuencia en minúsculas.
(2) Incluso si se lleva a cabo el proceso (1) anterior, hay casos en que las palabras en minúsculas no se registran en el diccionario de traducción y se procesan como palabras desconocidas.
Por ejemplo, supongamos que hay una oración en inglés de la siguiente manera.
(E) ¡Gráficos animados de GRA!
En este caso, dado que las palabras que no sean 'GRA' se registran en el diccionario de traducción, incluso si se convierten en minúsculas, es posible la traducción de estas palabras, pero 'GRA' se puede traducir al diccionario de traducción No está registrado.
Por lo tanto, cuando falla la recuperación del diccionario, la palabra que se consideró como desconocida se devuelve a la notación original (la parte con la letra minúscula se restaura a letras mayúsculas), y esto se refleja en el resultado de la traducción. Por lo tanto, en el ejemplo de (e) anterior,
Gráfico vívido de GRA!
Puede obtener el resultado de la traducción como.
(3) Hay casos en los que se incluyen oraciones adecuadas, como nombres de productos, en oraciones que se traducirán. Por ejemplo, es 'KID PIX' en el ejemplo de arriba (d).
Tal palabra puede traducirse en algunos casos, pero si desea usarla tal como es, designe de antemano como una tontería de traducción. En el proceso de traducción, la (s) palabra (s) especificada (s) se toman como un sustantivo propio, de modo que la parte no se traduzca en la oración que se va a traducir. Por lo tanto, en el ejemplo de (d) anterior,
KID PIX, el primer programa de pintura de la historia
Puede obtener el resultado de la traducción como.
A continuación, se describirá el funcionamiento de la realización. Aquí, el funcionamiento del proceso de traducción (1) (3) anterior se describirá con referencia a la figura 5 y la figura 6, suponiendo que se realiza una traducción de inglés a japonés, por ejemplo. La figura 5 es un diagrama de flujo que muestra el funcionamiento del proceso de traducción (1) y (2). La figura 6 es un diagrama de flujo que muestra el funcionamiento del proceso de traducción (3).
(1) Como se muestra en el diagrama de flujo de la Fig. 5, después de entrar en una frase para ser traducido a través de la unidad de entrada 11, cuando instruye traducción, el controlador traducción 12 primero primero consta de sólo letras mayúsculas en la frase Se verifica si hay una palabra del idioma o una palabra del primer idioma mezclada irregularmente en mayúsculas y minúsculas (paso A 11).
Cuando hay una palabra correspondiente (Sí en el paso A 11), la unidad de control de traducción 12 retiene la cadena de caracteres de la palabra en la memoria tampón de retención de cadena de caracteres de preconversión 17 proporcionada en la unidad de almacenamiento 15 (paso A 12).
A continuación, la unidad 12 de control de traducción se refiere a la tabla 16 de reglas innecesarias de sustitución de caracteres y juzga si la palabra contenida en la memoria tampón 17 de retención de cadenas de caracteres previas a la conversión corresponde a la regla 16 (etapa A 13) si la palabra que corresponde a la tabla de reglas innecesarias 16 sustituye al primer carácter (Sí en la etapa A13), la unidad de control 12 traducción convertidos a minúsculas, excepto la primera cadena de caracteres de la palabra (paso A14). Por otro lado, si la palabra no corresponde a la tabla de reglas innecesarias 16 sustituye al primer carácter (No en el paso A13), el controlador 12 Traducción convierte todos los caracteres de la palabra a minúsculas (paso A15).
A continuación, la unidad de control de traducción 12 busca en el diccionario de traducción 14 usando la palabra convertida (paso A 16). Si esta búsqueda de diccionario tiene éxito, es decir, si hay una palabra correspondiente en el diccionario de traducción 14 (Sí en el paso A 17), la unidad de control de traducción 12 lee la palabra del segundo idioma correspondiente y realiza el procesamiento de análisis Y procesamiento de generación de frases traducidas (pasos A 20 y A 21).
Tenga en cuenta que el proceso de análisis es un proceso de análisis de la estructura de una oración al verificar la parte del discurso de cada palabra. El proceso de generación de oraciones traducidas es un proceso de generación de una oración traducida compuesta de palabras del segundo idioma en función del resultado del análisis.
Cuando la frase traducida se obtiene de esta manera, la unidad de control de traducción 12 la envía como resultado de la traducción a la unidad de visualización 13 (paso A 22). La unidad de visualización 13 muestra el resultado de la traducción.
(2) se realiza en parte el mismo proceso que el anterior (1) (etapa A11 A16), si, cuando la palabra palabras correspondiente si la búsqueda no hizo el diccionario de traducción 14 (No en el paso A17), la traducción La unidad de control 12 devuelve la notación de la palabra al estado almacenado en la memoria tampón de retención de cadena de caracteres de preconversión 17 (paso A 18) y la trata como una palabra desconocida (etapa A 19).
A continuación, de forma similar a lo anterior, la unidad de control de traducción 12 envía el resultado de la traducción a través del procesamiento de análisis y el procesamiento de generación de texto traducido (paso A20 22). En este caso, las palabras desconocidas en la oración se reflejan directamente en el resultado de la traducción.
(3) Como se muestra en el diagrama de flujo de la Fig. 6, normalmente, cuando la frase a traducir es controlador traducción de entrada, traducción 12 para cada palabra en la frase de entrada (palabra en el segundo idioma) Después de buscar desde el diccionario de traducción 14 (paso B 12), el resultado traducido se envía a través del procesamiento de análisis y el procesamiento de generación de texto traducido (paso B 13 B 15).
Aquí, cuando hay una designación de una palabra innecesaria de traducción del usuario (paso B 11), la unidad de control de traducción 12 hace que el usuario ingrese la palabra objetivo (paso B 16). En este caso, se puede ingresar una pluralidad de palabras.
A continuación, la unidad de control de traducción 12 escribe la palabra esta entrada para la traducción requerida tabla de nombres propios 18 de la unidad de almacenamiento 15, se añade una parte de la información del habla que es nombre propio (paso B17).
A continuación, la unidad de control de traducción 12 realiza la búsqueda del diccionario para la palabra que no sea la palabra de entrada (paso B18), los resultados y con referencia a los contenidos de la tabla 18 (B19 paso), dan como resultado la traducción a través del análisis del proceso y el proceso de limpieza (Paso B13 B15). En este caso, la palabra designada en la oración se trata como un nombre propio y se refleja en el resultado de la traducción tal como es.
En la realización anterior, aunque la traducción Inglés-Japonés como la primera lengua en el segundo idioma traducido descrito como un ejemplo, la presente invención no está limitada a la misma, por ejemplo, traducción alemán-japonés, en definitiva el caso Se puede aplicar a todos los idiomas siempre que los traduzca a otro idioma.
Efecto de la invención
De acuerdo con la presente invención como se ha descrito anteriormente, las palabras de notación solamente mayúsculas, o, si se supone que el caso era irregular mixta, según tabla de reglas innecesaria reemplaza el primer carácter, una cadena de caracteres de la palabra Como se traduce después de reemplazarlo con letras minúsculas, es posible obtener un resultado de traducción más preciso evitando reemplazos innecesarios.
Además, cuando la recuperación del diccionario falla debido a la sustitución anterior, la notación original se restaura y se refleja en el resultado de la traducción, de modo que es posible obtener el resultado de la traducción en la forma de acuerdo con la oración original.
Además, en el caso tal como las palabras que aparecen en el texto se conoce de antemano nombre propio, la palabra mediante la especificación como una palabra innecesaria traducción del pueden ser tratados como un nombre propio en el momento de la traducción, como resultado, el resultado de la traducción deseada por el usuario Puede ser obtenido
Breve descripción de los dibujos La figura 1 es un diagrama de bloques que muestra una configuración de un aparato de traducción de acuerdo con una realización de la presente invención.
La figura 2 es un diagrama que muestra los contenidos de una tabla de reglas innecesarias de sustitución de primer carácter en la misma realización.
La figura 3 es un diagrama que muestra el contenido de una memoria tampón de retención de cadenas de caracteres de conversión previa en la misma realización.
La figura 4 es un diagrama que muestra los contenidos de una tabla de nombres propios libre de traducción en la misma realización.
La figura 5 es un diagrama de flujo que muestra la operación del procesamiento de traducción (1) y (2) en la misma realización.
La figura 6 es un diagrama de flujo que muestra la operación del procesamiento de traducción (3) en la misma realización.
11 ... sección de entrada,
12 ... unidad de control de traducción,
13 ... sección de visualización,
14 ... diccionario de traducción,
15 ... sección de almacenamiento,
16 ... Tabla de reglas innecesarias de reemplazo de primer carácter,
17 ... buffer de almacenamiento de cadena de caracteres pre-conversión,
18 ... traducción correcta nombre propia mesa.
Reclamo
Un aparato de procesamiento de información que comprende: un diccionario de traducción que almacena palabras de un primer idioma y palabras de un segundo idioma correspondiente al mismo; medios de entrada para ingresar datos de oraciones a traducir; medios de entrada para ingresar datos de oraciones capitalizado sólo durante o, si hay una palabra en el primer idioma cuyo caso irregularmente mezclado, para convertir a minúsculas letra no inicial de las palabras basándose en una regla predeterminada, o todos medios de conversión sensible para la conversión de los caracteres a minúsculas, y medios de traducción para la traducción de las palabras convertidas por esta conversión caso significa en palabras en la segunda lengua mediante la búsqueda entre el diccionario de traducción, el resultado de la traducción de los medios de traslación Y mostrar medios para mostrar el contenido.
2. El aparato de traducción según la reivindicación 1, en el que, cuando no hay una palabra correspondiente en el diccionario de traducción, el medio de traducción devuelve la palabra a la notación original y refleja la palabra en el resultado de la traducción.
Un medio de almacenamiento para almacenar la palabra especificada según la reivindicación 3 Traducción no plazo, dichos medios de traducción, cuando se traduce, la determinación de una palabra almacenada en los medios de almacenamiento como un nombre propio, ordenada la palabra 2. Un aparato de traducción según la reivindicación 1, en el que dicho aparato de traducción emite dicha notación.
Ha reivindicación 4 canales del primer lenguaje y la traducción palabra del diccionario en el segundo idioma se almacena correspondientes a los mismos, cuando los datos de texto a traducir es de entrada, solamente en mayúsculas en los datos de frases, o , la conversión si la primera palabra de la lengua cuyo caso irregularmente mezclado allí, para convertir a minúsculas letra no inicial de las palabras basándose en una regla predeterminada, o en minúsculas todos los caracteres Y dicha palabra traducida se recupera de dicho diccionario de traducción y se traduce a una palabra de un segundo idioma.
5. El método de procesamiento de traducción de acuerdo con la reivindicación 4, en el que cuando no hay palabra correspondiente en el diccionario de traducción, la palabra se devuelve a la notación original y se refleja en el resultado de la traducción.
Una memoria para almacenar la palabra especificada según la reivindicación 6 traducción término insaturado, después de la traducción, determina una palabra almacenada en la memoria como un nombre propio, y a la salida de la palabra, ya que la notación 5. El método de procesamiento de la traducción de acuerdo con la reivindicación 4, caracterizado por comprender:
Dibujo :
Application number :1997-016603
Inventors :株式会社東芝
Original Assignee :坂田いずみ