Método y aparato de análisis del lenguaje natural
Descripción general
 Su objetivo es proporcionar un método y un aparato de análisis de lenguaje natural capaces de estimar adjetivos tales como modificadores, particularmente adverbios tales como cantidad y grado. ], Tales como el verbo y adjetivo adjetivo tiene un diccionario 24b que le fue concedida el papel rango para el valor vinculante y la calificación individual, tiene una función para identificar la calificación aplicada al verbo en el procesamiento de análisis semántico de la frase japonesa, la extensión y cantidad que comprende además un diccionario 24c impartida con la subdivisión de los adverbios que muestran una por la combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, estima el objeto que define la extensión y cantidad (24d) . Este método se aplica a un sistema de traducción automática, a un sistema de aprendizaje japonés o similar.
Campo técnico
La presente invención se refiere a método de análisis de lenguaje natural y el aparato se aplica a un método de análisis del lenguaje natural y un aparato, en particular un sistema de traducción automática y sistemas de aprendizaje japoneses. En esta especificación, el análisis de oraciones japonesas se describirá como un ejemplo, pero también se puede aplicar a otros lenguajes que tengan las mismas propiedades que las oraciones japonesas.
Antecedentes de la técnica
En general, al analizar oraciones japonesas, muchos no tratan los adverbios en detalle, muchos de los cuales solo reconocen adverbios como adverbios autónomos. Además, no hay nada sistemático en cuanto al significado de los adverbios y el manejo de la sintaxis, y es difícil decidir qué adverbios define.
Además, entre diferentes idiomas, como el japonés y el inglés, los métodos de expresión a menudo son muy diferentes y, a menudo, no pueden tratarse mediante la asociación en unidades de palabras. Algunos sistemas de traducción automática, describe la relación de co-ocurrencia entre tales verbos auxiliares para los adverbios adverbios y declaración de las veces, también se busca la representación de idioma correspondiente, por ejemplo, la cantidad y el grado de adverbios, sus disposiciones sujetas No hay nadie que tenga la función de estimar.
Tarea de solución
Por lo tanto, en la técnica convencional, el análisis del adverbio como la cantidad o grado es insuficiente, por ejemplo, en el seguimiento de dicha declaración, lo que 'todo el mundo' y no se puede estimar correctamente o 'mucho' de.
'Todos los lechones comieron comida'
'Todos los cerdos comieron comida'
'Los cerdos comieron mucha comida'
'Los cerdos comieron mucha comida'
'Todos comieron los lechones'
'Todos comieron cebos'
'Comí mucha comida'
Por lo tanto, al traducir 'todos A' o 'muchos A' en el sistema de traducción automática, 'A' no se puede estimar correctamente. Además, el sistema de aprendizaje de japonés, 'todo el mundo' y no se puede explicar ya sea 'mucho' y 'lechones' de la o 'cebo' de la, no es posible conocer la redacción correcta.
La presente invención, los inconvenientes convencionales retiradas, modificador, particularmente un método de análisis de lenguaje natural y el aparato para permitir la estimación de un adverbios objetivo definidas tales cantidades y extensión.
Solución
Para resolver este problema, el método de análisis del lenguaje natural de la presente invención es un método de análisis del lenguaje natural de analizar la relación entre el modificador de la frase modificación y el objetivo en una frase del lenguaje natural, declinable caso individual información impartir papel calificación para, el modificador y la información de impartir avance subclasificación y se almacena en la base de su uso para, en el texto de entrada en lenguaje natural, el papel y las modificaciones calificación otorgada sobre la base de la información Y modificando la frase modificada del objeto calificado por la frase modificadora mediante una combinación de clasificación de subdivisión de la frase y la posición de aparición de la frase modificadora. Que dicho modificador es un adverbio de grado y cantidad, por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, las estimaciones del objeto que define la extensión y cantidad.
Además, Japanese método de análisis de frase de la presente invención, como para los verbos y los adjetivos adjetivo tiene una valencia y Caso caso individual papeles concedidos el diccionario para, identificar clasificar de acuerdo con el verbo que significa el procesamiento del análisis frase japonesa un japonés método de análisis frase que tiene una función de, que comprende además un diccionario impartida con la subdivisión de los adverbios que indican el grado y la cantidad, por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, grado Y el objeto que define la cantidad se estima.
Además, el método anterior se aplica a un sistema de traducción automática o a un sistema de aprendizaje japonés. Además, el aparato analizador de lenguaje natural de la presente invención, se proporciona un analizador de lenguaje natural para el análisis de la relación entre el modificador de la frase modificación y el objetivo en el texto en lenguaje natural, confiriendo papel rango para predicado a cada caso información y una unidad de almacenamiento para almacenar la información de antemano para impartir la subclasificación basada en el uso de modificador, la frase de entrada en lenguaje natural, otorgada sobre la base de la información almacenada en dichos medios de almacenamiento de Calificación la combinación de la posición de ocurrencia de la función y la subdivisión modificador y dicho modificador, caracterizado porque comprende una estimación medios para estimar el modificador para el que se modifica el modificador. Aquí, el modificador es un adverbio de grado y cantidad, dicho medio de estimación, por una combinación de la posición de aparición de la subdivisión y adverbios de papeles de casos y adverbios, el objetivo de definir el grado o cantidad Estimación
Además, aparato de análisis frase japonesa de la presente invención, como para los verbos y los adjetivos adjetivo tiene una valencia y Caso caso individual papeles concedidos el diccionario para, identificar clasificar de acuerdo con el verbo que significa el procesamiento del análisis frase japonesa un aparato de análisis de oraciones japonés que tiene una función de, y el diccionario se le concedió una sub-clasificación de los adverbios que indica el grado o cantidad, por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, el grado y cantidad Y estimar significa para estimar un objeto prescrito.
El medio de almacenamiento de la presente invención es un medio de almacenamiento se aplica a un analizador de lenguaje natural que analiza la relación entre el modificador de la frase modificación y el objetivo en una frase del lenguaje natural, al menos, declinable caso individual Y se almacena información para otorgar clasificaciones de subdivisión basadas en el uso de frases modificadoras. Aquí, en el texto de entrada en lenguaje natural, por una combinación de la posición de aparición de la subdivisión y el modificador de papel caso y modificador concedido sobre la base de la información, sin perjuicio de que el modificador se modifica Un programa para estimar un modificador a modificar. Además, el modificador es un adverbio que indica grado o cantidad.
En lo sucesivo, las realizaciones de la presente invención se describirán en detalle con referencia a los dibujos.
La figura 1 es un diagrama de bloques que muestra un ejemplo de configuración de sistema de un aparato de análisis de lenguaje natural de esta realización.
11, unidad de entrada de la frase japonesa para introducir el cuerpo el día del análisis, 12, unidad de análisis morfológico que lleva a cabo el análisis morfológico de la frase de entrada, 13, morfema juntos en frases tales como (palabra en Japón declaración), para determinar el destino de la dependencia unidad de análisis de la dependencia, 14, la unidad de análisis semántico para el análisis de la estructura profunda de la oración, incluyendo la cantidad y extensión del objeto prescrita de estimación de la adverbio de esta realización, 15, la unidad de salida de resultados para la salida de los resultados del análisis, el 16 , la palabra del diccionario para almacenar la palabra requerida para el análisis en cada unidad de análisis de búsqueda, 17 es una regla de análisis de la normativa de almacenamiento referibles necesarios para el análisis en cada unidad de análisis.
La figura 2 es un diagrama de bloques que muestra un ejemplo de configuración de hardware del aparato de análisis de lenguaje natural de esta realización. 21, CPU, 22 del control de operación para controlar el analizador de lenguaje natural es una memoria de control para almacenar el procedimiento de control de la CPU 21, por ejemplo, el programa 22a de control del sistema, un programa de análisis morfológico 22b, 22c programa de análisis de dependencia, análisis semántico Y se almacena un programa 22 d. A propósito, el análisis morfológico, análisis de la dependencia, análisis semántico pueden ser ejecutadas por el software como en la presente realización, pueden ser ejecutadas en hardware utilizando una neuro-ordenador o similar. Además, en el caso del software, puede configurarse para cargarse desde la sección de almacenamiento externo 24 que se muestra a continuación. 23, la sección de almacenamiento de frases de entrada 23a para sujetar la frase de entrada a analizar, una memoria de datos que tiene un 23c área de trabajo, etc., para almacenar temporalmente los datos en el análisis por el resultado del análisis que sostiene 23b unidad, la CPU 21 que mantiene el resultado del análisis. La memoria de control 22 y la memoria de datos 23 están constituidas por ROM o RAM.
24, 24a del diccionario de palabra que se utiliza en el análisis de la presente realización, puntuación papel tabla 24b, 24c adverbios mesa de subdivisión, y almacena grandes cantidades de datos, tales como tabla definida regla de estimación objeto 24d, un disquete o un disco duro, un CD-ROM, etc. . Incidentalmente, la tabla puede estar incluida en el diccionario de palabras 24a. 25 es una interfaz de entrada para introducir datos y comandos de la 25a teclado y 25b ratón y un 25c micrófono, etc., 26, datos de salida y el resultado del análisis en la unidad de visualización 26a y una 26b impresora, un 26c altavoz, etc., tal como un CRT Como se muestra en la FIG. Incidentalmente, la frase de entrada puede ser ingresada desde la unidad de almacenamiento externo 24 o desde el teclado 25 a. Alternativamente, puede ser uno obtenido reconociendo la entrada de voz desde el micrófono 26c y convirtiéndola en una cadena de caracteres.
La figura 5 es un diagrama que muestra un ejemplo de una etiqueta que indica un rol de caso almacenado en la tabla de roles de caso 24 b. En la figura 5, la relación con el verbo (verbo) del lenguaje corporal (sustantivo) en la oración se clasifica y asocia con la etiqueta. Por ejemplo, en la frase anterior, para el verbo que 'comió', 'cerdo niño' es un movimiento nominativa (AAC), 'cebo' es la calificación movimiento del sujeto (OUC).
La figura 6 es un diagrama que muestra un ejemplo de clasificaciones de subdivisión de adverbios almacenados en la tabla de clases de subdivisiones adverb 24c. En la figura 6, los adverbios relacionados con diversas cantidades y grados se clasifican a partir de sus usos y similares. Por ejemplo, 'Todos' en la oración de ejemplo se clasifica como 'reunión' y 'muchos' como 'algo'. 7 y 8 son diagramas que muestran un ejemplo de una regla para estimar el objeto regulado almacenado en la tabla de reglas de estimación objetivo prescrita 24 d. 7 y 8, en la 'condición parte de la regla', y la subdivisión de los adverbios de frases análisis, el esqueleto del predicado para modificar los aún más la posición adverbios tales frase adverbio Yakuwariri La 'prioridad' y la 'parte de ejecución de la regla' se mantienen correspondientemente, y la parte de ejecución de la regla con la prioridad más alta se selecciona del resultado de la comparación y se ejecuta.
A continuación, se describirá el funcionamiento del presente método de análisis de lenguaje natural con referencia a la figura 8. Por ejemplo, el procesamiento del análisis de oraciones japonés se realiza en el siguiente procedimiento. La figura 3 es un diagrama de flujo que muestra el procedimiento de procesamiento del análisis del lenguaje natural de acuerdo con esta realización. En el paso S21, se acepta la entrada de la oración japonesa. En el paso S22, se realiza un análisis morfológico para dividir la oración en morfemas. En el paso S23, el análisis de dependencia se realiza para compilar las frases y determinar el destinatario. En el paso S24, el procesamiento del análisis semántico se realiza para analizar la estructura de profundidad de la oración. Entre ellos, estimamos el contenido de los adverbios de cantidad y grado detallados a continuación. En el paso S25, el resultado del análisis se genera y el proceso finaliza.
La Figura 4 es un diagrama de flujo que ilustra un procesamiento de análisis semántico (S24) el procedimiento de la cantidad de procesamiento y el alcance de la estimación adverbios refuerzos realizado en. En el paso S31, se verifica la presencia o ausencia de adverbio de cantidad y grado. De lo contrario, el proceso finaliza tal como está, y si lo hay, el proceso pasa al paso S 32. En la etapa S32, con referencia a la figura 6, se toma la subdivisión de los adverbios de cantidad y grado. En el paso S33, se verifica la presencia o ausencia de un proverbio, de lo contrario el proceso pasa al paso S36, de lo contrario avanza al paso S34. En el paso S 34, con referencia a la figura 5, se sacan el caso del proverbio y el papel del caso del mismo. Como resultado del análisis de relación de casos del proverbio, se supone que se obtiene una frase como un caso correspondiente a la etiqueta y la etiqueta.
En la siguiente etapa S 35, se aplica la regla de estimación de objetivo de regulación mostrada en las Figuras 7 y 8. Seleccione una regla con mayor prioridad entre las reglas que satisfagan la condición y la ejecuten. En el paso S 36, se juzga que no hay ningún proverbio y se juzga si la siguiente frase es o no una frase. Si es una frase, en el paso S 307, la frase de la siguiente frase se define como un objetivo de regulación y el proceso finaliza. Si la siguiente frase no es una frase, termina por no especificar nada.
La figura 9 muestra un ejemplo específico del resultado de realizar el proceso anterior sobre el resultado del análisis de relación de caso. En el 'lechones comieron todos cebo' de la frase 1, es el adverbio de 'todos' se 'fija', que apareció inmediatamente después de la 'AAC', 'lechones'. Por lo tanto, mediante la ejecución de las reglas de alta más prioridad de las reglas de juego 'A1', las disposiciones sujetas a 'todo el mundo' y 'lechones'. Aplicando esto a la traducción automática japonesa-a-Inglés, utilizando el hecho de que 'todo el mundo' es el destino predeterminado es 'lechones', y es el destino predeterminado es una pluralidad de 'todo el mundo', el Inglés llamado 'Todos los cerdos comieron alimentos.' Puede ser creado
En la oración de ejemplo 2 'Lechones se comieron toda la comida', 'Todos' es un adverbio de 'recolección' y aparece inmediatamente después de 'cebo' que es 'OUC'. Por lo tanto, ejecute la regla de 'B1' teniendo la prioridad más alta entre las reglas que se emparejarán, y establezca el tema 'todos' como 'cebo'. Aplicando esto a la traducción automática japonesa-a-Inglés, utilizando el hecho de que el destino predeterminado de 'todo el mundo' es 'cebo', 'un cerdo comió el alimento entero.' Se puede crear en Inglés de eso. En la oración de ejemplo 3, 'Los cerdos comen mucha comida', 'mucho' es un adverbio 'algo'. La clasificación tiene un 'AAC' y 'OUC', pero tanto a juego 'G1' y 'F1', y ejecutar esta regla por lo que gobierna 'F1' tiene una prioridad más alta, 'mucho 'Se define como' cebo '. Aplicando esto a la traducción automática japonesa-a-Inglés, utilizando el hecho de que el destino predeterminado de 'mucho' es 'cebo', 'un cerdo comía mucha comida.' Se puede crear en Inglés de eso.
En la oración de ejemplo 4, 'Todos comieron alimentos', 'Todos' es un adverbio de 'reunión' y aparece antes de cada caso. Ejecutar las reglas de alta más prioridad de las reglas de juego 'A2' y 'todos' las disposiciones sujetas a 'nominal del caso de AAC abreviada'. Aplicando esto a la traducción automática japonesa-a-Inglés, utilizando el hecho de que el destino predeterminado de 'todo el mundo' es 'calificación de la AAC omitido', 'todos comieron la comida.' Se puede crear en Inglés de eso. En la oración de ejemplo 5, 'Come mucha comida', 'mucho' es un adverbio 'algo'. Como caso, hay 'OUC' y 'AAC', pero se omite 'AAC'. Aunque a juego tanto entre la 'F1', 'G3', porque la gente de las reglas de la 'F1' tiene una prioridad más alta mediante la ejecución de las reglas de la 'F1', las disposiciones sujetas a 'mucho' y 'cebo' . Aplicando esto a la traducción automática japonesa-a-Inglés, utilizando el hecho de que el destino predeterminado de 'mucho' es 'cebo', 'comía mucha comida.' Se puede crear en Inglés de eso.
Debe observarse que pueden realizarse las siguientes modificaciones y adiciones a las realizaciones descritas anteriormente, que también se incluyen en la presente invención.
1. Aunque el adverbio de grado y cantidad sólo son de libre de pie adverbios, números y similares 'un animal', 'plato', un sintagma nominal, etc., como 'compartimiento lleno' también es bien certificado con el adverbio de grado y cantidad Puede tratarse como indicando la clasificación 'algo'.
2. Además, también es posible ser tiene la cercanía de la nominal, que es de una clasificación como 'un animal', 'animales' del 'plato' o similar, y el clasificador y dijo, 'plato', 'cerdo', 'cebo' en las reglas.
3. Además, en lugar de ejecutar la regla de prioridad más alta sólo una prioridad y más ejecutable para la misma regla, si hay ambigüedad puede ser indicativo de una pluralidad de objetivo prescrito.
4. Además, en el ejemplo específico de la Fig. 8, como resultado del análisis de casos relación, sino para obligar a la '?' A medida que el nominal de la calificación se omite, el resultado de un análisis de casos respecto, nada se cambia de modo que no tiene que unen , Una frase '?' Puede generarse cuando se determina que apunta a un caso abreviado.
5. En cuanto a la meta definida omitido, después de la estimación de la puntuación omitido el análisis del contexto y no la hallarán disposiciones tema ha sido realizado, puede cambiar el destino de norma especificada estimación de volver a aplicar.
Además, la presente invención se puede aplicar a un sistema constituido por una pluralidad de dispositivos o a un aparato que comprende un único dispositivo. Ni que decir tiene que la presente invención también puede aplicarse a un caso en el que la presente invención se logra suministrando un programa a un sistema o a un aparato.
Efecto de la invención
La presente invención, el modificador puede proporcionar un método de análisis de lenguaje natural y aparato particularmente permite estimar un adverbios objetivo definidas tales cantidades y extensión. Eso, y los papeles de casos, y la subclasificación de adverbios, mediante la utilización de una combinación de la posición de aparición de la adverbio, el efecto de permitir la provisión sujeto estimación del grado y el número de casos en los que hay una medida adverbio y la cantidad obtenida correctamente.
Breve descripción de los dibujos La figura 1 es un diagrama de bloques que muestra un ejemplo de configuración del sistema de un aparato de análisis de lenguaje natural de esta realización.
La figura 2 es un diagrama de bloques que muestra un ejemplo de configuración de hardware de un aparato de análisis de lenguaje natural de esta realización.
La figura 3 es un diagrama de flujo que muestra un procedimiento de procesamiento de análisis de lenguaje natural de acuerdo con esta realización.
La figura 4 es un diagrama de flujo que muestra el procedimiento de estimación objetivo prescrita de adverbios de cantidad y grado durante el proceso de análisis semántico de la figura 3.
La figura 5 es un diagrama que muestra un ejemplo de etiquetas que muestran roles de casos.
La figura 6 muestra un ejemplo de clasificación de subdivisión de adverbios.
La figura 7 es un diagrama que muestra un ejemplo de una regla para estimar un objetivo prescrito.
La figura 8 es un diagrama que muestra un ejemplo de una regla para estimar un objetivo prescrito.
La figura 9 es un diagrama que muestra un ejemplo específico de análisis de lenguaje natural de esta realización.
Reclamo
Un método de análisis de lenguaje natural de analizar la relación entre el modificador de la frase modificación y el objetivo en la reivindicación 1 frase de lenguaje natural, el papel de impartir información Nota predicado a cada una de caso, su uso de la palabra modificada , Y almacena información sobre la oración de entrada de lenguaje natural basada en la información sobre la clasificación de roles de caso y la clasificación de la frase modificadora y la posición de aparición de la frase modificadora Y modificando la frase modificada del objeto que está siendo modificado por la frase modificadora según la combinación.
La reivindicación 2 en el que el modificador se un adverbio que indica el grado o cantidad, caracterizado porque por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, estima el objeto que define el grado o cantidad Y el método de análisis de lenguaje natural de acuerdo con la reivindicación 1.
Tal como para la reivindicación 3 verbos y los adjetivos adjetivo tiene una valencia y papeles casos Caso individual concedida el diccionario para, procedimiento de análisis frase japonesa que tiene una función de identificar el rango de acuerdo con el significado procesamiento de análisis de frase japonesa verbo a es, que comprende además un diccionario impartida con la subdivisión de los adverbios que indican el grado y la cantidad, por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, objetivo definir el grado o cantidad Y estimando la oración japonesa.
4. Un sistema de traducción automática al que se aplica el método de cualquiera de las reivindicaciones 1 a 3.
5. Un sistema de aprendizaje japonés al que se aplica el método de cualquiera de las reivindicaciones 1 a 3.
Un analizador de lenguaje natural para el análisis de la relación entre el modificador de la frase modificación y el objetivo en la reivindicación 6 frase de lenguaje natural, la información que imparte papel calificación para predicado a cada una de caso, su uso de la palabra modificada medios de almacenamiento para almacenar la información previamente de la subclasificación impartir basado en, en la frase de entrada en lenguaje natural, y la subclasificación de papel caso y modificador concedida en base a la información almacenada en dichos medios de almacenamiento por una combinación de la posición de aparición del modificador, aparato de análisis del lenguaje natural que se caracteriza por que comprende un medios de estimación para estimar el modificador para el que se modifica el modificador.
7. El modificador es un adverbio de grado y cantidad, dicho medio de estimación, por una combinación de la posición de aparición de la subdivisión y adverbios de papeles de casos y adverbios, el objetivo de definir el grado o cantidad Y estima el lenguaje natural basado en el lenguaje natural.
Tales como para la reivindicación 8 verbos y los adjetivos adjetivo tiene un papel nominal diccionario de valencia y la caja individual concedida a, aparato de análisis de la frase japonesa que tiene la función de identificar el grado de acuerdo con el verbo que significa el procesamiento del análisis de la frase japonesa hay, y el diccionario se le concedió una sub-clasificación de los adverbios que indica el grado o cantidad, por una combinación de la posición de aparición de la subdivisión y adverbios de papel caso y adverbios, para estimar el objeto que define la extensión y cantidad Y estimar significa para estimar la oración de la oración.
Un medio de almacenamiento aplicado a un analizador de lenguaje natural que analiza la relación entre el modificador de la frase modificación y el objetivo en la reivindicación 9 texto en lenguaje natural, por lo menos, para impartir papel calificación para predicado a cada caso Información que almacena información para clasificar clasificaciones clasificadas según el uso de frases modificadoras.
Para la reivindicación 10 de entrada de texto en lenguaje natural, por una combinación de la subdivisión y la posición de aparición de los modificadores de papel caso y modificador concedidas sobre la base de la información, a reserva de que el modificador se modifica Y almacenar adicionalmente un programa para estimar un modificador a modificar en dicho medio de almacenamiento.
11. El medio de almacenamiento de acuerdo con la reivindicación 9 o 10, en el que la frase modificadora es un adverbio que indica un grado o cantidad.
Dibujo :
Application number :1997-006778
Inventors :キヤノン株式会社
Original Assignee :金子和恵、相澤道雄、八木沢津義、廣田誠、藤田稔