Método de inspección de texto
Descripción general
 Es un objeto de la presente invención proporcionar un aparato de examen de texto capaz de inspeccionar si una oración descrita en lenguaje natural es o no una oración que tiene sentido como un todo. ] Identifica el comunicado de la extracción de información de entrada correspondiente a la frase en orden, junto con los nombres retirados de información correspondiente a esta afirmación es la misma que la fuente relacionada, correspondiente a otras declaraciones contenidas el mismo sustantivo este sustantivo Un paso de preparación para detectar la información a detectar y establecerla como un destino relacionado y preparar un par de la fuente de relación y el destino relacionado para todas las combinaciones de oraciones de la oración; Un paso de inspección para inspeccionar todos los pares en cuanto a si la fuente de relación o el destino relacionado incluido en el otro par es igual a la fuente de relación o el destino relacionado incluido en el otro par; Y el paso de juzgar juzga que 'toda la oración tiene sentido', y si no, juzga que 'toda la oración no tiene sentido'.
Campo técnico
Campo técnico La presente invención se refiere a un método de inspección de oraciones para inspeccionar que una oración descrita en lenguaje natural es una oración que tiene sentido como un todo.
Antecedentes de la técnica
En el procesamiento del lenguaje natural convencional, el análisis morfológico, análisis sintáctico, el análisis semántico basado en caso relación (por ejemplo, Handbook inteligencia artificial, Sociedad Japonesa para la Inteligencia Artificial, ed., Ohm-sha, ver pp.226 232), pero se lleva a cabo, estos análisis Está dirigido al análisis de unidades oracionales. Por otro lado, el análisis de Bundoshi, análisis contextual (por ejemplo, Handbook inteligencia artificial, Sociedad Japonesa para la Inteligencia Artificial, ed., Ohm-sha, ver pp.232 234) es, que fue omitida en la frase sujeto o el objeto como Análisis, análisis de palabras apuntadas por pronombres y similares.
Es decir, estas artes previas son análisis que se centran en oraciones individuales, no apuntan a investigar que toda la oración es significativa, prestando atención a la oración completa.
Tarea de solución
Por lo tanto, en oraciones, cuando las oraciones que no tienen ningún sentido como oraciones se mezclan, si la oración es una oración que tiene sentido por sí misma, no se puede detectar claramente. Sin embargo, en un sistema que corrige oraciones, es indispensable detectar oraciones que no tienen ese significado, y en un sistema que intenta comprender oraciones, se entiende que toda la oración tiene sentido. Es necesario
La presente invención se ha realizado a la vista de los problemas anteriores, y es un objeto de la presente invención proporcionar un método de inspección de frases capaz de detectar que una oración es una oración significativa por un método simple.
Solución
Primero invención para conseguir el objeto anterior, obtenido a partir del resultado de realizar el análisis morfológico en cada cada oración de la pluralidad de estados que constituyen una frase, un análisis semántico y el análisis contextual basado en el análisis de relaciones de proceso y de casos y cada frase de los morfemas que son el método de una inspección frase para inspeccionar el establecimiento de la pena y su parte de información de voz como entrada, recupera la información correspondiente a la frase para identificar frases de la entrada en orden, correspondiente a la declaración con los nombres retirados de origen asociados que a partir de información detecta la información correspondiente a otras declaraciones contenidas el mismo sustantivo este sustantivo a este destino y relacionado, frases ellas de origen asociado y pares asociados de destino un paso de creación de la creación de combinaciones de todas las frases, como entrada todos los pares creados en este proceso de creación, de origen asociado o el destino asociado incluido en el par, la misma y la fuente asociada o destino relacionadas, incluidos en otros pares O no Cuando todos los pares están relacionados entre sí, se considera que 'la frase completa tiene significado' si está relacionada con todos los pares, de lo contrario se considera que 'la frase completa no tiene sentido' Y un paso de juicio al juzgar que la condición está satisfecha.
Además, el segundo aspecto de la invención, el análisis morfológico en cada cada oración de la pluralidad de estados que componen el texto de cada frase obtenida de un resultado del análisis semántico y el análisis contextual basado en el análisis de proceso y morfemas caso de relaciones Y la información por parte del habla como entrada, identifica la oración de la entrada, recupera la información correspondiente a la oración en orden, recupera un sustantivo de la información correspondiente a esta oración con la fuente asociada esta Te, la combinación de todas las frases del sustantivo para detectar la información correspondiente a otras declaraciones contenía el mismo sustantivo en cuanto a esto y destino relacionado, los condena fuente asociado y pares asociados de destino ; Un paso de juicio que tiene una base de conocimiento que acumula relaciones de sustantivos y juzga si existe o no una relación entre los dos sustantivos que usan esta base de conocimiento; Todo el par que hiciste Un paso de examen al examinar todas las parejas en cuanto a si la fuente de asociación o asociación incluida en el par es igual a la fuente de asociación o la parte relacionada incluida en el otro par; , Se juzga que 'toda la oración tiene sentido', y si no, se juzga que 'toda la oración no tiene sentido'.
método de inspección frases de la presente invención primero se centra en los sustantivos incluidos en el texto, a partir de su base de conocimientos asociada o palabra relacionada son la referencia, que se debe asociar durante convenientemente frase Entiende, y porque juzga que 'toda la oración tiene sentido' con la relación de la gramática, puede dar un método simple. Por lo tanto, es posible detectar que no hay nada que ver con ninguna otra oración para una oración que no tiene sentido a lo largo de la oración. El método de verificación de texto de la segunda invención de la presente solicitud tiene una base de conocimiento que acumula relaciones de sustantivos, de modo que es posible inspeccionar el establecimiento de oraciones de manera más eficiente.
DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES PREFERIDAS A continuación se describirá una realización de la presente invención con referencia a los dibujos. La figura 1 es un diagrama de bloques que muestra una configuración de un sistema de acuerdo con una primera realización a la que se aplica el método de comprobación de texto de acuerdo con la presente invención. 1, una entrada 1, una frase, el análisis morfológico, análisis sintáctico, el análisis semántico basado en relación caso, más análisis del contexto convencional, tomado de resultado del procesamiento por métodos conocidos, por lo menos, un morfema cada frase, cada Incluye la parte del discurso de un morfema, la palabra señalada por él si es un pronombre, y la información compensada por la palabra omitida en la oración original.
sección de análisis de estructura de la oración 3 es una sección de extracción de información necesaria para el procesamiento de la inspección textos es la invención de la entrada 1, a continuación se extrajo sustantivos de la entrada 1, la correspondencia entre las frases que pertenecía al sustantivo extraído La información y las oraciones se examinan en busca de correspondencia entre sustantivos mediante el examen de la correspondencia entre sustantivos, y como resultado, se crean las estructuras correspondientes a las oraciones. Este proceso se realiza para todas las oraciones. La Fig. 2 muestra el algoritmo de operación. La figura 3 muestra un ejemplo de esta estructura, en la que el número de sustantivos es cuatro. Esta estructura se denomina estructura de oraciones en la siguiente descripción. Como una oración consta de una o más oraciones, la estructura de la oración correspondiente a la oración se convierte en una lista.
La unidad de verificación de oraciones independiente 5 verifica que haya información en el destino del sustantivo de cada estructura de oraciones y comprueba si todas las estructuras de oraciones están relacionadas. La figura 4 muestra un algoritmo de operación para verificar la relación de estructuras de oraciones. Un método para extraer estructuras de oraciones una por una de la lista de estructuras de oraciones, crear pares de fuentes de nombres de asociaciones y destinos relacionados, y combinar elementos de este conjunto si están incluidos en otro conjunto , Examinamos la relación de la estructura de la oración. Si todas las estructuras de oraciones están relacionadas, el número de este par es uno. En este momento, se determina que todas las oraciones que constituyen la oración están relacionadas, es decir, tienen sentido, y el proceso se termina. Si el número de pares es dos o más, la oración se divide en dos o más. Es decir, el significado de la oración se divide en dos o más, y se juzga que hay una oración que no tiene sentido como la oración completa, y termina.
La salida 7 es el resultado de la inspección de oraciones. La información mínima que debe incluirse en el resultado 7 es si la frase completa tiene sentido o no. Si es necesario, también se puede incluir información sobre qué oración no tiene sentido. En esta realización, se supone que la oración que no tiene sentido se incluye también en la salida 7.
La figura 5 es una oración de ejemplo para explicar la operación específica de la primera realización de acuerdo con la presente invención. También disponible en oraciones, estudio de examen, Inc., es un planteamiento del problema de la prueba estándar nacional de primer grado 'comprensión de lectura lenguaje', el original se describe en hiragana, se convirtió en una frase en caracteres chinos con el fin de facilitar la comprensión de la descripción se mezclaban. De aquí en adelante, el funcionamiento de la realización se describirá con la oración mostrada en la figura 5 como un ejemplo.
Primero, realizamos análisis morfológico, análisis sintáctico y análisis semántico basados ​​en relaciones de casos sobre el procesamiento del lenguaje natural. Este análisis semántico es frases 6 frases que se muestran en la Fig. 5 (primera frase, ..., sexta frase) se divide en se divide en palabras la parte frase de la información de voz, la información de relación de co-ocurrencia entre las palabras, también, Analiza la relación de compromiso de las palabras. Además, el análisis de contexto analiza temas abreviados y palabras que los pronombres están a punto de expresar. La primera realización de todas estas informaciones, la parte del discurso de los morfemas, si las palabras sinónimas que apunta, es que si cualquier palabra se omitieron en la construcción de una sentencia ha sido compensada . Deja que esto sea ingresado 1. Un ejemplo de dicha entrada 1 se muestra en la FIG.
La unidad de análisis de estructura de la oración 3 analiza la entrada 1, mientras que la aplicación número cuerpo estructura de la oración cada frase en el paso S11, S12, una lista de la estructura de estados mostrado en la Fig. 7 mediante la extracción de los sustantivos de texto en el paso S13 Crear Además, en el paso S14, se verifica si el mismo nombre se incluye o no en la estructura de la otra oración para cada sustantivo en orden del número de la estructura de la oración. Por ejemplo, en referencia a las Figs. 6 y 7, la primera frase 'Hiromi' Desde partidos 'Hiromi' que es compensada por la segunda frase, el destino pertinente 'Hiromi' de la primera frase segunda Es la oración 'Hiromi'. Cuando el proceso avanza en un procedimiento similar, 'Hiromi' en la cuarta frase se debe a partidos 'Hiromi' de la segunda frase, 'Hiromi' del destino relevante 'Hiromi' en la cuarta frase segunda frase. Como no hay 'Hiromi' después de la quinta oración, las partes afiliadas de 'Hiromi' en la cuarta oración volverán a la oración original 'Hiromi' en la primera oración. Incluye esta información en la estructura de la oración.
Del mismo modo, si una ubicación original para salir de la 'descendido' se omite en la quinta frase del 'bus', se convierte en 'bus' de destino relevante en la tercera frase relacionada con 'bus' en la quinta frase El autobús será el autobús de la tercera oración. El destino relacionado 'mariposa' en la tercera frase siguiente 'mariposa' que se compensa en la cuarta frase, destino relación de 'mariposa' en la cuarta frase está al lado de 'mariposa' en la sexta oración, la sexta frase ' El nombre relacionado con 'Choucho' es 'Chowcho' en la tercera oración. Incluya esta información relacionada en la estructura de la oración.
La unidad de verificación de oración independiente 5 extrae la estructura de oración número '2' del destino relacionado del sustantivo incluido en la estructura de la primera oración, y crea un conjunto (1, 2) del número de estructura de oración. De manera similar (2, 4) se crea a partir de la estructura de la segunda oración. Luego, compare cada conjunto y vea si hay el mismo número. En este caso, dado que ambos tienen el mismo número '2', se combinan para crear un par (1, 2, 4). '4', '5' y '6' se pueden extraer como el número de estructura de la oración del destino relacionado de la estructura de la tercera oración de modo que la combinación de los números de la estructura de la oración (3, 4, 5, ) Se puede crear. Compare esto con el grupo (1, 2, 4) y sintetícelos (1, 2, 3, 4, 5, 6) porque existe el mismo número 4. Como las estructuras de las oraciones apuntadas por los números de la estructura de las oraciones '4' a '6' son '6' y '1', se crea un par (4, 6, 1) y (1, 2, 5, 6). En este caso, aunque ambos pueden sintetizarse, el resultado es el mismo que el original. De aquí en adelante, lo mismo se aplica a los números de estructura de oración '5' y '6'. Cuando la estructura de la oración que se va a inspeccionar se va, la creación y síntesis del par finaliza. Como resultado de este procesamiento, dado que el número de conjuntos completados es 1, se considera que el todo está relacionado con uno y da salida a la salida 7 de que 'toda la oración tiene sentido'.
El procedimiento de procesamiento descrito anteriormente fue un ejemplo en el que toda la oración tenía sentido. Como ejemplo que no tiene sentido, considerando la oración sin la primera oración de la oración de la figura 5, la salida de la unidad 2 de análisis de estructura de oraciones se convierte en la FIG. La unidad de inspección de oraciones independiente 3 procesa esto y divide el conjunto de estructuras de oraciones en (1) y (2, 3, 4, 5). Como toda la oración se divide en dos partes, se considera que no tiene sentido como un todo.
La figura 9 muestra una segunda realización de acuerdo con la presente invención. La diferencia entre la segunda realización y la primera realización es que en la unidad de inspección de oraciones independiente 3, cuando el conjunto de estructuras de oraciones se divide en dos o más conjuntos, se usa el conocimiento almacenado sobre la asociación entre palabras De modo que tiene la función de investigar la relación que no podría ser analizada por la técnica convencional.
La entrada 1 y la unidad de análisis de estructura de frases 3 son las mismas que en la primera realización. Sin embargo, en una unidad de inspección frase independiente 9, es necesario para mover el proceso a la unidad de encuesta palabra asociada 11 que se describirá más tarde, aunque el conjunto de la creación y procesamiento de estructura de la oración sintético es el mismo que en la primera forma de realización, la salida El proceso de determinación es diferente. Un algoritmo de operación de la unidad de inspección de oraciones independiente 9 se muestra en la FIG.
Paso S36 un conjunto de la creación y la síntesis de los resultados, cuando el número conjunto de estructura de frases es 1, el proceso prosigue al paso S40, y emite el resultado de 'todo el sentido frase maquillaje' a la salida 7. Cuando el número de pares de estructuras de oraciones es dos o más y se ha ejecutado la investigación relacionada con palabras (paso S37), el flujo avanza al paso S39 para dar como resultado que 'la oración completa no tiene significado' 7, respectivamente. Además, solo cuando la investigación relacionada con palabras no se ha ejecutado en el paso S37, el flujo pasa a la sección 11 de investigación relacionada con palabras en el paso S38.
unidad de investigación relacionada Palabra 11 se refiere a la base de conocimientos palabra asociada 13 que se describirá a continuación, para investigar si los dos sustantivos están relacionados entre sí, relación sustantivo estructura de la oración destino si es relevante .
La base de conocimiento relacionada con la palabra 13 es una base de conocimiento en la que se registran los nombres entre las palabras que aparecen en el encabezado de un diccionario de idioma nacional y se almacenan las relaciones entre los nombres. La figura 11 muestra un ejemplo en el que una parte de los contenidos almacenados en la base de conocimiento relacionada con la palabra 13 está representada por una red semántica.
Para explicar el funcionamiento de la unidad de investigación 11 relacionada con la palabra, cambie la segunda oración de la oración de la figura 5 por 'Había una hermosa concha en la playa'. La salida de la unidad de análisis de estructura de frases 3 en este caso se muestra en la FIG. Como la segunda oración es una oración que tiene sentido en sí misma, no es necesario analizar la relación con otros nombres de otras oraciones en la técnica anterior. Por lo tanto, en este estado, la segunda oración no está relacionada con otras oraciones. Claramente, sin embargo, para los seres humanos, la segunda oración se puede considerar relacionada. La base de conocimiento relacionada con la palabra 13 mostrada en la figura 11 tiene información de que 'mar' y 'mar' están relacionados entre sí. La unidad de investigación de relación de palabras 11 usa esta información. La figura 13 muestra un ejemplo de un algoritmo de operación en la unidad de investigación de relación de palabras 11. La operación en la que 'mar' y 'mar' están asociados entre sí se describirá a continuación.
La unidad de investigación de asociación de palabras 11 verifica la relación de destino del sustantivo incluido en cada estructura de oraciones. Dado que hay un destino de relación en el nombre 'Hiromi' de la estructura de la primera oración, se entiende que la estructura de la primera oración está relacionada con la estructura de otra oración. Nosotros no investigamos 'mar'. A continuación, examinaremos la estructura de la segunda oración, pero en este caso ni 'mar' ni 'caparazón' están relacionados con otras estructuras de oraciones. Por lo tanto, antes que nada, para 'playa', recuperamos palabras que describen relaciones directamente de la base de conocimiento relacionada con palabras 13 y obtenemos 'mar' y 'playa de arena'. Luego, se examina una coincidencia entre 'Hiromi' y 'Sea' incluida en la estructura de la primera oración. El 'océano' de la estructura de la primera oración se establece en el destino de 'orilla del mar' de la estructura de la segunda oración, de modo que el 'mar' de la estructura de la primera oración 'Seaside' se establece en el destino relacionado de 'mar'. Además, investigue si existen los mismos sustantivos para las estructuras de la tercera a la sexta oración. Cuando esto se completa, de manera similar, los sustantivos sustantivo incluyen desde la tercera a la sexta cheques estructura de la oración si existe un destino relación, que extrae el lenguaje relacionado término asociado base de conocimientos 13 si no es coherente Para investigar Cuando finaliza la investigación relacionada con la palabra, el proceso vuelve a la unidad de inspección de oraciones independiente 9.
En este caso, dado que todas las estructuras de las oraciones están relacionadas con otras estructuras de las oraciones, se considera que la oración completa es significativa y termina.
Efecto de la invención
Si la oración completa tiene significado o no, debe entenderse entendiendo el significado descrito originalmente por las oraciones, pero el método no está actualmente establecido.
Sin embargo, como se explicó anteriormente, dado que la presente invención se centra en los nombres incluidos en las oraciones y se refiere a las bases de conocimiento relacionadas con las relaciones o palabras de las palabras, es fácil que las oraciones tengan relevancia entre oraciones Entiende, y porque juzga que 'toda la oración tiene sentido' con la relación de la gramática, puede dar un método simple.
Además, la entrada de la presente invención es una oración convencional aplicada con técnicas convencionales de análisis morfológico, análisis sintáctico, análisis semántico basado en relaciones de casos y análisis de contexto. Se han realizado varias propuestas sobre estas técnicas convencionales, y los tipos y estructuras de las partes del habla, que son los resultados de la aplicación de las mismas, pueden ser diferentes entre sí. Sin embargo, en cualquier método siempre hay una parte del nombre del discurso. Dado que este método se centra en este nombre, la versatilidad es alta independientemente del tipo de técnica convencional.
Breve descripción de los dibujos La figura 1 es un diagrama de bloques que muestra una configuración de un sistema en el que se aplica un método de inspección de frases de acuerdo con una primera realización de la presente invención.
La figura 2 es un diagrama de flujo que muestra un algoritmo de operación de la unidad de análisis de estructura de oraciones mostrada en la figura 1.
La Fig. 3 es un diagrama que muestra un ejemplo de una estructura de oraciones creada por la unidad de análisis de estructura de oraciones mostrada en la Fig. 1;
La figura 4 es un diagrama de flujo que muestra un algoritmo de operación de la unidad de inspección de frases independiente mostrada en la figura 1.
La figura 5 es un diagrama que muestra una oración de ejemplo para explicar el funcionamiento específico de la primera realización de la presente invención.
La figura 6 es un diagrama que muestra un ejemplo de entrada de acuerdo con una realización de la presente invención.
La Fig. 7 es un diagrama que muestra un ejemplo específico de una lista de estructuras de oraciones creadas por la unidad de análisis de estructura de oraciones mostrada en la Fig. 1;
La figura 8 es un ejemplo específico de una lista de estructuras de oraciones creadas por la unidad de análisis de estructura de oraciones cuando las oraciones de un objetivo de examen son diferentes.
La figura 9 es un diagrama de bloques que muestra una configuración de un sistema al que se aplica un método de inspección de oraciones de acuerdo con una segunda realización de la presente invención.
10 es un diagrama de flujo que muestra un algoritmo de operación de la unidad de inspección de oraciones independiente que se muestra en la FIG.
La figura 11 es un diagrama que muestra un ejemplo de base de conocimiento relacionada con palabras que se muestra en la figura 9.
La figura 12 es un diagrama que muestra un ejemplo específico de una lista de estructuras de oraciones creadas por una unidad de análisis de estructura de oraciones para explicar el funcionamiento de la segunda realización de la presente invención.
13 es un diagrama de flujo que muestra un algoritmo de operación de la unidad de investigación relacionada con palabras que se muestra en la figura 9
Fig. 6 ...... 1 entrada
Sección de análisis de la estructura de 3 oraciones
5, 9 sección de inspección de oraciones independiente
7 salidas
11 palabras departamento relacionado
13 palabras relacionadas con la base de conocimiento
Reclamo
El análisis morfológico en cada cada oración de la pluralidad de estados que constituyen los morfemas de oraciones reivindicación 1 cada frase obtenidos de un resultado del análisis semántico y el análisis contextual basado en proceso de análisis sintáctico y la relación caso y su parte de información de voz Como entrada, identifica una oración de la entrada, extrae secuencialmente la información correspondiente a la oración, extrae un sustantivo de la información correspondiente a la oración y extrae el sustantivo de la fuente y la fuente mientras, que se asoció destino detectar información correspondiente a otras declaraciones contenía el mismo sustantivo este sustantivo, un paso de creación de la creación de estos pares de origen y de destino relación asociados para la combinación de todas las frases del texto como entrada todos los pares creados en este proceso de creación, de origen asociado o el destino asociado incluido en el par, todo si se trata de la misma como fuente pertinente o destino relacionadas, incluidos en otro par de prueba de pares Proceso de inspección , Y un paso decisivo al juzgar que 'toda la oración tiene sentido' cuando todas las parejas están relacionadas, y que 'si toda la oración no tiene sentido', si no Un método de inspección de oraciones.
El análisis morfológico en cada cada oración de la pluralidad de estados que componen los morfemas frase segundo aspecto cada frase obtenida de un resultado del análisis semántico y análisis contextual basado en proceso y el relación caso y su parte de información de voz de análisis un método de inspección frase para inspeccionar el establecimiento de frases como entradas, identifica las declaraciones de la extracción de información de entrada correspondiente a la frase en orden, y recupera los nombres a partir de la información que corresponden a esta frase de origen asociado de esta mientras, que se asoció destino detectar información correspondiente a otras declaraciones contenía el mismo sustantivo este sustantivo, un paso de creación de la creación de estos pares de origen y de destino relación asociados para la combinación de todas las frases del texto tener una base de conocimientos que se acumula los sustantivos relacionados, una etapa de determinación de determinar si está asociado con dos sustantivos utilizando la base de conocimientos, introduzca todos los pares creados en el paso de creación o etapa de determinación Como, Un paso de inspección para inspeccionar todos los pares en cuanto a si la fuente de relación o el destino relacionado incluido en el otro par es igual a la fuente de relación o el destino relacionado incluido en el otro par; Y el juicio que juzga que 'toda la oración no tiene sentido', de lo contrario, juzga que 'toda la oración no tiene sentido'.
Dibujo :
Application number :1997-016591
Inventors :日本電信電話株式会社
Original Assignee :島田茂夫、飯田敏幸