Diccionario de pronunciación del dispositivo
Descripción general
 Al decidir el nombre de un producto, etc., obtenga un diccionario que pueda buscar palabras con pronunciaciones parciales de manera similar. ] El diccionario de pronunciación se genera utilizando el diccionario de palabras existente. Para hacer esto, los símbolos fonéticos que constituyen la notación de pronunciación se combinan primero en orden, y se extrae la cadena de símbolos de pronunciación parcial tanto como sea posible. Y ordena esto alfabéticamente. De esta manera, es posible recopilar y referirse a palabras con pronunciaciones parciales al mismo tiempo a alta velocidad.
Campo técnico
Campo técnico La presente invención se refiere a un aparato de diccionario de pronunciación para buscar palabras de varios idiomas con referencia a la pronunciación usando un aparato de procesamiento de información.
Antecedentes de la técnica
Convencionalmente, un diccionario utilizado para examinar la lingüística y los términos académicos está estructurado para realizar una búsqueda basada en palabras. Para los diccionarios de conversión de kana-kanji utilizados en procesadores de texto y computadoras personales, la lectura se usa para extraer kanji. En cualquier caso, se busca una palabra deseada usando datos en un formulario de índice organizado en un cierto orden del denominado primer carácter de una palabra. Por otro lado, la ortografía y la pronunciación de las palabras no siempre coinciden. Por lo tanto, en consideración a la lectura de palabras, también se ha propuesto un diccionario basado en símbolos fonéticos (solicitud de patente japonesa abierta a consulta por el público n.º 265633/1986). Además, en varios diccionarios de términos técnicos, es posible buscar palabras que no están ordenadas en función de las primeras letras que componen la cadena de caracteres, pero basadas en palabras significativas en la cadena de caracteres como referencia.
Tarea de solución
Por cierto, el diccionario convencional como se describió anteriormente tiene los siguientes problemas para ser resueltos. Por ejemplo, en el caso de determinar el llamado nombre del producto, en la búsqueda de otro nombre de producto o palabra similar en pronunciación al nombre del producto sugerido, seleccionar uno apropiado en un diccionario ordenado en un cierto orden del personaje principal No puedo apagar. Es decir, la parte media de una palabra puede contener palabras de pronunciación similar, y no es posible responder a la solicitud para extraer esas palabras por completo. Incluso si usa un diccionario basado en la ortografía de palabras comunes o un diccionario que usa una cadena de símbolos de pronunciación como la anterior, existe un problema similar.
Solución
Para resolver los problemas anteriores, la presente invención emplea la siguiente configuración. El aparato de la presente invención, con referencia al diccionario de palabras que asocia palabras encontradas y su transcripción de fonemas, extrae toda la cadena parcial de los símbolos fonéticos necesario, cada cadena parcial de los símbolos fonéticos prefijado pronunciación símbolo cadena y el prefijo Además una combinación de palabras encontradas si la cadena pronunciación símbolo está vacío comprende una unidad de extracción de secuencia de símbolo fonético parcial para almacenar en el archivo de trabajo, y una unidad de generación de diccionario de clasificación que genera una ordenada para el diccionario de pronunciación alfabéticamente el archivo de trabajo.
Además, una sección de entrada de cadena de símbolo de pronunciación para aceptar una cadena de símbolo de pronunciación parcial arbitraria, una sección de búsqueda de diccionario de pronunciación para buscar una palabra incluyendo una cadena de símbolo de pronunciación correspondiente en expresión fonética con referencia al diccionario de pronunciación y un resultado de búsqueda Y una unidad de salida.
El diccionario de pronunciación se genera utilizando un diccionario de palabras existente. Para hacer esto, los símbolos fonéticos que constituyen la notación de pronunciación se combinan primero en orden y se extrae la secuencia de símbolos de pronunciación parcial tanto como sea posible. Y ordena esto alfabéticamente. De esta manera, es posible recopilar y referirse a palabras con pronunciaciones parciales al mismo tiempo a alta velocidad.
Sucesivo, la presente invención se describirá en detalle con referencia a la realización de la fig. La figura 1 es un diagrama explicativo de una operación de generación de diccionario de pronunciación de acuerdo con la presente invención. Antes de describir esta operación concreta, la configuración del aparato de la presente invención se describirá con referencia a las figuras 2 y 3. La figura 2 es un diagrama de bloques que muestra una realización de hardware del dispositivo de la presente invención. Este aparato comprende una unidad de generación de diccionario de pronunciación 3 para generar un diccionario de pronunciación 2 de un diccionario de palabras 1 y una unidad de recuperación de diccionario de pronunciación 4, unidad de entrada de secuencia de símbolos fonéticos 5 y una unidad de salida 6 para buscar el diccionario de pronunciación 2 Ha sido hecho. La unidad de salida 6 está provista de una unidad de acumulación de archivos 7, una unidad de impresión 8, una unidad de visualización 9 y una unidad de vocalización 10.
La figura 3 es un diagrama de bloques de la unidad de generación de diccionario de pronunciación. Como se muestra en la figura, la unidad de generación de diccionario de pronunciación 3 está compuesta de una unidad de extracción de palabras 3 1, una unidad de extracción de cadenas de símbolos de pronunciación parcial 3 2 y una unidad de generación de diccionarios de ordenación 3 3. Como se muestra en la figura 1, el diccionario de palabras 1 asocia títulos de palabras con notaciones de pronunciación, y los digitaliza de modo que los diccionarios generalmente bien conocidos pueden ser procesados ​​por una computadora. El diccionario de pronunciación 2 se obtiene finalmente en el aparato de la presente invención, en el que las palabras que tienen pronunciación parcialmente idéntica se disponen con referencia a la pronunciación de las mismas, y se componen de notación fonética y encabezado de palabra.
Aquí, se describirá en primer lugar el funcionamiento de la unidad de generación de diccionario de pronunciación 3 mostrada en la figura 2. El paso S1 mostrado en la figura 1 El paso S4 muestra el procesamiento para generar un diccionario de pronunciación a partir de un diccionario de palabras mediante la sección de generación de diccionario de pronunciación. En primer lugar, en la etapa S1 de la figura 1, la unidad de extracción de palabras 3 1 mostrada en la figura 3 se refiere al diccionario de palabras 1 y extrae un título de palabra y una notación de pronunciación del diccionario de palabras. En el paso S2, la unidad de extracción parcial fonética secuencia de símbolos 3 2 lleva a cabo una cadena parcial de los símbolos fonéticos, y un prefijo a la cadena parcial de los símbolos fonéticos, el prefijo se almacena en la combinación de trabajo una palabra partida si archivo vacío.
La figura 4 muestra un diagrama explicativo de operación de la unidad de extracción de cadena de símbolo de pronunciación parcial. En esta figura, (a) es una cadena de símbolos de pronunciación parcial, y (b) son datos para el diccionario de pronunciación. Por ejemplo, como se muestra en esta figura, en el caso de la palabra 'belleza', su pronunciación es 'bju: ti'. La cadena del símbolo de pronunciación parcial es una secuencia de todos los símbolos fonéticos, incluida la cola, al comienzo de 'b', 'j', 'u', 't', 'i' Se refiere a una combinación. Por lo tanto, como se muestra en la figura, la cadena de símbolo de pronunciación parcial 'ju: ti' también es un candidato de la misma, y ​​la cadena de símbolo fonético 'u: ti' también es un candidato de la misma. Además, las cadenas de símbolo de pronunciación parcial 'ti' e 'i' también son candidatas. Además, no coloque caracteres como los llamados tonos largos como ':' al comienzo. La figura 4 (b) muestra un ejemplo en el que se añaden cadenas de símbolos fonéticos y encabezados de palabras de prefijo. Como se puede ver en la figura, solo en el caso de (1), se da un título de palabra. Después de extraer todas las cadenas de símbolos de pronunciación parciales concebibles, en el paso S3, los pasos S1 y S2 se repiten hasta que no haya palabras en el diccionario de palabras.
A continuación, en el paso S4, todos los registros acumulados en el archivo de trabajo se ordenan en orden alfabético. En ese momento, si la cadena del símbolo de pronunciación parcial y la parte del prefijo son iguales, solo se evitará una ocurrencia. Además, cuando el prefijo está vacío, si la misma cadena de símbolos fonéticos parciales ya se ha clasificado como resultado de la clasificación, dado que es el caso de homónimos, se proporciona una pluralidad de títulos de palabras. Este título de palabra está organizado en orden alfabético con un delimitador. Los puntos y coma, etc. se utilizan como delimitadores entre los títulos de las palabras. Un ejemplo del mismo se describirá más adelante con referencia a la figura 5. El resultado ordenado se almacena en el diccionario de pronunciación y se genera un diccionario de pronunciación. Como resultado del proceso anterior, se genera un diccionario de pronunciación que combina la notación de pronunciación y el título de la palabra. Como resultado de ello, por ejemplo, el mismo símbolo cadena pronunciación partes 'BJU:' en la búsqueda de una palabra con, el uso del diccionario de pronunciación 2 'bju: TI () belleza' Ya 'bju: (dei)' y similares se encuentran. En el último caso, dado que la cadena del símbolo de pronunciación del prefijo no está vacía, traiga la palabra antes, y busque de nuevo el diccionario de pronunciación con deibju :(), se encuentra la palabra titular 'debut'.
La figura 5 muestra un diagrama explicativo específico del diccionario de pronunciación. El ejemplo que se muestra en la figura 5 es un ejemplo del diccionario de pronunciación 2 mostrado en la figura 1 en el que las anotaciones de pronunciación y los títulos de las palabras se muestran en asociación entre sí. Las palabras que tienen la misma notación de pronunciación descrita en (4) se describen usando delimitadores como punto y coma en la misma entrada.
Cuando se busca un diccionario de pronunciación como se describió anteriormente, se usa la unidad 4 de búsqueda de diccionario de pronunciación mostrada en la figura 2. Es decir, como se describió anteriormente, por ejemplo, una cadena de símbolos fonéticos 'bju:' se ingresa desde la unidad 5 de entrada de cadena de símbolos de pronunciación. La unidad 4 de recuperación del diccionario de pronunciación busca el diccionario de pronunciación 2 de la manera descrita anteriormente prestando atención a esta cadena de símbolos de pronunciación. Luego, el resultado de la búsqueda se visualiza en la unidad de visualización 9, por ejemplo, una pantalla o similar, o se imprime mediante la unidad de impresión 8. Debe observarse que las palabras extraídas usando la unidad de emisión 10 pueden ser expresadas por voz. También es posible almacenar resultados de búsqueda en la unidad de almacenamiento de archivos 7 para su uso.
La unidad 4 de búsqueda del diccionario de pronunciación puede contener archivos de índice ampliamente utilizados en bases de datos generales, de modo que el diccionario de pronunciación pueda recuperarse a alta velocidad. También es posible realizar una búsqueda lógica que combine un método de búsqueda tal como una búsqueda binaria y AND, O, o similar. Además, es posible realizar una búsqueda compleja que incluya un comodín.
La presente invención no está limitada a las realizaciones anteriores. En la realización anterior, la clasificación y la extracción de muchas cadenas de símbolos de pronunciación partes como sea posible, por ejemplo, qué parte símbolos fonéticos de criterios para extraer la columna, el número límite inferior o la pronunciación símbolo pronunciación cadena símbolo convencional También es posible establecer los datos usando una agrupación o similar, y ajustar la capacidad general del diccionario de pronunciación. Cuando se emite el diccionario de pronunciación, es preferible el formato que se muestra en la figura 5, pero pueden adoptarse diversos métodos de acuerdo con otros modos de uso. La salida del resultado de búsqueda puede mostrarse en una pantalla, imprimirse, expresarse por la unidad de emisión o almacenarse en un archivo en la unidad de almacenamiento como una forma arbitraria. Además, en la realización anterior, se dio una explicación basada en el inglés, pero puede ser ampliamente adoptada para lenguajes naturales como el japonés y el chino, y además, el japonés y el inglés se mezclan para generar un diccionario basado en los símbolos fonéticos. Es posible Por supuesto, también se puede aplicar a ciertas frases y oraciones sin usar palabras como una unidad. Con esto, también es posible buscar intensamente buscando palabras que son difíciles de escuchar o difíciles de leer, como cuando se estudia un idioma extranjero, como cuando se estudia la pronunciación.
Efecto de la invención
Según el aparato de pronunciaciones de la presente invención se ha descrito anteriormente, mediante la extracción de toda la cadena parcial de los símbolos fonéticos necesarias para su inclusión en la transcripción de fonemas y se ordenan en base a los símbolos fonéticos, por su cadena de símbolo pronunciación parte, de modo que usted puede buscar palabras , Es posible recuperar palabras con pronunciaciones parciales a alta velocidad. Además, dado que la pronunciación puede ser para cualquier parte de la palabra, se puede aplicar a la recuperación de palabras similares que adoptan el nombre del producto. También es posible reunir palabras con una pronunciación similar y usarlas en varios campos.
BREVE DESCRIPCIÓN DE LOS DIBUJOS FIG.
La figura 2 es un diagrama de bloques de hardware del dispositivo de la presente invención.
La figura 3 es un diagrama de bloques de una unidad de generación de diccionario de pronunciación.
La figura 4 es un diagrama para explicar el funcionamiento de la unidad de extracción de cadena de símbolos fonéticos parciales, en la que (a) es una cadena de símbolos de pronunciación parcial y (b) datos para un diccionario de pronunciación.
La figura 5 es un diagrama explicativo de un ejemplo específico de un diccionario de pronunciación.
Diccionario de 1 palabra
2 diccionario de pronunciación
Reclamo
Con referencia a la reivindicación 1 palabra del diccionario de palabra titular que asocia su transcripción fonética, extrae toda la cadena parcial de los símbolos fonéticos cadena de prefijo necesaria de símbolos fonéticos con el prefijo pronunciación símbolo de cadena y cada cadena parcial de los símbolos fonéticos hay aún más mediante la combinación de la palabra en dirección si está vacío, y que comprende: la unidad de extracción secuencia de símbolos fonéticos parcial para almacenar en el archivo de trabajo, y una unidad de generación de diccionario de clasificación para generar un diccionario de pronunciación para ordenar los archivos de trabajo alfabéticamente Dispositivo de diccionario de pronunciación.
Una sección de entrada de cadena de símbolo de pronunciación para aceptar una cadena de símbolo de pronunciación parcial arbitraria, una sección de búsqueda de diccionario fonético para buscar una palabra incluyendo una cadena de símbolo de pronunciación correspondiente en expresión fonética al consultar el diccionario de pronunciación y generar un resultado de búsqueda Y una unidad de salida para emitir dicho diccionario de pronunciación a dicha unidad de diccionario de pronunciación.
Dibujo :
Application number :1997-016575
Inventors :沖電気工業株式会社
Original Assignee :安原宏