Método de detección de fallas del bus externo
Descripción general
 Se obtiene un método de detección de fallas de un bus externo que evita la conmutación inapropiada del sistema debido a una falla de un bus externo que conecta una pluralidad de dispositivos de una configuración de sistema redundante. ] En una configuración de sistema redundante en funcionamiento como dispositivo operacional sistema 8 y el dispositivo de modo de espera 18, la unidad de control principal 1 del dispositivo activo a través del bus externo 9, el área de memoria 20 de la B13 memoria del sistema de modo de espera en un periodo fijo T Escribe datos específicos. La unidad de control principal 11 del dispositivo de sistema en espera lee los datos del área de memoria 20 a un ciclo constante m × T (m es un número natural). Cuando los datos leídos coinciden con los datos escritos por la unidad de control principal 1, la unidad de control principal 11 del sistema en espera determina que el bus externo 9 es anormal cuando el bus externo 9 es normal y no coincide. Cuando se considera anormal, se reserva la ejecución de la conmutación al dispositivo de sistema activo del dispositivo de sistema en espera que se considera anormal.
Campo técnico
La presente invención se refiere a un método de detección de fallas para un bus externo, y más particularmente a un método de detección de fallas para un bus externo utilizado para la transferencia de datos entre dispositivos que tienen una configuración de sistema redundante.
Antecedentes de la técnica
Un ejemplo de un método de detección de fallas convencional de un bus externo se muestra en la figura 2 como un diagrama de configuración. En un dispositivo 38 y el otro dispositivo 48 que forma la configuración de sistema redundante de esta figura, uno de los dos dispositivos 38, 48 funciona como el dispositivo activo y el otro como el dispositivo de reserva. El dispositivo de control de conmutador activo 49 selecciona el dispositivo para que sea el sistema activo.
Ambos dispositivos 38 y 48 están provistos de un bus externo 39 que sirve como un bus de transferencia de datos para hacer una copia de seguridad de la base de datos del dispositivo activo en el dispositivo de reserva y un bus serie 39 para notificar el estado operativo del dispositivo en espera al dispositivo activo Y una comunicación 40.
Cada uno de los dispositivos 38, 48 tiene una unidad de control principal 31, 41 para controlar el funcionamiento de cada dispositivo, memorias A 32, 42 que constituyen un área de memoria para almacenar programas de pasos de operación, una memoria B 33 para almacenar una base de datos, 43, unidades de control de comunicación en serie 34, 44 para controlar la comunicación en serie 40 entre los dispositivos, unidades de control de bus externo 35, 45 para controlar el bus externo 39 para transferir datos entre los dispositivos, interno Y unidades de control de bus interno 37 y 47 para controlar los buses 36 y 46.
Se describirá la operación cuando un dispositivo 38 está funcionando como el dispositivo activo y el otro dispositivo 48 está funcionando como el dispositivo de reserva. En el estado normal, la unidad de control principal 31 de un dispositivo 38 actualiza los contenidos de la memoria B 43, que es una base de datos, después de actualizar los contenidos de la memoria B 43 de forma similar a la memoria B 33, y hace una copia de seguridad de la base de datos.
Cuando se produce un fallo en uno de los dispositivos 38 que funcionan como dispositivos activos, el dispositivo de control de conmutador activo 49 conmuta el estado de funcionamiento del dispositivo activo 38 y el estado de funcionamiento del dispositivo de reserva 48 Y juzga la necesidad de cambiar. En esta determinación, si es necesaria la conmutación del sistema, el otro dispositivo 48 se conmuta al dispositivo activo y un dispositivo 38 se conmuta al dispositivo de reserva. En ese caso, el contenido de la memoria B 43 se convierte en una nueva base de datos.
Incluso cuando se produce un problema en la unidad de sistema activo 38, si ya se ha producido un fallo en la unidad de sistema de reserva 48, se conserva el estado de funcionamiento actual y el sistema activo no se conmuta.
Cuando se produce un fallo en la barra externa 39 entre los dispositivos, dado que la unidad de control principal 31 actualiza el contenido de la memoria B 43, se produce un error de bus al acceder al bus externo 39. Debido a este error de bus, se detecta la ocurrencia de un fallo en el bus 39 externo.
En ese caso, la unidad de control principal 31 del dispositivo 38 que opera como el sistema activo que contiene el derecho de acceso al bus detecta un error de bus, y esta unidad de control principal 31 transmite la ocurrencia de falla del propio dispositivo al dispositivo de control de conmutación del sistema activo 49 Notificar Por lo tanto, cuando el estado de funcionamiento de la unidad del sistema en espera es normal, se ejecuta la conmutación del sistema activo.
Tarea de solución
Sin embargo, el método de detección de fallas de bus externo convencional tiene los siguientes problemas. Un fallo del bus externo y un fallo de la unidad de control de bus externo 45 de la unidad de sistema de reserva 48 como un fallo del dispositivo de la unidad de sistema activo 38. Por lo tanto, cuando se produce un fallo en el bus externo 39 o se produce un fallo en la unidad de control de bus externo 45 de la unidad de sistema en espera 48, se produce la conmutación del sistema del sistema. En base a la conmutación del sistema, el funcionamiento del sistema se inicia nuevamente basándose en la base de datos de la unidad de reserva 48 que no se ha actualizado.
El fallo de la unidad de control de bus externo 45 de la unidad de sistema en espera 48 se detecta como un fallo de la unidad de sistema activo 38 y la unidad de sistema activo 38 notifica a la unidad de control de conmutación de sistema activo 49 la ocurrencia de fallas de la unidad de sistema activo 38. Por lo tanto, debido a un fallo de la unidad externa de control de bus 45 de la unidad de sistema en espera 48, incluso si la base de datos de la unidad de sistema en espera 48 no se actualiza, se produce la conmutación del sistema del sistema y la unidad de sistema en espera 48 El sistema funciona según la base de datos de.
Cuando el dispositivo activo accede al bus externo para hacer una copia de seguridad de la base de datos, detecta por primera vez que la unidad externa de control del bus externo tiene una falla. Por esta razón, el reconocimiento de la ocurrencia de falla se retrasa.
La presente invención, redundante conectar la configuración del sistema de una pluralidad de dispositivos para detectar rápidamente el fallo de la prevención de bus externo de conmutación incorrecto del sistema, y ​​un objeto del mismo es proporcionar un método de detección de fallo del bus externo.
Solución
Para lograr el objeto anterior, el método de detección de fallos del bus externo de la presente invención están conectados por una línea de comunicación para transmitir el bus externo y el estado de funcionamiento de la transferencia de datos, sistema activo dispositivo opcionalmente y el dispositivo de espera , Que es una configuración de sistema redundante que utiliza al menos dos dispositivos, y el dispositivo activo está conectado a un área de memoria predeterminada del dispositivo en espera a través del bus externo y la porción de control de bus externo ; Un paso de lectura de datos predeterminados grabados en el paso de escritura de datos, cotejo de los datos de lectura con datos predeterminados predeterminados, y a juzgar por el resultado de la verificación Un paso de confirmación de datos para determinar la normalidad / anormalidad de una línea de transmisión de datos desde el dispositivo activo al dispositivo en espera, y un paso de, Y una anormalidad proceso de detección para hacer una bandera de detección de anomalías para la identificación de allí anormal, cuando la bandera de detección de anomalías se eleva, el sistema operativo y el sistema de espera con el dispositivo de espera Y reserva la ejecución del cambio mutuo.
Además, es preferible ejecutar repetidamente la etapa de escritura de datos, la etapa de confirmación de datos y la etapa de detección de ocurrencia de anormalidades a intervalos predeterminados.
Además, el método de detección de fallas del bus externo tiene una etapa de transmisión de ocurrencia anormal de transmitir el resultado de evaluación al dispositivo del sistema de operación, y es preferible decidir la ejecución o reserva de conmutación en base al resultado del juicio transmitido.
Obsérvese que el área de memoria predeterminada del dispositivo de sistema en espera puede configurarse para estar dentro o adyacente a un área que contiene una base de datos gestionada por el dispositivo activo.
Por lo tanto, según el método de detección de fallas de bus externo de la presente invención, el dispositivo activo registra datos predeterminados prescritos en un área de memoria predeterminada del dispositivo de sistema en espera a través del bus externo y la unidad de control de bus externo. , Lee los datos predeterminados grabados en el paso de escritura de datos, recopila los datos de lectura con datos predeterminados predeterminados y compara los datos de lectura / escritura con el predeterminado / Por lo tanto, determinar una anormalidad. Cuando se juzga como anormal por esta confirmación, se establece un indicador de detección de ocurrencia de anormalidad para identificar la ocurrencia de una anomalía. Cuando se establece el indicador de detección de ocurrencia de anomalías, se reserva la ejecución del cambio entre el sistema activo y el sistema en espera con la unidad del sistema en espera. Por lo tanto, de acuerdo con el procedimiento anterior, la aparición de anormalidades puede conocerse rápidamente, y es posible evitar forzar la conmutación del sistema en un estado anormal.
DESCRIPCIÓN DETALLADA DE LAS REALIZACIONES PREFERIDAS Las realizaciones a modo de ejemplo de un método para detectar un fallo de un bus externo de acuerdo con la presente invención se describirán en detalle con referencia a los dibujos adjuntos. Con referencia a la figura 1, se muestra una realización de un método de detección de fallos de un bus externo de la presente invención.
En la figura 1, en los dispositivos 8 y 18 que tienen la configuración de sistema redundante, uno de los dos dispositivos funciona como el dispositivo activo y el otro como el dispositivo de reserva, y el controlador de conmutación activo 21 selecciona el dispositivo activo. .
Ambos dispositivos están conectados por un bus externo 9 que es un bus de transferencia de datos para hacer una copia de seguridad de la base de datos del dispositivo activo y una comunicación en serie 10 para notificar al dispositivo activo el estado operativo del dispositivo en espera.
Cada uno de los dispositivos 8 y 18 incluye una unidad de control principal 1 y una unidad de control principal 11 para controlar el interior del dispositivo, una memoria A 2 y una memoria A 12 que constituye un área de memoria para almacenar un programa para controlar y operar el interior del dispositivo. Una memoria B3 y una memoria B13 que sirven como bases de datos en el aparato, una unidad de control de comunicación en serie 4 y una unidad de control de comunicación en serie 14 para controlar la comunicación en serie 10 entre los dispositivos y un bus externo 6 para transferir datos entre los dispositivos Una unidad de control de bus externo 5 y una unidad de control de bus externo 15, una unidad de control de bus interno 7 para controlar el bus interno 6 del dispositivo 8 y una unidad de control de bus interno 17 para controlar el bus interno 16 del dispositivo 18.
Un área de memoria específica 19 y un área de memoria 20 están provistos dentro de la memoria B 3 y la memoria B 13 de cada uno de los dispositivos 8, 18 para la detección de fallas del bus externo 9. En estas áreas de memoria 19 y 20, los datos para la confirmación de la operación que no sean los datos de la base de datos original se almacenan temporalmente. Por ejemplo, aunque la actualización de los datos almacenados en la base de datos se ejecuta al conmutar el sistema activo, los datos de confirmación que se almacenan temporalmente en el área de memoria actual se ejecutan sobre una base regular predeterminada. Estos datos de confirmación son datos específicos predeterminados y son un mínimo o un dato único o plural necesario para verificar la normalidad / anormalidad de la línea de comunicación y los elementos de memoria. Los datos de confirmación se escriben a través del mismo sistema de comunicación que el bus externo 39 y la comunicación serial 40, se leen los datos escritos, se comprueban los contenidos de datos entre los datos de escritura y lectura y se confirma la normalidad / anormalidad de cada sistema de comunicación .
En esta confirmación, al realizar la confirmación de operación a través del sistema de comunicación y la confirmación de operación no a través del sistema de comunicación, es posible verificar si la ubicación de falla del propio dispositivo o la falla del otro dispositivo incluyendo el I / F Puede ser determinado.
Se describirá la operación cuando el dispositivo 8 es el dispositivo activo y el dispositivo 18 es el dispositivo de reserva. En el estado normal, la unidad de control principal 1 del dispositivo 8 actualiza los contenidos de la memoria B 3 que es la base de datos, actualiza el contenido de la memoria B 13 como la memoria B 3 y hace una copia de seguridad de la base de datos.
Cuando se produce una falla en el dispositivo activo 8, sobre la base del estado de funcionamiento del dispositivo activo 8 y el estado de funcionamiento del dispositivo de sistema en espera 18, el dispositivo de control de conmutador activo 21 determina si la necesidad de conmutación del sistema . Si es necesaria la conmutación del sistema, el dispositivo 18 se conmuta al sistema activo, y el dispositivo 8 se conmuta al sistema en espera. En ese caso, el contenido de la memoria B 13 se convierte en una nueva base de datos. Incluso cuando se produce una falla en el dispositivo activo 8, si ya se ha producido una falla en el dispositivo de sistema en espera 18, se retiene el estado de funcionamiento actual y el sistema activo no se conmuta.
La unidad de control principal 1 del sistema activo escribe datos específicos en el área de memoria 20 de la memoria B 13 de la unidad de reserva 18 en el ciclo constante T a través del bus externo 9, por separado del proceso de respaldo de la base de datos descrito anteriormente. La unidad de control principal 11 del sistema en espera lee los contenidos del área de memoria 20 de la memoria B 13 con un ciclo constante m × T (m es un número natural), borra el contenido del área de memoria 20 después de leer los datos.
La unidad de control principal 11 juzga los datos de lectura, y cuando los datos leídos coinciden con los datos específicos escritos por la unidad de control principal 1, la unidad de control principal 1 del dispositivo de sistema activo transmite los datos a la memoria B 13 del dispositivo de sistema en espera Como se puede acceder, se considera que el bus externo 9 está en un estado normal.
Si los datos de lectura no coinciden con los datos específicos escritos por la unidad de control principal 1, la unidad de control principal 1 del dispositivo activo considera que no se puede acceder normalmente a la memoria B 13 del dispositivo de sistema en espera, y el bus externo 9, la unidad de control principal 11 del dispositivo de sistema en espera notifica a la unidad de control de conmutación del sistema activo 21 la aparición del fallo de su propio dispositivo, y además, a través de la comunicación en serie 10, la unidad de control principal 11 de la unidad de sistema en espera Y notifica al controlador principal 1 de la ocurrencia de la falla del bus externo 9.
El fallo de la comunicación en serie 10 para notificar el estado operativo del dispositivo 18 del dispositivo de sistema en espera al dispositivo 8 del sistema activo es que la unidad de control de comunicación en serie 4 del sistema activo tiene la unidad de control de comunicación en serie 14, y detecta si la unidad de control de comunicación en serie 14 de la unidad en espera devuelve o no una respuesta normal. Cuando la respuesta de la unidad 14 de control de comunicación en serie al sondeo de la unidad 4 de control de comunicación en serie no es respuesta o respuesta anormal, la unidad 1 de control principal del dispositivo activo juzga que se ha producido un problema en la comunicación en serie, Tome medidas como establecer una bandera de. Si la respuesta es una respuesta normal, se determina que la comunicación serial es normal y se ejecuta la comunicación subsiguiente.
Como se describió anteriormente, de acuerdo con el método de detección de una falla de un bus externo de acuerdo con la presente invención, la unidad de control principal del sistema activo, a través del bus externo en el período constante T, respalda la base de datos de la unidad en espera, Escribe datos específicos en el área. La unidad de control principal del sistema de espera, m periódica × T (m es un número natural) lee los datos de la zona en y se aclaró el área, y los datos leídos se reescribe por la unidad de control principal de los datos del dispositivo del sistema activo Y determina si coinciden. Cuando los datos leídos coinciden con los datos reescritos por la unidad de control principal de la unidad del sistema activo, la unidad de control principal de la unidad del sistema en espera determina que el bus externo es normal. Si los datos leídos no coinciden con los datos reescritos por la unidad de control principal de la unidad del sistema activo, la unidad de control principal del sistema en espera determina que se ha producido una falla en el bus externo. Notifica al dispositivo de control de conmutación activo la ocurrencia de la falla de su propio dispositivo y notifica a la porción de control principal del dispositivo activo que la ocurrencia de la falla del bus externo se ha detectado a través de una comunicación en serie que conecta el dispositivo activo y el dispositivo de reserva Notificar al sistema En la unidad de control principal de la unidad de sistema en espera, el estado del bus externo se supervisa a un ciclo fijo m × T (m es un número natural) y la falla del bus externo se notifica desde la unidad de reserva a la unidad activa.
Un fallo del bus externo, un fallo de la unidad de control de bus externo de la unidad de reserva y una falla de la unidad de control de bus externo de la unidad activa se notifican a la unidad de control de conmutación del sistema activo como un fallo de la unidad de reserva, , O cuando ocurre una falla en el bus externo y luego se produce una falla en el dispositivo activo, no se realiza la conmutación del sistema activo, la conmutación del sistema operativo innecesario se ve obstaculizada, El sistema puede ser operado basado en la base de datos.
Es fácil distinguir entre una falla del bus externo y una falla del bus interno, y es posible limitar la ubicación de la ocurrencia de la falla.
Es posible descubrir un fallo del bus externo, un fallo de la unidad de control de bus externo de la unidad de reserva y un fallo de la unidad de control de bus externo de la unidad activa antes de ejecutar el proceso de respaldo de la base de datos.
Debe observarse que aunque las realizaciones descritas anteriormente son ejemplos de realizaciones preferidas de la presente invención, la presente invención no se limita a las mismas, y se pueden realizar diversas modificaciones sin apartarse del espíritu de la presente invención.
Efecto de la invención
Como es evidente a partir de la descripción anterior, el método para detectar un fallo en el bus externo de la presente invención se caracteriza porque el dispositivo del sistema activo se transfiere al área de memoria predeterminada del dispositivo de sistema en espera a través del bus externo y el controlador de bus externo. Los datos predeterminados grabados se leen, en comparación con datos predeterminados predeterminados, y la normalidad / anormalidad de la línea de transmisión se evalúa a partir del resultado de la intercalación. Cuando se juzga como anormal por esta confirmación, se establece un indicador de detección de ocurrencia de anormalidad para identificar la ocurrencia de una anomalía. Cuando se establece el indicador de detección de ocurrencia de anomalías, se reserva la ejecución del cambio entre el sistema activo y el sistema en espera con la unidad del sistema en espera. Por lo tanto, es posible conocer la ocurrencia de anormalidad tan pronto como sea posible, para evitar forzar la conmutación del sistema en un estado anormal, para evitar la destrucción de datos debido a la transferencia de la base de datos que acompaña el cambio del sistema y la subsiguiente gestión de defectos. .
Breve descripción de los dibujos La figura 1 es un diagrama de bloques del sistema de una configuración redundante a la que se aplica una realización de un método de detección de fallos de un bus externo según la presente invención.
La figura 2 es un diagrama de bloques del equipo de un sistema redundante convencional.
1, 11 unidad de control principal
2, 12 Memoria A
3, 13 memoria B
4, 14 unidad de control de comunicación en serie
5, 15 Unidad de control de bus externo
6, 16 Bus interno
7, 17 Unidad de control de bus interno
8, 18 Equipo
9 Autobús externo
10 comunicación en serie
19, 20 Área de memoria
21 Dispositivo de control de conmutación del sistema operativo
Reclamo
Reivindicaciones: 1. Un sistema de comunicación que comprende al menos dos dispositivos conectados por un bus externo para la transferencia de datos y una línea de comunicación para transmitir un estado de operación, y el cambio de roles entre sí como un dispositivo activo y un dispositivo de reserva según sea necesario Un método para detectar un fallo de bus externo en una configuración de sistema redundante, donde el dispositivo de sistema activo transfiere datos para registrar datos predeterminados en un área de memoria predeterminada del dispositivo de sistema en espera a través del bus externo y el controlador de bus externo Leer los datos predeterminados grabados en el paso de escritura de datos, cotejar los datos leídos con los datos predeterminados, y comparar los datos leídos con los datos predeterminados y comparar los datos leídos con los datos predeterminados, Un paso de confirmación de datos para juzgar la normalidad / anormalidad de la línea de transmisión de los datos, y cuando se juzga como anormal en el paso de confirmación de datos, Y una anormalidad proceso de detección para hacer una marca de detección de anomalías para, cuando se eleva la bandera de detección de anomalía, la ejecución de la conmutación activo y mutuo de sistema de reserva y por el sistema de reserva dispositivo Y reservando la información de reserva.
2. El método para detectar un fallo en un bus externo de acuerdo con la reivindicación 1, en el que dicho paso de escritura de datos, paso de confirmación de datos y paso de detección de ocurrencia de anormalidad se ejecutan repetidamente a intervalos predeterminados.
3. El método para detectar un fallo en un bus externo según la reivindicación 1, que comprende además una etapa de transferencia de ocurrencia anormal de transmitir el resultado de evaluación al dispositivo activo, y ejecutar o reservar la conmutación en función del resultado del juicio transmitido. 3. El método para detectar una falla en un bus externo de acuerdo con la reivindicación 1,
4. Sistema de procesamiento de información según la reivindicación 1, en el que el área de memoria predeterminada del dispositivo de sistema en espera es un área dentro o adyacente a una base de datos que contiene una base de datos gestionada por el dispositivo activo. Del método de detección de fallas de bus externo.
Dibujo :
Application number :1996-320835
Inventors :日本電気株式会社
Original Assignee :関根康治