Sistema de mantenimiento de la CPU
Descripción general
 Mida el tiempo de funcionamiento de la CPU directamente para que pueda calcular el tiempo de falla promedio preciso y el tiempo de inactividad promedio del sistema. La presente invención tiene una CPU ay un procesador de servicio b para realizar su operación de mantenimiento, y la CPU a está provista de un medio de notificación 1 para notificar al procesador de servicio b de un cambio en su estado operativo. El procesador de servicio b está provisto de un contador 5 para acumular y contar el tiempo durante el cual está funcionando la CPU a y un medio de control de contador 4 para hacer que el contador 5 comience y pare de contar en respuesta a la notificación del cambio en el estado operativo .
Campo técnico
Campo técnico La presente invención se refiere a un sistema de mantenimiento de CPU que tiene una CPU y un procesador de servicio para realizar su operación de mantenimiento y más particularmente a un sistema de mantenimiento de CPU para medir y registrar el tiempo de funcionamiento, información de fallo generada en una CPU y similares.
Antecedentes de la técnica
Es efectivo saber la próxima vez como una medida de la confiabilidad de la CPU (Unidad Central de Procesamiento) utilizada en el sistema informático.
Tiempo medio entre fallas (Tiempo medio entre fallas), que es el promedio del tiempo durante el cual no se produce un mal funcionamiento ya que la CPU falla hasta que ocurre la siguiente falla.
Tiempo medio entre el sistema inactivo (tiempo medio entre el sistema inactivo) que es el promedio del tiempo de inactividad después de que el sistema se apaga hasta que se produce el siguiente sistema inactivo.
Mientras tanto, en el sistema convencional, dado que no existía un método para medir directamente y monitorear el estado operativo / no operativo de la CPU, el procesador de servicio conectado a la CPU mide el tiempo de operación del procesador de servicio mismo. Y calcula el intervalo de falla promedio y el intervalo promedio de inactividad del sistema en el supuesto de que coincida con el tiempo de operación de la CPU.
Tarea de solución
Sin embargo, dado que el estado operativo / no operativo del procesador de servicio no coincide necesariamente con el estado operativo / no operativo de la CPU, existe la desventaja de que es imposible conocer con precisión el intervalo de fallas promedio real de la CPU y el intervalo promedio de inactividad del sistema Lo fue
Sumario de la invención Por lo tanto, un objeto de la presente invención es proporcionar un sistema de mantenimiento de la CPU capaz de medir directamente el tiempo de funcionamiento de una CPU y calcular un intervalo de fallas promedio preciso y un intervalo promedio de bajada del sistema.
Solución
La presente invención tiene una CPU ay un procesador de servicio b para realizar su operación de mantenimiento, y la CPU a está provista de un medio de notificación 1 para notificar al procesador de servicio b de un cambio en su estado operativo.
El procesador de servicio b está provisto de un contador 5 para acumular y contar el tiempo durante el cual está funcionando la CPU a y un medio de control de contador 4 para hacer que el contador 5 comience y pare de contar en respuesta a la notificación del cambio en el estado operativo .
El cambio en el estado de operación es cuando la CPU a comienza a operar y detiene la operación, y el medio de control de contador 4 comienza a contar el contador 5 cuando recibe una notificación que indica que la operación ha comenzado, Y detiene el conteo del contador 5 cuando recibe una notificación que indica que la operación se ha detenido.
Además, el procesador de servicio b está provisto de una sección de registro de registro 7, una función de leer la información de fallo cuando se produce un fallo en la CPU a, detener el conteo del contador 5 y detener el conteo del contador 5. Y una unidad de procesamiento de fallos 6 para registrar el valor de recuento en la unidad de registro de registro 7.
El funcionamiento de la presente invención es el siguiente. Cuando se activa la CPU, la CPU notifica al procesador de servicio sobre el cambio en el estado operativo de la CPU. Mediante esta notificación, el medio de control de contador se inicia y deja de contar el tiempo durante el cual se está ejecutando la CPU.
Además, si hay una notificación que indica que la operación ha comenzado como un cambio en el estado operativo en los medios de control del contador, se inicia el recuento del contador. Además, si hay una notificación que indica que la operación se ha detenido como un cambio en el estado operativo en los medios de control del contador, el conteo del contador se detiene.
Cuando ocurre una falla en la CPU, la información de falla es leída desde la CPU por los medios de procesamiento de fallas y se detiene el recuento del contador. La información de falla y el valor de conteo del contador se registran en la unidad de registro de registro.
Las realizaciones de la presente invención se describirán con referencia a los dibujos. La figura 1 es un diagrama de bloques que muestra una configuración de un sistema de mantenimiento de la CPU como una realización de la presente invención, y las figuras 2 y 3 son diagramas de funcionamiento que muestran los estados de funcionamiento de la misma.
Este sistema tiene una CPU a y un procesador de servicio (SVP) b conectado a la CPU a a través de una pluralidad de interfaces requeridas, y este procesador de servicio b emite una operación del sistema y una operación de mantenimiento Y así sucesivamente.
En la CPU a, se proporciona un medio de notificación 1 para notificar al procesador de servicio b de un cambio en el estado operativo de la CPU a. Los medios de notificación 1 comprenden un registro de instrucciones 2 para almacenar instrucciones que serán ejecutadas secuencialmente por la CPU ay un decodificador 3 para instrucciones de descodificación emitidas desde el registro de instrucciones 2.
El procesador de servicio b está provisto de un circuito de control 4, un contador 5, una unidad de procesamiento de fallos 6 y una unidad de registro de registros 7.
En la instrucción del registro de instrucciones 2, se prepara un comando dedicado para iniciar o detener el recuento por el contador 5 en el procesador de servicio b.
Un comando de inicio para comenzar a contar se emite durante el procesamiento del software para activar CPUa. Una señal de inicio correspondiente a la salida del comando de inicio desde el decodificador 3 se introduce en el circuito de control 4 en el procesador de servicio b a través de la interfaz.
Es decir, al enviar esta señal de inicio al procesador de servicio b, se informa que la CPU a se ha desplazado del estado de detención de operación al estado de operación, es decir, que la CPU comenzó a funcionar.
Además, la instrucción de detención para detener el conteo se emite durante el procesamiento del software para detener el funcionamiento de la CPU a. Una señal de parada correspondiente a la salida del comando de parada desde el decodificador 3 se introduce en el circuito de control 4 a través de la interfaz.
Es decir, al enviar esta señal de parada al procesador de servicio b, significa que la CPU a se ha desplazado del estado operativo al estado de operación detenida, es decir, al hecho de que el funcionamiento de la CPU a se ha detenido.
El circuito de control 4 en el procesador de servicio b tiene una función como medio de control de recuento para hacer que el contador 5 se inicie y pare de contar en respuesta a la notificación del cambio en el estado de funcionamiento. Específicamente, cuando se introduce una señal de inicio desde la CPU a, emite una señal de inicio de conteo al contador 5, y al recibir una señal de parada de la CPU a, emite una señal de conteo de conteo al contador 5 .
El contador 5 cuenta de forma acumulativa el tiempo durante el cual la CPU a está funcionando, por ejemplo, para cada unidad de hora, comienza a contar de acuerdo con la señal de inicio de conteo emitida desde el circuito de control 4, y basándose en la señal de conteo de conteo Y deja de contar
La unidad de proceso de fallo 6 lee la información de fallo cuando se produce un fallo en la CPU a, detiene el conteo del contador 5 y almacena la información de fallo y el valor de conteo en el momento de detenerse en la unidad de registro de registro 7 Como se muestra en la FIG.
En la unidad de registro de registro 7, se almacena un archivo de registro 8. El archivo de registro 8 se utiliza principalmente para dejar información sobre la aparición de una anomalía en la CPUa como un historial, en el que toda la información de problemas se produjo en la CPU a y el valor de recuento se registran en asociación entre sí. Se supone que es. Por lo tanto, al analizar la información de registro de este archivo de registro 8, es posible especificar una ubicación de falla o similar de la CPU a.
El funcionamiento del presente sistema que tiene la configuración anterior se describirá por separado cuando el cambio en el estado operativo se notifique al procesador de servicio b (figura 2) y cuando se produzca un fallo en la CPU a (figura 3).
Cuando se ejecuta el software para iniciar la CPU a, una instrucción de inicio que indica que la CPU a ha comenzado a funcionar se almacena en el registro de instrucciones 2 de la CPU a durante este procesamiento .
Esta instrucción de inicio es decodificada por el decodificador 3 y luego emitida como una señal de inicio al procesador de servicio b a través de la interfaz. Tras la entrada de esta señal de inicio, el circuito de control 4 hace que el contador 5 empiece a contar el tiempo acumulativo del estado operativo de la CPU a.
Cuando se ejecuta el software para detener la CPU a, se almacena una instrucción de detención que indica que la CPU a ha dejado de funcionar en el registro de instrucciones 2 de la CPU a durante este procesamiento.
Esta instrucción de detención es decodificada por el decodificador 3 y luego emitida como una señal de inicio al procesador de servicio b a través de la interfaz. Mediante la entrada de esta señal de parada, el circuito de control 4 deja de contar por el contador 5.
Cuando ocurre una falla en la CPUa, la información de falla de la CPU a se notifica a la unidad de función de procesamiento de fallas 6 en el procesador de servicio b a través de la interfaz.
La unidad de función de procesamiento de fallos 6 lee la información de fallo de la CPU a como un procesamiento de fallo de la CPU y deja de contar el tiempo acumulativo del estado de funcionamiento por el contador 5. La información de falla y el valor de conteo del contador se registran en el archivo de registro 8 en la unidad de registro de registro 7.
Debe observarse que la presente invención no está limitada a las realizaciones descritas anteriormente, y son posibles diversas modificaciones dentro del alcance de la esencia de la misma.
Efecto de la invención
De acuerdo con la invención de la reivindicación 13, dado que el tiempo de funcionamiento de la CPU se puede medir directamente, es posible calcular un intervalo de fallas promedio preciso y un intervalo de bajada promedio del sistema.
De acuerdo con el tercer aspecto de la presente invención, dado que el tiempo acumulado del funcionamiento de la CPU puede grabarse junto con la información de fallo hasta que se produce el fallo, es posible conocer el tiempo de funcionamiento hasta que se produce la falla, Es posible conocer el intervalo de falla promedio y el intervalo promedio de inactividad del sistema. Además, dado que la información de falla se puede registrar en la unidad de registro de registro, también es posible especificar la ubicación de la falla a partir de la información de falla.
La figura 1 es un diagrama de bloques que muestra una configuración de un sistema de mantenimiento de CPU de la presente invención.
La figura 2 muestra la operación, y es un diagrama que muestra la operación cuando la CPU notifica al procesador de servicio el cambio del estado de operación.
La figura 3 muestra su funcionamiento, y es un diagrama que muestra una operación cuando se produce un fallo en la CPU.
1 Medios de notificación
4 Medios de control del contador (circuito de control)
5 contador
6 Medios de procesamiento de fallas (sección de función de procesamiento de fallas)
7 Unidad de registro de registro
una CPU
b Procesador de servicio
Reclamo
Reivindicaciones: 1. Un sistema de mantenimiento de CPU que tiene una CPU y un procesador de servicio para realizar su operación de mantenimiento, que comprende: un medio de notificación para notificar a dicha CPU de un cambio en su estado operativo a dicha CPU y una CPU para operar el procesador de servicio Y un control de contador significa hacer que el contador se inicie y pare de contar de acuerdo con la notificación del cambio en el estado operativo.
2. Método según la reivindicación 1, en el que el cambio en el estado operativo es cuando la CPU comienza a funcionar y cuando se detiene la operación, y los medios de control de contador hacen que el contador empiece a contar cuando recibe una notificación que indica que la operación se ha iniciado. 2. El sistema de mantenimiento de CPU de acuerdo con la reivindicación 1, en el que el contador deja de contar cuando se recibe una notificación que indica que se detiene la operación.
3. El aparato de procesamiento de información según la reivindicación 3, donde cuando ocurre una falla en la CPU, se lee la información de falla y se detiene el conteo del contador, y el valor de conteo del contador detenido se registra en la unidad de registro junto con la información de falla Y se proporcionan medios de procesamiento de fallas en el procesador de servicio.
Dibujo :
Application number :1997-016442
Inventors :日本電気株式会社
Original Assignee :中島義博