Categorías: Actualidad

Cómo detectar anomalías en un CPD antes de que sea un problema: un caso práctico de inteligencia artificial

Una de las grandes paradojas de los centros de procesamiento de datos (CPD) es que su capacidad para mantenerse en funcionamiento a pesar de fallos parciales puede jugar en contra a la hora de detectar pequeñas anomalías.

Cuando todo parece estar bajo control, es fácil que pasen desapercibidas señales sutiles de que algo empieza a ir mal. Especialmente en entornos con sistemas redundantes, donde si falla un componente, otro asume su función sin que nadie lo note… hasta que la anomalía crece y afecta al conjunto.

Este es el punto de partida de un proyecto que hemos abordado recientemente y que compartimos aquí por su valor como caso práctico: cómo aplicar inteligencia artificial para detectar fallos antes de que los sistemas lo noten y antes de que haya consecuencias.

Configura tu solución de ciberseguridad

Un entorno complejo y muchas señales que se tapan entre sí

El reto inicial estaba en el propio diseño del CPD: múltiples equipos de refrigeración, compresores duplicados, sensores por toda la sala, cuadros eléctricos independientes… Todo configurado para garantizar temperatura y humedad estables las 24 horas.

El problema no era la falta de control, sino el exceso de señales sin contexto. Las alarmas saltaban, pero de forma dispersa y sin indicar con claridad si había un problema real o un comportamiento esperable del sistema. Un compresor podía dejar de funcionar y pasar inadvertido porque el de respaldo asumía la carga.

Detrás de esa aparente normalidad, podía haber un fallo progresivo. La pregunta era: ¿cómo verlo antes de que escale?

La clave: analizar lo que no parece urgente (todavía)

Lo primero fue recopilar y estructurar todas las variables posibles:

Datos de consumo eléctrico por cuadro
Lecturas de temperatura y humedad en diferentes puntos
Estado y régimen de funcionamiento de ventiladores y compresores
Parámetros técnicos de cada máquina, incluso los menos evidentes

Una vez normalizados esos datos, se trabajó en un modelo que no buscara fallos explícitos, sino comportamientos atípicos en relación con su histórico o con otras variables correlacionadas.

Por ejemplo, si dos compresores deberían funcionar en paralelo y uno empieza a desviarse en consumo, sin motivo aparente, el sistema lanza un aviso. No una alarma genérica, sino una alerta basada en el conocimiento acumulado.

Dale forma a tu plan de ciberseguridad

Inteligencia artificial con criterio (y con personas detrás)

El sistema no sustituye al equipo técnico. Lo que hace es reducir el ruido y señalar dónde conviene mirar. Gracias al entrenamiento del algoritmo, las alertas se vuelven más precisas, y las revisiones más efectivas.

Esto se traduce en menos tiempo invertido en revisar variables sin importancia y más foco en posibles anomalías reales, aunque aún no críticas. Así, el mantenimiento preventivo se vuelve más inteligente, y las decisiones más informadas.

Además, permite generar informes semanales con información accionable, sin necesidad de revisar manualmente miles de registros.

Una lección para todas las organizaciones

Este proyecto no se apoyó en una solución externa compleja, sino en el conocimiento del equipo, los datos existentes y una necesidad concreta. A veces, la innovación tecnológica no consiste en desplegar grandes infraestructuras, sino en hacer buen uso de lo que ya se tiene.

Como nos decía una de las personas responsables del desarrollo:

“No se trata de volverse loco con la inteligencia artificial. Se trata de empezar por donde conoces: tu entorno, tus datos, tus retos. Si tú no aprovechas ese conocimiento, alguien más lo hará antes”.

¿Te suena este tipo de situación?

Solicita una propuesta de ciberseguridad a medida

Este post se ha redactado a partir de la entrevista a Santiago Mercado, Director de Sistemas en Sarenet.

Redacción Sarenet

Siguiente DESPACE: la plataforma visual para construir espacios de datos sin complicaciones »

Anterior « Accede a datos de calidad en segundos: Elimina barreras con DESPACE

Publicado por

Redacción Sarenet

Etiquetas: cpdDetección de anomalíasinteligencia artificialmachine learningtransformación digital

Hace 3 meses

¿Cómo medir la huella de carbono en la industria sin perder competitividad?
La sostenibilidad ha pasado de ser una declaración de intenciones a convertirse en una exigencia…
Espacios de datos: una pieza clave para la sostenibilidad industrial
La sostenibilidad ya no es un plus. Es un requisito. La industria lo sabe y…
Un asistente de IA para consultar documentos con facilidad
En un momento en el que la inteligencia artificial está transformando el tejido productivo, hay…