El mantenimiento centrado en Confiabilidad (MCC), o Reliability-centred Maintenance (RCM), ha sido desarrollado para la industria de la aviación civil hace más de 30 años.
El proceso permite determinar cuáles son las tareas de mantenimiento adecuadas para cualquier activo físico.
El RCM ha sido utilizado en miles de empresas de todo el mundo: desde grandes empresas petroquímicas hasta las principales fuerzas armadas del mundo utilizan RCM para determinar las tareas de mantenimiento de sus equipos, incluyendo la gran minería, generación eléctrica, petróleo y derivados, metal-mecánica, etc. La norma SAE JA1011 especifica los requerimientos que debe cumplir un proceso para poder ser denominado un proceso RCM. La misma puede descargarse a través del portal de la SAE (www.sae.org).
Según esta norma, las 7 preguntas básicas del proceso RCM son:
1. ¿Cuáles son las funciones deseadas para el equipo que se está analizando?
2. ¿Cuáles son los estados de falla (fallas fucionales) asociados con estas funciones?
3. ¿Cuáles son las posibles causas de cada uno de estos estados de falla?
4. ¿Cuáles son los efectos de cada una de estas fallas?
5. ¿Cuál es la consecuencia de cada falla?
6. ¿Qué puede hacerse para predecir o prevenir la falla?
7. ¿Qué hacer si no puede encontrarse una tarea predictiva o preventiva
2 Conceptos del RCM
El RCM muestra que muchas de los conceptos del mantenimiento que se consideraban correctos son realmente equivocados. En muchos casos, estos conceptos pueden ser hasta peligrosos. Por ejemplo, la idea de que la mayoría de las fallas se producen cuando el equipo envejece ha demostrado ser falsa para la gran mayoría de los equipos industriales. A continuación se explican varios conceptos derivados del Mantenimiento Centrado en Confiabilidad, muchos de los cuales aún no son completamente entendidos por los profesionales del mantenimiento industrial.
2.1 El contexto operacional
Antes de comenzar a redactar las funciones deseadas para el activo que se está analizando (primera pregunta del RCM), se debe tener un claro entendimiento del contexto en el que funciona el equipo. Por ejemplo, dos activos idénticos operando en distintas plantas, pueden resultar en planes de mantenimiento totalmente distintos si sus contextos de operación son diferentes. Un caso típico es el de un sistema de reserva, que suele requerir tareas de mantenimiento muy distintas a las de un sistema principal, a ´un cuando ambos sistemas sean físicamente idénticos. Entonces, antes de comenzar el análisis se debe redactar el contexto operacional, breve descripción (2 ó 3 carillas) donde se debe indicar: régimen de operación del equipo, disponibilidad de mano de obra y repuestos, consecuencias de indisponibilidad del equipo (producción perdida o reducida, recuperación de producción en horas extra, tercerización ), objetivos de calidad, seguridad y medio ambiente, etc.
2.2 Funciones
El análisis de RCM comienza con la redacción de las funciones deseadas. Por ejemplo, la función de una bomba puede definirse como ”Bombear no menos de 500 litros/ minuto de agua”. Sin embargo, la bomba puede tener otras funciones asociadas, como por ejemplo ”Contener al agua (evitar pérdidas)”. En un análisis de RCM, todas las funciones deseadas deben ser listadas.
2.3 Fallas funcionales o estados de falla
Las fallas funcionales ó estados de falla identifican todos los estados indeseables del sistema. Por ejemplo, para una bomba dos estados de falla podrían ser ”Incapaz de bombear agua”, ”Bombea menos de 500 litros/minuto”, ”No es capaz de contener el agua”. Notar que los estados de falla están directamente relacionados con las funciones deseadas. Una vez identificadas todas las funciones deseadas de un activo, identificar las fallas funcionales es un problema trivial.
2.4 Modos de falla
Un modo de falla es una posible causa por la cual un equipo puede llegar a un estado de falla.
Por ejemplo, ”impulsor desgastado” es un modo de falla que hace que una bomba llegue al estado de falla identificado por la falla funcional ”bombea menos de lo requerido”. Cada falla funcional suele tener más de un modo de falla. Todos los modos de falla asociados a cada falla funcional deben ser identificados durante el análisis de RCM.
Al identificar los modos de falla de un equipo o sistema, es importante listar la
”Causa raíz” de la falla. Por ejemplo, si se están analizando los modos de falla de los rodamientos de una bomba, es incorrecto* listar el modo de falla ”falla rodamiento”.
La razón es que el modo de falla listado no da una idea precisa de por qué ocurre la falla. Es por ”falta de lubricación”? Es por ”desgaste y uso normal”? Es por ”instalación inadecuada”? Notar que este desglose en las causas que subyacen a la falla si da una idea precisa de por qué ocurre la falla, y por consiguiente que podría hacerse para manejarla adecuadamente (lubricación, análisis de vibraciones, etc.). (*en algunos casos, sí puede ser adecuado listar el modo de falla como ”falla rodamiento”, Según el contexto en el que trabaje el activo)es importante conocer bien el contexto operacional).
2.5 Los efectos de falla
Para cada modo de falla deben indicarse los efectos de falla asociados. El ”efecto de falla” es un breve descripción de ”qué pasa cuando la falla ocurre”. Por ejemplo, el efecto de falla asociado con el modo de falla ”impulsor desgastado” podría ser el siguiente:
”a medida que el impulsor se desgasta, baja el nivel del tanque, hasta que suena la alarma de bajo nivel en la sala de control. El tiempo necesario para detectar y reparar la falla (cambiar impulsor) suele ser de 6 horas. Dado que el tanque se vacia luego de 4 horas, el proceso aguas abajo debe detenerse durante dos horas. No es posible recuperar la producción perdida, por lo que estas dos horas de parada representan un pérdida de ventas”. Los efectos de falla deben indicar claramente cuál es la importancia que tendría la falla en caso de producirse.
2.6 Categoría de consecuencias
La falla de un equipo puede afectar a sus usuarios de distintas formas:
_ Poniendo en riesgo la seguridad de las personas ”consecuencias de seguridad”)
_ Afectando al medio ambiente (”consecuencias de medio ambiente”)
_ Incrementando los costos o reduciendo el beneficio económico de la empresa
(”consecuencias operacionales”)
_ Ninguna de las anteriores (”consecuencias no operacionales”)
Ademas, existe una quinta categoria de consecuencias, para aquellas fallas que no tienen ning ´un impacto cuando ocurren salvo que posteriormente ocurra alguna otra falla. Por ejemplo, la falla del neumático de auxilio no tiene ninguna consecuencia adversa salvo que ocurra una falla posterior (pinchadura de un neumático de servicio) que haga que sea necesario cambiar el neumático. Estas fallas corresponden a la categoria de fallas ocultas.
Cada modo de falla identificado en el análisis de RCM debe ser clasificado en una de estas categorías. El orden en el que se evaluan las consecuencias es el siguiente: seguridad, medio ambiente, operacionales, y no operacionales, previa separación entre fallas evidentes y ocultas. El análisis RCM bifurca en esta etapa: el tratamiento que se la va a dar a cada modo de falla va a depender de la categoría de consecuencias en la que se haya clasificado, lo que es bastante razonable: no sería lógico tratar de la misma forma a fallas que pueden afectar la seguridad que aquellas que tienen consecuencias económicas. El criterio a seguir para evaluar tareas de mantenimiento es distinto si las consecuencias de falla son distintas.
2.7 Diferencia entre efectos y consecuencias de falla
El efecto de falla es una descripción de qué pasa cuando la falla ocurre, mientras que la consecuencia de falla clasifica este efecto en una de 5 categorías, seg ´un el impacto que estas fallas tienen.
2.8 Diferencia entre falla funcional y modos de falla
La falla funcional identifica un estado de falla: incapaz de bombear, incapaz de cortar la pieza, incapaz de sostener el peso de la estructura… No dice nada acerca de las causas por las cuales el equipo llega a ese estado. Eso es justamente lo que se busca con los modos de falla: identificar las causas de esos estados de fallas (eje cortado por fatiga, filtro tapado por suciedad, etc.).
2.9 Fallas ocultas
Los equipos suelen tener dispositivos de protección, es decir, dispositivos cuya función principal es la de reducir las consecuencias de otras fallas (fusibles, detectores de humo, dispositivos de detención por sobre velocidad / temperatura / presión, etc.).
Muchos de estos dispositivos tienen la particularidad de que pueden estar en estado de falla durante mucho tiempo sin que nadie ni nada ponga en evidencia que la falla ha ocurrido. (Por ejemplo, un extintor contra incendios puede ser hoy incapaz de apagar un incendio, y esto puede pasar totalmente desapercibido (si no ocurre el incendio).
Una válvula de alivio de presión en una caldera puede fallar de tal forma que no es capaz de aliviar la presión si esta excede la presión máxima, y esto puede pasar totalmente desapercibido (si no ocurre la falla que hace que la presión supere la presión máxima).) Si no se hace ninguna tarea de mantenimiento para anticiparse a la falla ó para ver si estos dispositivos son capaces de brindar la protección requerida, entonces puede ser que la falla solo se vuelva evidente cuando ocurra aquella otra falla cuyas consecuencias el dispositivo de protección esta para aliviar. (Por ejemplo, es posible que nos demos cuenta que no funciona el extintor recién cuando ocurra un incendio, pero entonces ya es tarde: se produjo el incendio fuera de control. Es posible que nos demos cuenta que no funciona la válvula de seguridad recién cuando se eleve la presión y ésta no actúe, pero también ya es tarde: se produjo la explosión de la caldera.) Este tipo de fallas se denominan fallas ocultas, dado que requieren de otra falla para volverse evidentes.
2.10 Distintos tipos de mantenimiento
Tradicionalmente, se consideraba que existian tres tipos de mantenimiento distintos: predictivo, preventivo, y correctivo. Sin embargo, existen cuatro tipos de mantenimiento distintos:
_ Mantenimiento predictivo, también llamado mantenimiento a condición.
_ Mantenimiento preventivo, que puede ser de dos tipos: sustitución o reacondicionamiento cíclico.
_ Mantenimiento correctivo, también llamado trabajo a la falla.
_ Mantenimiento detectivo ó ”búsqueda de fallas”.
2.11 El mantenimiento predictivo o a condición
El mantenimiento predictivo o mantenimiento a condición consiste en la búsqueda de indicios o síntomas que permitan identificar una falla antes de que ocurra. Por ejemplo, la inspección visual de el grado de desgaste de un neumático es una tarea de mantenimiento predicitvo, dado que permite identificar el proceso de falla antes de que la falla funcional ocurra. Estas tareas incluyen: inspecciones (ej. inspección visual del grado de desgaste), monitoreos (ej. vibraciones, ultrasonido), chequeos (ej. nivel de aceite). Tienen en com´un que la decisión de realizar o no una acción correctiva depende de la condición medida. Por ejemplo, a partir de la medición de vibraciones de un equipo puede decidirse cambiarlo o no. Para que pueda evaluarse la conveniencia de estas tareas, debe necesariamente existir una clara condición de falla potencial. Es decir, deben haber síntomas claros de que la falla está en el proceso de ocurrir.
2.12 El mantenimiento preventivo (sustitución o reacondicionamiento cíclico)
El mantenimiento preventivo se refiere a aquellas tareas de sustitución o retrabajo hechas a intervalos fijos independientemente del estado del elemento o componente.
Estas tareas solo son válidas si existe un patrón de desgaste: es decir, si la probabilidad de falla aumenta rapidamente desp úes de superada la vida útil del elemento. Debe tenerse mucho cuidado, al momento seleccionar una tarea preventiva (o cualquier otra tarea de mantenimiento, de hecho), en no confudir una tarea que se puede hacer, con una tarea que conviene hacer. Por ejemplo, al evaluar el plan de mantenimiento a realizar sobre el impulsor de una turbina, podriamos decidir realizar una tarea preventiva (sustitución cíclica del impulsor), tarea que en general se puede hacer dado que la falla generalmente responde a un patrón de desgaste (patrón B de los 6 patrones de falla del RCM). Sin embargo, en ciertos casos podría convenir realizar alguna tarea predictiva (tarea a condición), que en muchos casos son menos invasivas y menos costosas.
2.13 El mantenimiento correctivo o trabajo a la rotura
Si se decide que no se hará ninguna tarea proactiva (predictiva o preventiva) para manejar una falla, sino que se reparará la misma una vez que ocurra, entonces el mantenimiento elegido es un mantenimiento correctivo. ¿Cuándo conviene este tipo de mantenimiento? Cuando el costo de la falla (directos indirectos) es menor que el costo de la prevención, ó cuando no puede hacerse ning ´una tarea proactiva y no se justifica realizar un redise ˜no del equipo. Esta opción solo es válida en caso que la falla no tenga consecuencias sobre la seguridad o el medio ambiente. Caso contrario, es obligatorio hacer algo para reducir o eliminar las consecuencias de la falla.
2.14 El mantenimiento detectivo o de búsqueda de fallas
El mantenimiento detectivo o de búsqueda de fallas consiste en la prueba de dispositivos de protección bajo condiciones controladas, para asegurarse que estos dispositivos serán capaces de brindar la protección requerida cuando sean necesarios. En el mantenimiento detectivo no se está repararando un elemento que falló (mantenimiento correctivo), no se está cambiando ni reacondicionando un elemento antes de su vida útil (mantenimiento preventivo), ni se están buscando síntomas de que una falla está en el proceso de ocurrir (mantenimiento predictivo). Por lo tanto, el mantenimiento detectivo es un cuarto tipo de mantenimiento. A este mantenimiento también se lo llama búsqueda de fallas o prueba funcional, y al intervalo cada el cual se realiza esta tarea se lo llama intervalo de búsqueda de fallas, o FFI, por sus siglas en inglés (Failure-Finding Interval). Por ejemplo, arrojar humo a un detector contra incendios es una tarea de mantenimiento detectivo.
2.15 ¿Cómo seleccionar el tipo de mantenimiento adecuado?
En el RCM, la selecci ón de políticas de mantenimiento está gobernada por la categoría de consecuencias a la que pertence la falla.
_ Para fallas con consecuencias ocultas, la tarea óptima es aquella que consigue la disponibilidad requerida del dispositivo de protección.
_ Para fallas con consecuencias de seguridad o medio ambiente, la tarea óptima es aquella que consigue reducir la probabilidad de la falla hasta un nivel tolerable.
_ Para fallas con consecuencias económicas (operacionales y no operacionales), la tarea óptima es aquella que minimiza los costos totales para la organización.
A´un hoy, mucha gente piensa en el mantenimiento preventivo como la principal opción al mantenimiento correctivo. Sin embargo, el RCM muestra que en el promedio de las industrias el mantenimiento preventivo es la estrategia adecuada para menos del 5% de las fallas!. Qué hacer con el otro 95 % ? En promedio, al realizar un análisis RCM se ve que las políticas de mantenimiento se distribuyen de la siguiente forma: 30% de las fallas manejadas por mantenimiento predictivo (a condición), otro 30% por mantenimiento detectivo, alrededor de 5% mediante mantenimiento preventivo, 5% de redise ˜ nos, y aproximadamente 30% mantenimiento correctivo. Esto muestra efectivamente que una de las máximas del TPM (Total Productive Maintenance) que dice que ”todas las fallas son malas y todas deben ser prevenidas”, es de hecho equivocada: solo deben ser prevenidas aquellas que convenga prevenir, en base a un cuidadoso análisis costo-beneficio.
2.16 Frecuencia de tareas a condición (mantenimiento predictivo)
Para que una tarea a condición sea posible, debe existir alguna condición física identificable que anticipe la ocurrencia de la falla. Por ejemplo, una inspección visual de un elemento solo tiene sentido si existe alg ´un síntoma de falla que pueda detectarse visualmente. Además de existir un claro síntoma de falla, el tiempo desde el síntoma hasta la falla funcional debe ser suficientemente largo para ser de utilidad. La frecuencia de una tarea a condición se determina entonces en función del tiempo que pasa entre el síntoma y la falla. Por ejemplo, si se está evaluando la conveniencia de chequear ruido en los rodamientos de un motor, entonces la frecuencia va a estar determinada por el tiempo entre que el ruido es detectable, y que se produce la falla del rodamiento. Si este tiempo es de, por ejemplo, dos semanas, entonces la tarea debe hacerse a una frecuencia menor, para asegurarse de esta forma que la falla no ocurra en el tiempo entre chequeos sucesivos. El mismo razonamiento debe seguirse para cualquier tarea predictiva.
2.17 Frecuencia de tareas de sustitución cíclica (mantenimiento preventivo)
Una tarea de sustitución cíclica solo es válida si existe un patrón de desgaste. Es decir, si existe ”una edad en la que aumenta rápidamente la probabilidad condicional de la falla”. La frecuencia de la tarea de sustitución depende de esta edad, llamada vida útil. Por ejemplo, si la vida útil de un neumático es de 40.000 km, entonces la tarea de sustitución cíclica (cambio preventivo del neumático) debería realizarse cada menos de 40.000 km, para de esta forma evitar entrar en la zona de alta probabilidad de falla.
2.18 Frecuencia de tareas detectivas (búsqueda de fallas)
El intervalo con el que se realiza la tarea de búsqueda de fallas (mantenimiento detectivo) se denomina FFI (Failure Finding Interval). Existe una relaci ón entre este intervalo y la disponibilidad del dispositivo de protecci ón. Pueden utilizarse herramientas matemáticas para calcular esta relación, y fijar el FFI que logre la disponibilidad objetivo.
2.19 El lugar del redise ˜no en el mantenimiento
Una empresa de rodamientos tenía la siguiente política: si una falla ocurría más de una vez, se redise ˜naba el equipo para eliminar la causa de la falla. Como consecuencia de esta política, la planta funcionaba de manera cada vez más confiable, pero los costos del departamento de ingeniería crecían aceleradamente. Como ilustra este ejemplo, en la mayoría de las empresas las sugerencias de cambios de dise ˜no suelen sobrepasar la capacidad de la empresa de llevar adelante estos cambios. Por lo tanto, debe existir un filtro que permita distinguir aquellos casos donde el redise ˜no es justificado y recomendable de aquellos casos donde no lo es. Es por esto que para aquellos cambios de dise ˜no cuyo objetivo es evitar fallas, suele ser más conveniente evaluar previamente si existe alguna otra forma de manejar las fallas sin necesidad de recurrir al cambio de dise ˜ no. Por ejemplo, algunos a˜nos despues la empresa de rodamientos se dio cuenta que solo en el 20% de los redise ˜nos realizados éste realmente valía la pena, y que para el resto había otras formas de manejar las fallas que eran más costo-eficaces. Debe también tenerse en cuenta que los cambios de dise ˜no suelen llevar tiempo y ser costosos, y que no siempre se sabe con certeza si los mismos serán eficaces en aliviar las consecuencias de las fallas. A su vez, en muchos casos los redise ˜nos introducen otras falla cuyas consecuencias también deben ser evaluadas. Es por todo esto que generalmente el redise ˜no debe ser seleccionado como última opción.
2.20 Patrones de falla en función del tiempo
¿Cuál es la relación entre la probabilidad de falla y el tiempo? Tradicionalmente se pensaba que la relación era bien simple: a medida que el equipo es más viejo, es más probable que falle. Sin embargo, estudios realizados en distintos industrias muestran que la relación entre la probabilidad de falla y el tiempo u horas de operación es mucho más compleja. No existen uno o dos patrones de falla, sino que existen 6 patrones de falla distintos, como se muestra en el informe original de Nowlan & Heap (Figura 1).
La figura muestra los 6 patrones de falla. Cada patrón representa la probabilidad de falla en función del tiempo.
_ Un patrón A, donde la falla tiene alta probabilidad de ocurrir al poco tiempo de su puesta en servicio (mortalidad infantil), y al superar una vida útil identificable.
_ Patrón B, o ”curva de desgaste”.
Figure 1: Los 6 patrones de falla
_ Patrón C, donde se ve un continuo incremento en la probabilidad condicional de la falla.
_ Patrón D, donde superada una etapa inicial de aumento de la probabilidad de falla el elemento entra en una zona de probabilidad condicional de falla constante.
_ Patrón E, o patrón de falla aleatorio.
_ Patrón F, con una alta probabilidad de falla cuando el equipo es nuevo seguido de una probabilidad condicional de falla constante y aleatoria.
3 Beneficios del RCM
La implementación del RCM debe llevar a equipos mías seguros y confiables, reducciones de costos (directos e indirectos), mejora en la calidad del producto, y mayor cumplimiento de las normas de seguridad y medio ambiente. El RCM también está asociado a beneficios humanos, como mejora en la relación entre distintas áreas de la empresa, fundamentalmente un mejor entendimiento entre mantenimiento y operaciones.