¿Machaca el S.O. de QNap los SSD dañando sectores o generando bloques defectuosos?
#7
Hola compañeros,

Ya pude solucionar el problema y quería compartir la información al respecto ya que nadie comentó nada ni sobre los problemas de sectores mal en SSD de sistema ni sobre cómo solventar el caos que provoca:

Sobre los sectores mal.

Finalmente el origen del problema no es de QNap, es decir, no se trata de que QTS machaque los SSD hasta provocar dañar sectores, sino que se debe a que los discos Samsung SSD 870 EVO fabricados en 2021 presentan este problema. No me han concretado lotes concretos a los que afecta ni si se extiende antes o después de 2021, pero son muy numerosos los casos y el fabricante ya cambió de chips de memoria NAND en este modelo (MZ-77E2T0) así como el firmware que lo gestiona.

Decir que Samsung no puso ninguna pega para atender la garantía de 5 años de estos discos, aunque en mi caso la solución fue más rápida acudiendo al vendedor al estar aún dentro de los 2 años de garantía que correspondía (ahora serían ya 3 con la nueva legislación).

Concretamente en mis dos discos afectados figuran serigrafiadas como fechas de fabricación 2021.04 y 2021.08, y los campos SMART que acaban mostrando valores anormales son los siguientes (en mensajes anteriores confundí el número del primero de ellos), que nombro según aparecen en QTS (ligeramente diferente en Samsung Magician):

   5 - Retired_Block_Count
   179 - Used_Rsvd_Blk_Cnt_Tot
   183 - Runtime_Bad_Block
   187 - Reported_Uncorrect_Error
   195 - ECC_On-The-Fly_Error

Los 3 primeros presentan el mismo valor correspondiente al número de bloques defectuosos, y los 2 últimos también aparecen con un valor común pero diferente a los anteriores.

Solución de problemas provocados.

He de decir que me sorprende y mucho lo mal que está resuelto el asunto por QNap, casi que resulta difícil hacerlo peor, y máxime cuando hablamos de un sistema de almacenamiento que se supone está orientado a la seguridad de los datos.

Pues bien, cuando el SSD detecta un sector malo lo sustituye por uno de repuesto quedando el disco en principio como nuevo, pero QTS ni se entera y lógicamente si contenía información afectará a la integridad del sistema de almacenamiento, lo que se traducirá en que fallarán las pruebas de bloques defectuosos y de estructura de ficheros.

QTS es incapaz de solucionar nada salvo indicar que si persiste el problema se cambie el disco, ¡Alucinante!, de manera que toca armarse de paciencia, dedicar tiempo y hacer a mano lo que no han hecho los desarrolladores de QNap.

En la mayoría de casos basta localizar los ficheros corruptos, tal vez sólo un par, y borrarlos para que las pruebas sean superadas y se puedan revertir las dificultades añadidas de QTS poniendo el sistema en sólo lectura, error, degradado, etc. Pero claro, para identificar esos ficheros habrá que copiar todo en otro lugar e ir anotando los nombres de los ficheros que fallen para luego buscarlos, ya que puede haber varios ficheros con igual nombre en carpetas diferentes, y proceder a eliminarlos, que puede que tampoco resulte fácil…

Si el número de sectores es mayor puede que afecte también a información relativa a las carpetas por lo que no bastará con eliminar los ficheros dañados sino que habrá que borrar las carpetas completas que los contengan. Imagino que en casos más graves lo mismo habrá que recurrir a borrarlo todo o formatear.

Ciertamente si nuestro SSD tiene bloques defectuosos, a pesar de que se hayan reemplazado por otros operativos, seguramente la mejor opción es cambiar el disco, pero conviene tener presente que el fabricante es quien determina los umbrales de los mencionados campos SMART para considerar que el disco es defectuoso en su conjunto y procede una sustitución por garantía, de manera que si por ejemplo aparecen 5 sectores mal lo darán por bueno, y podría darse el caso de que no aparezcan nuevos sectores defectuosos, de manera que no nos libraremos de sufrir las consecuencias de la mala programación de QNap.

QTS debería detectar cuándo se reemplazan bloques defectuosos del SSD, cosa que no hace a pesar de tenerle programada la prueba SMART, e igualmente debería identificar a qué afecta esos bloques, y no le costaría nada indicar los ficheros en cuestión, las carpetas en su caso o el volumen o volúmenes si así fuera.

En el caso de ficheros, ya que no se van a poder leer ya jamás, podría directamente eliminarlos y restablecer la integridad del sistema, dejando únicamente al usuario la reposición de los archivos desde backup, aunque igualmente podría ir un paso más allá y hacerlo directamente o preguntando cuando la versión de la copia de seguridad sea más antigua que los ficheros perdidos.

En fin, que vaya chapuza de seguridad nos proporciona QNap, o más bien vaya fantástica forma de fastidiar al usuario, que lleva a perder días completos haciendo pruebas de bloques y estructura de archivos que tardan horas para luego sencillamente informar de que no pudieron completarse…

No sé si en otras marcas de NAS ocurre lo mismo pues en las que pude probar no empleaba SSD, pero desde luego vaya un clamoroso SUSPENSO para QNap en materia de seguridad de los datos en sus dispositivos con QTS y SSD. Y con Samsung, aunque muy mal que no se advierta del problema y se sustituyan directamente todos los discos de los lotes afectados, al menos parece que lo ha solucionado con cierta celeridad y he de decir que no he tenido la menor incidencia de este tipo en otros SSD, incluyendo uno comprado en 2015, tal vez más antiguo pues no figura serigrafiada la fecha de fabricación, y que ha aguantado de todo y ahí sigue sin un solo sector defectuoso.

Espero que esta información pueda ser de utilidad a alguien y ojalá QNap se ponga las pilas porque de seguir así no será esta la marca a la que confíe mis datos ni la que recomiende a nadie.


Un saludo a todos.
  Responder


Mensajes en este tema
RE: ¿Machaca el S.O. de QNap los SSD dañando sectores o generando bloques defectuosos? - por Josus - 14-03-2023, 01:41 PM



Usuarios navegando en este tema: 1 invitado(s)