Fiabilité des disques durs : rapport Blackblaze du premier trimestre 2024

Backblaze, spécialiste du stockage cloud, réputé pour sa transparence en matière de données sur la fiabilité des disques, a récemment publié son dernier rapport sur les défaillances des disques durs.

 

Celui-ci fait écho, à un précédent rapport de septembre 2023 qui était, lui, consacré aux disques SSD. Vous pouvez retrouver notre article sur ce sujet en suivant ce lien.

 

Depuis plusieurs années, Backblaze nous offre des insights inestimables à travers ses statistiques détaillées sur les disques durs utilisés dans ses datacenters. Ces rapports sont particulièrement importants car ils fournissent des données basées sur l’analyse de centaines de milliers d’unités fonctionnant en continu, 24/7, permettant d’évaluer la fiabilité des disques dans un contexte professionnel et intensif.

 

Au premier trimestre 2024, Backblaze surveillait 279 572 disques durs répartis dans ses centres de données à travers le monde. Pour ce rapport, les disques ont été divisés en deux groupes : un groupe primaire de 278 656 disques répartis sur 29 modèles, et un groupe secondaire de 641 disques sur 27 modèles.

Les critères de sélection comprenaient le nombre de disques et de jours d’utilisation, garantissant la fiabilité des taux de défaillance annualisés calculés En fournissant ces statistiques, Backblaze poursuit sa mission consistant à offrir une visibilité sans précédent dans le domaine du stockage de données dans le cloud, permettant ainsi aux utilisateurs et aux experts de prendre des décisions éclairées quant au choix et à la gestion des disques durs dans leurs infrastructures.

Résultats principaux des taux de défaillance des disques durs pour le premier trimestres 2024

Ce dernier rapport de Backblaze nous fournit des informations détaillées sur la fiabilité des différents modèles et tailles de disques. Voici les points clés de ce rapport :

 

Baisse générale du taux de défaillance annualisé (AFR)

L’AFR (Annualized Failure Rate) pour le T1 2024 est de 1,41 %, on constate ainsi une baisse significative par rapport aux 1,53 % de la même période l’année dernière et aux 1,54 % du premier trimestre 2023. Cette diminution de l’AFR est en grande partie attribuable au remplacement des anciens disques de 4 To par des modèles plus récents et plus fiables. On peux imputer cette amélioration réjouissante aux progrès continuels faits par les fabricants dans l’amélioration de la conception et de la fiabilité de leurs produits.

Rapport Blackblaze T1 2024 AFR des disques durs
Défaillances des disques durs rapport Blackblaze premier trimestre 2024

Quelques observations sur le tableau des statistiques de fiabilité des disques durs

On peut déjà constater avec intérêt que trois disques durs Seagate n’ont eu aucune défaillance sur la période concernée, avec une mention spéciale pour le Seagate 6TB (ST6000DX000) un ancêtre qui après 106 mois de bons et loyaux services se paye encore le luxe de ne connaître aucune défaillance !

 

Il s’agit des modèles :

  • Seagate 16TB (ST16000NM002J) : aucune panne sur 42 133 jours de fonctionnement au T1 2024, avec un AFR de 0,68 % sur la durée de vie.
  • Seagate 8TB (ST8000NM000A) : aucune panne sur 19 684 jours de fonctionnement au T1 2024, avec un AFR de 0,00 % sur la durée de vie.
  • Seagate 6TB (ST6000DX000) : aucune panne sur 80 262 jours de fonctionnement au T1 2024, avec un AFR de 0,86 % sur la durée de vie.

Ces trois disques durs achetés et installés en même temps en 2015, avec leur moyenne d’âge de neuf ans continuent vaillamment leur service et font parti du seul Vault Backblaze de 6 To encore en service.

Une tendance vers des capacités plus élevées : des disques de plus grande taille et plus fiables

Un autre aspect intéressant du rapport est la répartition des pannes de disque par capacité. Les données de Backblaze montrent que les disques de plus grande capacité, tels que les modèles de 16 To et 22 To, affichent des taux de défaillance inférieurs à ceux des disques de moindre capacité.

 

Cette évolution s’explique en partie par les avancées technologiques intégrées dans les nouveaux disques durs de grande capacité, qui bénéficient souvent de processus de fabrication plus sophistiqués et de fonctionnalités améliorant la fiabilité.

 

Pour ceux qui gèrent de grandes quantités de données, cette évolution est bienvenue. Ces disques permettent non seulement de stocker davantage de données dans un espace physique réduit, mais ils offrent également des avantages en termes de fiabilité, grâce aux avancées technologiques dont ils bénéficient. Par conséquent, investir dans des disques durs de plus grande capacité peut s’avérer être une stratégie judicieuse pour améliorer l’efficacité et la sécurité des infrastructures de stockage. Des disques de grande capacité, qui allient volume de stockage élevé et fiabilité améliorée, rendent ces modèles de plus en plus attractifs pour les environnements de stockage cloud intensifs.

L’âge moyen de panne des disques durs

Un autre aspect intéressant du rapport est l’analyse de l’âge moyen auquel les disques durs tombent en panne. Les données de Backblaze montrent que l’âge moyen de défaillance des disques était de 2 ans et 6 mois pour 17 155 disques défaillants en 2023, tandis qu’une étude distincte menée par Secure Data Recovery sur 2 007 disques défaillants a estimé cette moyenne à environ deux ans et dix mois.

 

Cette différence s’explique en partie par le fait que de nombreux modèles de disques encore en service étaient bien plus anciens que la moyenne. Cela signifie que lorsque ces disques finissent par tomber en panne, cela affecte l’âge moyen de défaillance pour un modèle de disque donné. Pour clarifier cette observation, Backblaze a examiné uniquement les modèles de disques qui ne sont plus actifs dans leur environnement de production. Pour ces « modèles de disques retirés », l’âge moyen de défaillance était de 2 ans et 7 mois.

 

Un an plus tard, avec 4 406 disques défaillants supplémentaires, le total des disques défaillants à évaluer est passé à 21 388. En comparant les données du T1 2023 et du T1 2024, l’âge moyen de défaillance pour tous les modèles de disques Backblaze a augmenté à 2 ans et 10 mois, correspondant ainsi à la référence de Secure Data Recovery. Cependant, avec seulement deux points de données, il est difficile de déterminer si cette tendance est durable ou temporaire.

 

L’âge moyen de panne des disques durs par taille

Lorsque l’on examine les chiffres par taille de disque, une tendance se dégage : pour chaque taille de disque avec des modèles actifs (en vert), l’âge moyen de défaillance a augmenté du T1 2023 au T1 2024. Par exemple, les disques de 12 To ont vu leur âge moyen de défaillance passer de 1 an et 7 mois à 2 ans et 2 mois. Cette augmentation est également visible pour les disques de 8 To, passant de 3 ans et 4 mois à 4 ans et 1 mois. Voici le tableau illustrant cette tendance :

Rapport Blackblaze du T1 2024 : fiabilité des disques durs par taille
Age moyen des disques durs rapport Blackblaze premier trimestre 2024

La tendance à l’augmentation de l’âge moyen de défaillance était attendue, étant donné que l’âge moyen global de défaillance a augmenté au cours de l’année écoulée.

 

Cette disparité peut être expliquée en partie par la présence de disques plus anciens parmi ceux qui ont rendu l’âme, ce qui a influencé à la baisse la moyenne globale. Pour corriger cela, Backblaze a examiné spécifiquement les disques qui ont été retirés de l’environnement de production. Dans ce cas, la durée de vie moyenne avant la panne était d’environ deux ans et sept mois.

 

L’analyse de l’âge moyen de panne des disques durs montre une tendance à l’augmentation, en particulier pour les modèles encore en service. Cette tendance pourrait influencer positivement la durée de vie moyenne des disques lorsqu’ils seront retirés de la production. Cela souligne l’importance de surveiller en permanence les performances des disques durs et d’ajuster les stratégies de gestion en conséquence pour maximiser la fiabilité et la disponibilité des données. En comprenant et anticipant ces tendances, on peut mieux préparer les infrastructures de stockage pour assurer une performance optimale et une longévité accrue.

Les taux de panne par fabricant

Une des choses que les rapports de Backblaze mettent en lumière, c’est à quel point les taux de défaillance varient selon les fabricants et les modèles de disques. Dans le rapport du premier trimestre 2024, il apparaît que les disques Seagate affichent un taux de défaillance plus élevé comparé à ceux de Toshiba et HGST.

 

Cependant, ces chiffres doivent être interprétés avec précaution. Plusieurs facteurs, comme l’âge du disque, sa capacité et la charge de travail, influencent les taux de défaillance. Par exemple, Backblaze indique que de nombreux disques Seagate en service sont plus anciens que ceux d’autres fabricants, ce qui pourrait expliquer un taux de défaillance plus élevé.

 

Pour évaluer la fiabilité d’un disque dur, il est essentiel d’adopter une perspective globale en prenant en compte diverses sources de données. La réputation du fabricant, les avis des utilisateurs et les tests indépendants sont autant d’éléments à considérer.

Rapport Blackblaze du premier trimestre 2024 : fiabilité des disques durs par fabricant
Rapport Blackblaze du premier trimestre 2024 : fiabilité des disques durs par fabricant

La courbe en baignoire

Un concept utile pour comprendre les taux de défaillance des disques durs est la courbe en baignoire (bathtub curve). Cette courbe illustre trois phases distinctes de la vie d’un disque : un taux de défaillance initialement élevé (c’est la première partie de la courbe), suivi d’une période de taux de défaillance faible et stable (vie utile, la partie du milieu), puis une augmentation progressive des pannes à mesure que les disques vieillissent (usure, la dernière partie de la courbe).

 

Comme on peut le voir, le taux de défaillance annualisé (AFR) global pour tous les disques a atteint son maximum au troisième trimestre 2023 et est depuis en baisse. Cela s’explique principalement par le retrait des anciens disques de 4 To, qui sont dans la phase d’usure de la courbe en baignoire. Notamment, tous les disques de 4 To encore en service chez Backblaze aujourd’hui sont des modèles Seagate ou HGST. On peut donc s’attendre à une diminution continue de l’AFR trimestriel pour ces deux fabricants à mesure que leurs anciens modèles de 4 To seront remplacés au cours de l’année prochaine.

Analyse complémentaire des taux de défaillance des disques durs :

  1. Variabilité des performances par modèle : certains modèles de disques durs de même taille montrent une variabilité significative dans les taux de défaillance. Par exemple, les disques de 14 To varient de manière notable, avec le Seagate ST14000NM001G présentant un AFR de 1,60 % contre 5,48 % pour le modèle ST14000NM0138. Il est fondamental de toujours sélectionner soigneusement les modèles en fonction de leurs performances éprouvées.
  2. Fiabilité des grands disques de stockage : les disques de 16 To et 22 To montrent une excellente fiabilité globale, avec plusieurs modèles affichant des taux de défaillance proches de zéro. Cela suggère que les disques de stockage à haute capacité sont de plus en plus fiables et peuvent être considérés comme des choix sûrs pour le stockage de données à grande échelle.
  3. Vigilance concernant les disques de 14 To : certains modèles de disques de 14 To présentent des taux de défaillance plus élevés, atteignant jusqu’à 5,48 %. Il est donc important de surveiller attentivement la performance de ces modèles et d’envisager des alternatives si la fiabilité devient un problème.
  4. Optimisation des disques de 12 To et 8 To : les disques de 12 To et 8 To affichent des taux de défaillance variés, allant de 0 % à plus de 12 %. Il peut être judicieux d’optimiser l’utilisation de ces modèles en fonction de leur fiabilité et de leur performance dans des scénarios d’utilisation spécifiques.
  5. Migration vers des modèles plus récents : la transition des disques plus anciens vers des modèles plus récents, comme observé avec les disques Toshiba 4 To migrés vers des modèles Toshiba 16 To, peut contribuer à réduire les taux de défaillance globaux et à améliorer la fiabilité de l’ensemble du système de stockage. Cela démontre l’importance de mettre à jour régulièrement l’infrastructure de stockage pour maintenir des performances élevées et une faible incidence de pannes.
  6. Surveillance continue et maintenance proactive : les résultats soulignent l’importance de surveiller régulièrement la performance des disques durs, de détecter les signes de défaillance potentielle et d’effectuer une maintenance proactive, notamment en remplaçant les disques présentant des signes de faiblesse avant qu’ils ne provoquent des pannes majeures.

 

En résumé, une approche proactive de la gestion des disques durs, basée sur une surveillance continue, une migration vers des modèles plus récents et une optimisation en fonction de la fiabilité et des performances spécifiques, peut contribuer à garantir la stabilité et la disponibilité des données dans les environnements de stockage cloud.

Enfin quelques conseils pratiques

  1. Prioriser les disques de grande capacité avec de bons antécédents :
    • Pour des applications nécessitant de grandes capacités de stockage, il est recommandé de choisir des modèles de 16 To et 22 To qui ont démontré une faible AFR, comme le Seagate ST16000NM002J et le WDC WUH722222ALE6L4.
  2. Surveiller la variabilité des taux de défaillance par modèle :
    • Avant de faire des achats en volume, analyser les performances spécifiques de chaque modèle de disque dur, même au sein de la même gamme de capacité, pour éviter les modèles avec des taux de défaillance plus élevés.
  3. Planifier des mises à jour régulières de l’infrastructure de stockage :
    • Remplacer les anciens modèles de disques durs par des modèles plus récents et de plus grande capacité peut non seulement améliorer la performance mais aussi réduire le risque de pannes. Cela est particulièrement pertinent pour les modèles comme les Toshiba 4 To qui ont été retirés au profit des 16 To plus fiables.

Pour en savoir plus : accédez aux données complètes et regardez le live avec Backblaze

Pour en savoir plus sur les taux de défaillance des disques durs, vous pouvez consulter l‘intégralité des données de l’analyse sur le site de Backblaze.

Pour les plus courageux vous pouvez également regarder ce podcast de StorageReview avec Andy Klein de Backblaze (en anglais). La discussion porte sur le dernier rapport ainsi que sur les stratégies opérationnelles de Backblaze, y compris l’utilisation de divers types de disques, la gestion des pannes et le recyclage du vieux matériel.

Cellule d'urgence ransomware

Ligne direct 24/7

Contactez dès à présent nos experts pour vous accompagner et accélérer votre reprise d’activité.