Check je Smart Drives…

Soms heb je geluk, soms heb je pech….  en houd je harddisk er op gegeven moment gewoon mee op.
Gelukkig zijn de meeste moderne harddisken uitgerust met SMART technologie.

SMART staat in dit geval voor "Self-Monitoring Analysis and Reporting Technology, in gewoon nederlands: Zelf-monitorende analyse en rapportage techniek.

Met dit systeem hebben moderne schijven een aantal geavanceerde diagnose middelen die de interne werking van de schijf monitoren.  Hierdoor kunnen deze schijven een vroegtijdige waarschuwing geven wanneer hij problemen kan gaan geven, zelfs nog voordat er daadwerkelijk data verloren is gegaan.
Op dit moment kan het SMART  systeem circa 70% van alle harddisk fouten voorspellen.

Helaas  wordt de SMARt status in de huidige OS-sen niet of nauwelijks in de gaten gehouden, waardoor je alsnog voor vervelende verassing kunt komen te staan.

Een moderne Linux distributie heeft echter standaard monitor tools aan boord!
Ik wil hier uitleggen welke dat is, en hoe je de status kunt checken.

De tool die ik bedoel heet smartctl, is ooit geschreven door een enthousiasteling die een groot park linux servers moest beheren, en die niet van verrassingen hield. Wink
Laten we snel beginnen:

# smartctl -i /dev/hda        Geeft de disk informatie weer, en of deze SMART capable is…
smartctl version 5.33 [i686-pc-linux-gnu] Copyright (C) 2002-4 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF INFORMATION SECTION ===
Device Model:     Maxtor 6Y160P0
Serial Number:    Y45ZSXDE
Firmware Version: YAR41BW0
User Capacity:    163,928,604,672 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   7
ATA Standard is:  ATA/ATAPI-7 T13 1532D revision 0
Local Time is:    Mon Apr  7 23:40:53 2008 CEST
SMART support is: Available – device has SMART capability.
SMART support is: Enabled

 Zoals je ziet is deze schijf SMART capable.

#smartctl -Hc /dev/hda      Geeft de algemene gezondheid van de schijf weer…
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x80)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Enabled.
Self-test execution status:      ( 118)    The previous self-test completed having
                    the read element of the test failed.
Total time to complete Offline
data collection:          ( 302) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    No General Purpose Logging support.
Short self-test routine
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      (  72) minutes.

# smartctl -l error /dev/hda          Geeft aan of er ooit fouten geconstateerd zijn op deze schijf.

# smartctl -l selftest /dev/hda       Geeft aan of de interne selftest ooit fouten heeft gegeven.

# smartctl -t short /dev/hda         Voer een korte selftest uit.

# smartctl -a short /dev/hda          Laat alle bovenstaande info in 1x zien.

Je kunt hier via cron een mooi scriptje van maken, en die b.v. dagelijks draaien, en als er een foutmelding een emailtje of zo laten versturen.  Zover ben ik nog niet gegaan, maar als ik dat ga doen zal ik hem hier delen..

Hier heb ik ook nog een mooi verhaal over de SMART technologie….