Monitorizarea hdd folosind smartctl

SMART - un acronim însemnând Analiza de auto-monitorizare și raportare Tehnologie. Până în prezent, sprijinul SMART declarat de mulți producători de hard disk-uri. Cu această tehnologie, puteți identifica următoarele probleme:






  • probleme de asamblare cap magnetic
    Daune fizice erori logice
    Probleme ale sistemului de poziționare de antrenare
    partea electronică a problemei (placa)
    Temperatura în exces
Instalarea nu este banală:
Ieșirea este de 2 aplicatii: smartctl si smartd.
  • smartctl (Control și Monitor Utility pentru discuri SMART) - suporta ATA, IDE, SATA și SCSI-3 unități.
    smartd - este un smartclt demon, încercând să activați dispozitive inteligente de monitorizare ATA (smartctl -s pe) Interogarea aparatul la fiecare 30 de minute (implicit), erorile de disc logiruya și schimbați atributele în fișierul / var / log / syslog. Smartd poate fi configurat pentru trimiterea de avertismente e'mail în cazul în care este detectată o problemă.
Pentru a înțelege dacă există suport pentru hard disk SMART efectua:
Dacă este dezactivată, Activare SMART, puteți:
Pentru informații complete pe hard disk efectua:

Pe hard disk-ul este temperatura OK, de vârf, dar nu este critică pentru acest HDD a fost realizat doar.

Detaliată smartctl concluzie:

RAW_VALUE - Fiecare atribut are o valoare de 6 valoare de octet brut.

Treierat - o valoare minimă posibilă a atributului la care este garantată o funcționare fiabilă de stocare.

VALUE - o valoare octet „normalizat“ variază de la 0 la 255 (dată de către producător). O valoare mică indică degradarea rapidă a discului sau a unei posibile eșec iminent. și anume cu cât valoarea cu atât mai bine.
De exemplu, în cazul parametrului „Airflow_Temperature_Cel“ stochează RAW_VALUE temperatura discului (50), precum și temperatura maximă (Durată de viață Min / Max 23/51) minim și la care se menține eficiența unității. ROM Firmware RAW_VALUE convertește o valoare normalizată (VALUE) în intervalul de la 1 la 253. Dacă valoarea normalizată (VALUE) este mai mică sau egală cu treieră, atribut considerat a eșuat și afișată coloană WHEN_FAILED ca în cazul de față, eșecul a fost pentru atributul Airflow_Temperature_Cel.

GRAVE - valoarea normalizată minimă, la care se ajunge din momentul în care spațiul de pe disc SMART.

TIP - există 2 tipuri de atribute:
  • Pre--kritichnye nu atribute
  • Old_age - atribute non-critice (valoare valorii alocate producătorului MTBF).
Dacă VALUE mai puține treiera în cazul pre-atribut eșuează - există o mare probabilitate ca discul va zbura în următoarele 24 de ore.






Dacă VALUE mai treierat dacă atributul de Old_age - există o mare probabilitate ca discul va zbura ca Ea a dezvoltat resurse, dar atunci când se întâmplă acest lucru nu este cunoscut. atribute critice:
  • Raw_Read_Error_Rate - rata de eroare la citirea datelor de pe disc, a căror origine este cauzată de hardware-ul unității.
  • Spin_Up_Time - promovarea de timp a discului setat la oprire la viteza de operare. Atunci când se calculează valoarea valoarea de timp practic este comparată cu o valoare de referință stabilită în fabrică. Nu deteriorarea valoare non-maximă la Spin Up reîncercări Valoare = max (Raw = 0) nu spune nimic rău. Diferența față de momentul de referință poate fi cauzată de mai multe motive, de exemplu tragerii a tensiunii sursei de alimentare.
  • Spin_Retry_Count - numărul de promovare reîncercãri conduce la viteza de operare, în cazul în care prima încercare nu a reușit. Nenul Raw (Value respectiv nonmaximality) indică probleme în partea mecanică a unei unități.
  • Seek_Error_Rate - frecvența erorilor în poziționarea ansamblului capului. Valoarea brută ridicată indică faptul că există probleme care pot fi daune servo, unitate excesivă expansiune termică, probleme mecanice în blocul de poziționare, și altele. Constant Value mare valoare spune că totul este bine.
  • Reallocated_Sector_Ct - numărul de sectoare Reasignarea operațiuni. SMART în unități moderne, capabile de a analiza stabilitatea sectorului „din zbor“, iar în cazul în care este declarat un eșec, face mutarea acestuia.
Atributele non-critice:
  • Start_Stop_Count - numărul total de porniri / opriri axul. motor de antrenare garantat capabil să se deplaseze doar un anumit număr de cicluri de pornire / oprire. Această valoare este selectată ca treshold. Primele modele cu o viteză de rotație a discurilor de 7200 rot / min, a avut un motor de încredere, ar putea muta doar un număr mic, rapid și rupt în jos.
  • Power_On_Hours - numărul de ore petrecute în starea ON. Ca pașaport prag selectat MTBF (MBTF) pentru el. De obicei, valoarea MBTF este enormă, și este puțin probabil ca acest parametru atinge un prag critic. Dar chiar și în acest caz, eșecul unui disc complet opțional.
  • Power_Cycle_Count - numărul total de cicluri on-off ale discului. Pe aceasta și atributul anterior poate fi estimat, de exemplu, așa cum este utilizat pentru a conduce o achiziție.
  • Temperature_Celsius - indicații senzor termic sunt stocate aici. Temperatura are un efect profund asupra duratei de viață a discului (chiar dacă este în raza de acțiune). Mai degrabă nu influențează pe durata de viață a discului și incidența anumitor tipuri de erori, care afectează durata de viață.
  • Current_Pending_Sector - Numărul de sectoare care sunt susceptibile de înlocuire. Ei nu au fost chiar în mod specific la fel de rău, dar lectura ei este diferit de la citirea unui sector stabil, așa-numitele sectoare suspecte sau instabile.
  • Offline_Uncorrectable - numărul de erori la accesarea sectorului, care nu au fost ajustate. Posibile cauze ale eșecurilor pot fi mecanică sau deteriora suprafața.
  • UDMA_CRC_Error_Count - numărul de erori care apar în timpul transferului de date pe interfața externă. Acestea pot fi cauzate de cabluri de slabă calitate, moduri de operare non-standard.
Configurarea demon smartd: în cazul în care:
  • prima coloană - un dispozitiv
  • -S autorecord include atribute
  • -o include o testare automată off-line,
  • -indică un monitor smartd toți parametrii SMART ale discului,
  • -Adică 194 să ignore atributul # 194 (adică, temperatura), deoarece temperatura discului se modifică în mod frecvent și nu are nici un sens din exploatarea forestieră,
  • -m indică în cazul în care pentru a trimite mesaje de avertizare.
începe daemon:

SMART III a introdus o facilitate care vă permite să transparent pentru utilizator de a trece peste sectorul rău.