Voici un retour d’expérience, sous forme d’une discussion qui peut servir à quelqu’un.
Bonjour, après le GRUB j’ai obtenu ceci :
/dev/sda1 : UNEXPECTED INCONSISTENCY ; RUN fsck MANUALLY.
(i.e., without -a or -p options)
fsck died with exit status 4
et l’ordinateur refusait de démarrer. Alors, à la fin de la dernière ligne, j’ai écrit ceci :
fsck -y /dev/sda1/
et, quand cela a été fini, j’ai écrit : exit
et l’ordinateur a redémarré en me disant que sda1 est "clean" sauf 0,4 % non contigus.
ensuite, quand j’ai lancé le terminal et que j’ai fait : sudo apt update, j’ai eu un message me disant que :
/var/lib/sudo/ts/aciah-linux systeme de fichiers accessible en lecture seulement
et je n’ai pas pu poursuivre la mise à jour.
Il doit y avoir un problème ....
Bonjour,
Oui, il y a un sérieux problème. Une panne certainement imminente du Disque....(Pas de bruit bizarre ?).
Rappel la partition sda1 est celle du système. Le message de problème d’accessibilité en lecture seule apparaît effectivement si la partition sda1 comporte toujours des erreurs. C’est une sécurité pour préserver autant que possible les données de la partition.
Il n’est pas possible d’effectuer correctement la commande fsck à partir de la partition système Aciah-linux, seul le secteur d’amorçage aura été traité.
Mais dans un premier temps, il faut s’assurer de ce qui se passe. Une commande dmesg serait à utiliser. Le hic, c’est que tu ne pourras pas écrire sur le disque. Aussi il va falloir ruser.
L’astuce, utiliser une clé usb :
1- Insérer une clé USB déjà formatée (fat32).
2- Monter la clé (s’assurer que /dev/sdb est bien la clé, autrement dit qu’il n’y a pas de 2e disque dans la machine) :
3- Dans un Terminal, écrire :
sudo mount /dev/sdb1 /mnt
4- Exécuter ensuite :
sudo mount -o remount,rw /
touch /tmp/test 2>/mnt/touch.txt
dmesg > /mnt/dmesg.txt
5- Démonter la clé :
sudo umount /dev/sdb1
6- Rédémarrer le PC
Tu pourras ensuite en insérant la clé, lire les fichiers touch.txt et dmesg.txt et nous faire parvenir leur contenu (surtout des lignes commençant par EXT4-fs (sda1). On aura peut-être la trace d’un fichier corrompu détecté par un message du type Bad entry in directory #xxxxxx. Avec ce n° #xxxxxx, on pourra identifier en clair son nom.
On va de nouveau essayer de réparer le système de fichiers.
A partir d’un LiveUSB ( LiveUSB iso GParted), dans un terminal, exécuter la commande pour démonter la partition endommagée.
sudo unmount /dev/sdb*
(sdb représente le disque endommagé si on a booté à partir d’un LiveUSB)
Puis ensuite la commande :
sudo fsck -fy /dev/sdb1
Puis on redémarre à nouveau le PC.
Si on a de nouveau ce message d’accessibilité en lecture seule et si le fichier dmesg.txt nous donne la trace d’un fichier corrompu.
Il va falloir de nouveau booter sur le LiveUSB.
Saisir ensuite dans un terminal :
sudo mount /dev/sdb /mnt
sudo find /mnt -inum xxxxxx
où xxxxxxx est le numéro identifiant le fichier corrompu
On pourra alors le supprimer. Il faudra de nouveau redémarrer le PC. Rebooter sur la clé LiveUSB et refaire une vérification comme suit :
sudo unmount /dev/sdb*
(sdb représente le disque endommagé si on a booté à partir d’un LiveUSB)
Puis ensuite la commande :
sudo fsck -fy /dev/sdb1
Retour
Merci de toutes ces explications.
J’ai récupéré toutes les données de la personne, mais avant de changer le disque dur, j’ai tenté les manoeuvres indiquées ci-dessus. J’ai donc fait ceci :
1- Insérer une clé USB déjà formatée (fat32).
2- Monter la clé (s’assurer que /dev/sdb est bien la clé, autrement dit qu’il n’y a pas de 2e disque dans la machine) :
3- Dans un Terminal :
sudo mount /dev/sdb1 /mnt
4- Exécuter ensuite :
sudo mount -o remount,rw /
touch /tmp/test 2>/mnt/touch.txt
dmesg > /mnt/dmesg.txt
5- Démonter la clé
sudo umount /dev/sdb1 (ensuite je l’ai retirée)
6- Rédémarrer le PC
Le fichier touch.txt est vide.
Le fichier dmesg.txt contient ceci : ( extraits)
(extraits !)
[ 8.439663] ohci_hcd: USB 1.1 'Open' Host Controller (OHCI) Driver
[ 130.416549] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
[ 131.089199] systemd[1]: systemd 215 running in system mode. (+PAM +AUDIT +SELINUX +IMA +SYSVINIT +LIBCRYPTSETUP +GCRYPT +ACL +XZ -SECCOMP -APPARMOR)
[ 131.089313] systemd[1]: Detected architecture 'x86'.
[ 131.236780] systemd[1]: Inserted module 'autofs4'
[ 131.244397] systemd[1]: Set hostname to <AccessDVLinux>.
[ 131.244457] systemd[1]: Initializing machine ID from random generator.
[ 131.244532] systemd[1]: Installed transient /etc/machine-id file.
[ 136.864237] input: HDA ATI HDMI HDMI/DP,pcm=3 as /devices/pci0000:00/0000:00:01.0/0000:01:00.1/sound/card1/input8
[ 137.041632] snd_hda_codec_realtek hdaudioC0D0: ALC269VB: SKU not ready 0x411111f0
[ 137.909436] [drm] ring test on 3 succeeded in 7 usecs
[ 138.085189] [drm] ring test on 5 succeeded in 2 usecs
[ 138.085201] [drm] UVD initialized successfully.
[ 138.085372] [drm] ib test on ring 0 succeeded in 0 usecs
[ 138.085422] [drm] ib test on ring 3 succeeded in 0 usecs
[ 138.159095] Adding 2096716k swap on /dev/sda2. Priority:-1 extents:1 across:2096716k FS
[ 138.333263] EXT4-fs (sda1): re-mounted. Opts: errors=remount-ro
[ 138.410092] input: BRLTTY 5.3.1 Linux Screen Driver Keyboard as /devices/virtual/input/input15
[ 3373.306416] FAT-fs (sdb1): utf8 is not a recommended IO charset for FAT filesystems, filesystem will be case sensitive!
Je ne vois aucun message : bad entry.
J’ai arrêté et redémarré le PC plusieurs fois, je n’ai plus aucun message d’erreur.
Puis-je arrêter là, sans rien faire d’autre et sans changer le disque dur ?
ou bien faut-il faire ceci :
A partir d’un LiveUSB ( LiveUSB iso GParted), dans un terminal, exécuter la commande pour démonter la partition endommagée.
sudo unmount /dev/sdb*
(sdb représente le disque endommagé si on a booté à partir d’un LiveUSB)
Puis ensuite la commande :
sudo fsck -fy /dev/sdb1
Puis on redémarre à nouveau le PC.
Les messages qui nous intéressent sont ceux-ci :
[ 130.416549] EXT4-fs (sda1) : mounted filesystem with ordered data mode. Opts : (null)
[ 138.333263] EXT4-fs (sda1) : re-mounted. Opts : errors=remount-ro
C’est très intéressant. Parce que cela dit qu’au départ la partition est OK (1er message). Puis 8s plus tard, elle est en défaut, la partiton passe en mode Read-Only (2sd message...Opts : error=remount-ro signifie que le système de fichier n’est accessible qu’en mode lecture.... donc impossible d’écrire dessus). Pourquoi ?
En regardant le message juste avant :
[ 138.159095] Adding 2096716k swap on /dev/sda2. Priority :-1 extents:1 across:2096716k FS
Conclusion, la table de partition du disque est corrompue, non pas par un fichier mais au niveau de la structure des adresses. Cela veut peut-être aussi dire que le disque a un problème donc une panne possible à court terme.
Tu dis ne plus avoir de messages d’erreur... Après le Grub ? Peux-tu écrire sur ta partition ?
Si tu as toujours des messages te disant que le système de fichiers est accessible uniquement en lecture, Il faudra tout de même exécuter la suite proposée.
Cependant vu que la partition SWAP semble être en cause, la supprimer avant serait intéressant (avec Gparted LiveUSB).
Mais on peut tenter de la laisser dans un premier temps, et faire la suite proposée.
Si tu choisis de supprimer avec Gparted (LiveUSB) la partition SWAP, une fois la suite effectuée, il faudra la recréer avec Gparted (LiveUSB). Il faudra alors aussi modifier les fichiers /etc/fstab et /etc/initramfs-tools/conf.d/resume avec le nouvel UUID de la nouvelle partition SWAP.
Retour ...
Bonsoir
– j’ai vérifié l’état du disque : il est sain et aucun secteur défectueux, cela me rassure.
– j’ai téléchargé LiveUSB iso GParted et j’ai gravé un CD avec. Et j’ai démarré l’ordinateur sur le CD. Angoisse : un visuel que je ne connais pas et tout en anglais. Mais en bidouillant j’ai fini par trouver le visuel de Gparted que je connais bien. Mais pas de sdb, sans doute parce que j’ai démarré sur le CD.
– j’ai apercu un terminal et j’ai écrit : sudo unmount /dev/sda ....... mais j’ai eu la réponse : unmount connais pas.
– alors, avec Gparted, j’ai vu que sda1 était bien démonté et j’ai fait : partition/vérifier
– et tout semble aller bien.
l’ordinateur démarre bien (je l’ai fait plusieurs fois) et sans aucun message d’erreur. Je crois donc que c’est bon. Reste à savoir pourquoi ma manipulation ci-dessus n’a pas bien fonctionné. Sans doute à cause de la personne située entre la chaise et l’ordinateur ....
Bonjour,
l’ordinateur a bien démarré ce matin, sans annoncer d’erreur.
– Quand je fais : sudo apt update, pas de souci sauf 173 mises à jour à faire.
– mais quand je fais : sudo apt upgrade, les mises à jour se font mais j’ai des erreurs :
Des erreurs ont été rencontrées pendant l’exécution :
/var/cache/apt/archives/libxml2-dev_2.9.1+dfsg1-5+deb8u6_i386.deb
/var/cache/apt/archives/libxml2_2.9.1+dfsg1-5+deb8u6_i386.deb
/var/cache/apt/archives/libdns-export100_1%3a9.9.5.dfsg-9+deb8u15_i386.deb
/var/cache/apt/archives/libicu52_52.1-8+deb8u6_i386.deb
/var/cache/apt/archives/libmysqlclient18_5.5.59-0+deb8u1_i386.deb
/var/cache/apt/archives/libreoffice-writer_1%3a4.3.3-2+deb8u9_i386.deb
E : Sub-process /usr/bin/dpkg returned an error code (1)
j’ai fait :
sudo apt clean
Pas de problème.
J’ai refait :
sudo apt upgrade
et là j’ai eu : : dépendances non satisfaites, utilisez l’option -f
Donc j’ai refait :
sudo apt upgrade -f
et cela m’a indiqué 74 mises à jour à faire, mais aucune erreur.
J’ai fermé et relancé l’ordinateur, j’ai vérifié synaptic ... apparement tout est bon ! Je croise les doigts !
Sans vouloir être pessimiste, tout semble aller bien en apparence. Un HDD sur lequel des erreurs d’écritures se produisent aléatoirement.... ne va pas bien.
Tu peux le mettre sous surveillance en installant deux paquets : smartmontools et smart-notifier :
sudo apt install smartmontools smart-notifier
smartmontools comporte deux outils principaux : smartd et smartctl
- smartd est un "démon" (deamon) qui va récupérer les informations sur la santé du disque à intervalle régulier.
- smartctl est une commande qui va interroger les données SMART du HDD pour que nous puissions les visualiser
Une info importante pour le daemon smartmontools :
Décommenter (enlever le #) ceci dans le fichier /etc/default/smartmontools pour un démarrage du service automatique : start_smartd=yes
Pour afficher les infos de ton HDD :
sudo smartctl -a /dev/sda1
Exemple de sortie sur un de mes HDD :
=== START OF INFORMATION SECTION ===
Model Family : Western Digital Raptor family
Device Model : WDC WD750GF-00GFR0
Serial Number : WD-GR458633907
Firmware Version : 345.6T13
User Capacity : 49,915,365,109 bytes
Device is : In smartctl database [for details use : -P show]
ATA Version is : 5
ATA Standard is : Exact ATA specification draft version not indicated
Local Time is : Mon feb 05 20:38:10 2018 CEST
SMART support is : Available - device has SMART capability.
SMART support is : Enabled=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result : PASSED
General SMART Values :
Offline data collection status : (0x82) Offline data collection activity
was completed without error.
Auto Offline Data Collection : Enabled.
Self-test execution status : ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection : (2672) seconds.
Offline data collection
capabilities : (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities : (0x00373) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability : (0x41) Error logging supported.
No General Purpose Logging support.
Short self-test routine
recommended polling time : ( 3) minutes.
Extended self-test routine
recommended polling time : ( 40) minutes.
Conveyance self-test routine
recommended polling time : ( 5) minutes.SMART Attributes Data Structure revision number : 32
Vendor Specific SMART Attributes with Thresholds :
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
3 Spin_Up_Time 0x0007 117 115 021 Pre-fail Always - 4691
4 Start_Stop_Count 0x0032 099 099 040 Old_age Always - 1341
5 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 0
7 Seek_Error_Rate 0x000b 200 200 051 Pre-fail Always - 0
9 Power_On_Hours 0x0032 095 095 000 Old_age Always - 3904
10 Spin_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
11 Calibration_Retry_Count 0x0013 100 100 051 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 1314
194 Temperature_Celsius 0x0022 100 092 000 Old_age Always - 50
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0
197 Current_Pending_Sector 0x0012 200 200 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0012 200 200 000 Old_age Always - 0
199 UDMA_CRC_Error_Count 0x000a 200 253 000 Old_age Always - 3
200 Multi_Zone_Error_Rate 0x0009 200 179 051 Pre-fail Offline - 0SMART Error Log Version : 1
No Errors Logged
"No Errors" -> Ok le disque dur est en bon état.