siou plaît ...
Publié il y a 5 mois
Étiquettes: ArchLinux,  logiciel libre

Le contexte

Alors que ma tour fonctionne tout à fait normalement, les symptômes suivant apparaissent:

  • Impossibilité d'ouvrir de nouveaux shells
  • Les connexions SSH fonctionne (le message du jour s'affiche), mais pas de prompt.
  • Certains programmes en fonctionnement, se mettent à ralentir ou ne plus répondre.

La question

Quelqu'un connait-il la cause possible de ce plantage qui commence par le message suivant dans les logs du système :

May  6 09:25:26 melody upsd[7219]: Data for UPS [slubups] is stale - check driver
May  6 09:25:27 melody upsmon[6548]: Communications with UPS slubups@localhost lost
May  6 09:25:29 melody upsmon[7223]: Communications with UPS slubups@localhost lost
May  6 09:25:31 melody upsd[7219]: UPS [slubups] data is no longer stale
May  6 09:25:32 melody upsmon[6548]: Communications with UPS slubups@localhost established
May  6 09:25:34 melody upsmon[7223]: Communications with UPS slubups@localhost established
May  6 09:50:22 melody kqemu: aborting: Paging exception in monitor address space. CR2=0xf13f9080
May  6 09:50:22 melody err=0003 CS:EIP=f180:00000000f0003c28 SS:SP=0000:00000000f00c8e80
May  6 09:50:53 melody kqemu: aborting: Paging exception in monitor address space. CR2=0xf13f9080
May  6 09:50:53 melody err=0003 CS:EIP=f180:00000000f0003c28 SS:SP=0000:00000000f00c8e80
May  6 10:54:14 melody upsd[7219]: Data for UPS [slubups] is stale - check driver
May  6 10:54:17 melody upsmon[6548]: Communications with UPS slubups@localhost lost
May  6 10:54:19 melody upsmon[7223]: Communications with UPS slubups@localhost lost
May  6 10:56:46 melody kontact       D 0000000000000000     0 19102      1
May  6 10:56:46 melody ffff8101a3b29d78 0000000000000082 0000000000000282 0000000000000003
May  6 10:56:46 melody ffffffff805a9c80 ffff8101b83fcf60 ffff810230cd6000 ffff8101b83fd190
May  6 10:56:46 melody 000000033fcd4000 ffffffff80245814 ffff8101b83fd190 ffff8101a3b29d88
May  6 10:56:46 melody Call Trace:
May  6 10:56:46 melody [<ffffffff80245814>] lock_timer_base+0x34/0x70
May  6 10:56:46 melody [<ffffffff80245afd>] __mod_timer+0xbd/0xe0
May  6 10:56:46 melody [<ffffffff8045d078>] schedule_timeout+0x58/0xd0
May  6 10:56:46 melody [<ffffffff80245400>] process_timeout+0x0/0x10
May  6 10:56:46 melody [<ffffffff8045d073>] schedule_timeout+0x53/0xd0
May  6 10:56:46 melody [<ffffffff88076fbc>] :jbd:journal_stop+0xbc/0x200
May  6 10:56:46 melody [<ffffffff802c532c>] __writeback_single_inode+0x33c/0x470
May  6 10:56:46 melody [<ffffffff80251cf0>] autoremove_wake_function+0x0/0x30
May  6 10:56:46 melody [<ffffffff802c548b>] sync_inode+0x2b/0x50
May  6 10:56:46 melody [<ffffffff88087ee3>] :ext3:ext3_sync_file+0x93/0xa0
May  6 10:56:46 melody [<ffffffff802c8ff9>] do_fsync+0x69/0xf0
May  6 10:56:46 melody [<ffffffff802c90ae>] __do_fsync+0x2e/0x50
May  6 10:56:46 melody [<ffffffff8020c59a>] system_call_after_swapgs+0x8a/0x8f
May  6 10:56:46 melody

Et dont l'évolution complète est visible dans ce fichier : freeze-20080506-00.txt

Je suis à l'écoute de toute piste/explication de ce comportement.


Auteur: slubman -  Categorie: GNU Linux Commentaires: 3Permalinkdel.icio.us del.ico.us

Commentaires

1. Matos ?

Par: cdemoulins
Le: Mercredi 07 Mai 2008 à 10:50
Peut être un problème materiel ? Genre hdd ou ram ?
Tu peux faire des tests assez facilement pour la ram en tout cas.

Bon sinon je te conseil d'aller sur un forum pour avoir de l'aide, c'est plus simple pour suivre les réponses.

2. segfault d'un module?

Par: kik
Le: Dimanche 11 Mai 2008 à 10:46
les dump laisse penser qu'il s'agit d'un segfault.

Si je ne m'abuse, les applications concernées ne sont que des applications utilisant le net, à l'exception de qemu et de bash, qui peuvent néanmoins l'utiliser.

Le fait que les erreurs apparaissent dans syslog et que les mêmes applications renvoient plusieurs cette erreur (donc elle n'ont pas crashé elles-même), me fait penser à une erreur de module, qui planterait chaque fois qu'un processus l'appelle.

Est-ce que tu as recompilé ton noyau récemment, ou rajouté des modules concernant le networking?

3. La source du plantage était ...

Par: slubman
Le: Lundi 02 Jui 2008 à 19:46
Une barette de RAM défectueuse. Détectée avec memtest86+, changée, depuis une stabilité retrouvée.

Ajoutez votre commentaire

  • Les Commentaires sont modérés à priori, donc il peut y avoir un delai avant l'apparition de votre commentaire sur la page.
    Merci de votre compréhension.
  • Votre email est juste demandé à titre indicatif, il n'apparaitra pas sur la page.
  • Les champs marqués d'un * sont obligatoires.
Action