Fritalk.com : hébergement de blogs, jabber et mail

Aller au contenu | Aller au menu | Aller à la recherche

mardi, mai 18 2010

Upgrade non sans mal…

Comme vous l'avez constaté hier, le serveur a été upgradé pour passer en Lucid Lynx.

Cela n'a pas été sans mal, toutes nos excuses pour le dérangement.

En fait, depuis avant l'upgrade, le serveur souffrait de ralentissements sans qu'il fussent possible d'isoler une cause bien précise. L'upgrade n'arrangea pas les choses (et, comme d'habitude, en cassa une ou deux).

Il s'est avéré que, en fait, plusieurs processus consommaient beaucoup de mémoire et faisaient un usage intensif du disque dur.

Un petit nettoyage a été nécessaire, un reboot également (mise à jour du noyau aidant). Les deux processus incriminés furent identfiés : amavis et le serveur jabber.

Pour Amavis, il a été décidé de le virer et d'utiliser directement spamassassin. Je n'ai personnellement jamais compris l'intérêt d'amavis, celui-ci n'étant qu'une couche supplémentaire entre postfix et spamassassin. Si en plus cette couche me bouffe 400Mo de swap… Et comme je ne suis pas le seul.

Pour Ejabberd, je ne pouvais pas le virer vu que c'est le service le plus populaire de fritalk ! Après investigation, il est apparu que le fichier contenant les "messages offline" faisait près de 500Mo et qu'il surchargeait le serveur à son démarrage, celui-ci mettant le fichier (binaire) en ram pour le lire !

La solution était simple : désolé pour ceux qui ont perdu un message envoyé hors-ligne.

Tout est à présent rentré dans l'ordre et comme Lucid Lynx est une LTS, on ne recommencera plus avant 2 ans ;-)

Bon vent !

lundi, janvier 18 2010

Massive DOS

Pendant 2 heures cet après-midi, Fritalk n'a répondu que très sporadiquement. La faute a un DOS massif par un réseau de botnets.

Fritalk n'était pas spécialement visé, à ma connaissance, pas mal d'autres serveurs ayant connu les mêmes déboires.

Action : dorénavant, psad bloquera automatiquement les IPs suspecte plutôt que de se contenter de m'avertir par mail. (D'ailleurs, une fois le serveur récupéré, j'avais plus de 2000 emails dans ma boîte).

mardi, novembre 3 2009

Ubuntu Karmic

Le serveur fritalk vient d'être upgradé vers Ubuntu 9.10 Karmic. Rien de très spécial à signaler si ce n'est deux petits problèmes :

1) Trac n'utilise plus LDAP pour l'authentification, ce qui vous empèche de raporter des bugs. Utilisez les commentaires de ce billet pour rapporter les problèmes ou pour nous aider à résoudre ce problème.

2) JWchat ne fonctionne plus mais ne fonctionnait pas non plus avant l'upgrade. C'est bizarre vu qu'il n'y a aucun message d'erreur : juste que ça ne se connecte pas. Toute aide (ou toute autre proposition de client web) est la bienvenue.

jeudi, octobre 8 2009

Microcoupures ?

Certains utilisateurs se sont plaints de micro-coupures et de pertes de connexions.

Ce problème ne semblait pas logiciel et nous avons découvert qu'il affectait même le ping : le serveur ne répondait plus au ping pendant quelques secondes ! Suite à cela, les câbles réseaux ont été remplacés et nous n'avons plus été en mesure de reproduire ces micro-coupures. Nous espérons avoir résolu le problème.

Ciseaul

Bonne nouvelle également : l'installation LDAP a été stabilisée et ne devrait plus poser de problème. Nous sommes prêts pour une migration vers Ubuntu 9.10. Prochain chantier : comprendre pourquoi Apache est tellement gourmand en mémoire, ce qui lui impose parfois un restart automatique.

mercredi, septembre 2 2009

Downtime de rentrée

Bonjour à tous,

Par compassion avec les écoliers, Fritalk a décidé de tomber en rade dans la nuit du 1 au 2 septembre. La raison est fort simple : de multiples mises à jour du noyau ont pris tous l'espace disque de la partition racine parce que je n'avais pas pris la peine d'enlever les anciens noyaux. Il faudrait que je me penche un peu plus sur une solution pour manager l'espace disque.

Cela est évidemment arrivé à 2h du mat. Le lendemain matin, mauvaise surprise : le serveur LDAP ne se relançait plus avet tous les symptômes de ce foutu vieux bug toujours pas résolu. Après 2 heures de perdues, la solution toute conne est apparue : effacer log.0000000001 de /var/lib/ldap. Si votre serveur LDAP refuse de se lancer, effacez le log. Bon à savoir.

Tout devrait être rentré dans l'ordre.

Certains utilisateurs du serveur Jabber ont signalé des micro-coupures. Nous avons pris note du problème mais, malheureusement, nous n'arrivons pas à le reproduire (li semble d'ailleurs n'affecter que certains comptes) et rien de probant n'apparait dans les logs. Si vous avez plus d'informations (moyen de reproduire le problème,date précise à laquelle le problème a commencé) envoyez un mail à ploum sur ploum.net.

Bonne rentrée

- page 1 de 3