Un logiciel pour compléter les flux RSS tronqués

closeCet article a été publié il y a 14 ans 19 jours, il est donc possible qu’il ne soit plus à jour. Les informations proposées sont donc peut-être expirées.

Si comme moi vous utilisez abondamment les flux RSS pour vous procurer votre dose d’informations de la journée, je suppose que vous devez apprécier de ne pas avoir à sortir de votre lecteur de flux pour lire un article en entier. Quoi donc de plus ennuyeux que d’avoir à faire à des flux tronqués.

Il est vrai cependant que les lecteurs de flux se sont adaptés à ce type de désagrément. Ils vous proposent souvent d’ouvrir l’article par un simple clic sur le site de l’auteur. Mais voilà cela fait un clic de plus, deux à trois secondes d’attentes parfois plus et multiplié par quelques dizaines d’articles, on perd en productivité.  C’est aussi sans parler de la déception parfois de voir que l’article ne comporte guère plus de texte que dans le flux.

Je ne vais pas m’étendre sur les bonnes et mauvaises raisons que peuvent avoir pas mal de sites de ne diffuser dans leur flux qu’une partie de leurs articles. Ce n’est pas là le sujet de cet article. Autant le dire aussi cet article s’adresse aux geeks fondus de flux RSS et à court de temps comme moi qui n’ont pas une seconde à perdre en clic inutile.

Il s’agissait donc de trouver un moyen de contourner cette limite. Sur le papier, c’est simple, il suffit d’avoir un programme :

  • qui lise le flux RSS,
  • récupère l’URL de l’article,
  • aille sur le site chercher le reste de l’article,
  • génère un autre flux RSS complet cette fois.

Ce n’est que tout récemment que j’ai découvert un service gratuit proposant de réaliser cette opération : Wizardrss. Comme l’indique l’article, ce site gratuit utilise un script PHP qui est disponible sous licence AGPL. On peut le trouver sur le site de Launchpad sous le nom de content-only.

Ce script met en oeuvre un trio de composants également sous licence libre :

  • Simplepie : permets de lire des flux RSS
  • Readability : qui se charge de lire l’article sur le site de l’auteur
  • Feedwriter : vient boucler la marche en générant le flux complet

Voici donc ici un bel exemple d’assemblage que permet le logiciel libre.

L’installation est très simple. Il suffit de copier les fichiers dans un répertoire de votre hébergement et c’est fini ou presque. Vous obtiendrez quelque chose qui ressemble à cela :

Ce qui fait un peu bizarre c’est que ce que vous installez est l’exacte réplique du site fivefilters.org qui propose également de reconstituer des flux RSS. Par défaut le script se comporte comme le service original.

Sauf que vous avez la possibilité de le configurer et de vous attribuer « gratuitement » les fameuses clés qui permettent de bénéficier d’une reconstitution d’un nombre théoriquement infini d’articles dans le flux. Dans le répertoire d’installation se trouve un fichier config-sample.php. Il vous suffit de dupliquer ce fichier en le nommant config.php pour pouvoir modifier le comportement par défaut et le nombre d’articles reconstitués dans le flux RSS. Pour vous attribuer une clef il suffit de l’ajouter dans le fichier config.php en modifiant cette ligne :

 $options->api_keys = array('ma-clef_secrete');

Bien entendu, si vous êtes plus doué que moi en programmation et ce ne doit pas être très difficile vous pouvez refaire la page d’accueil en supprimant toutes les limitations. L’essentiel est dans le script makefulltextfeed.php.

Ne vous attendez cependant pas à un taux de réussite de 100%. Selon les sites, ça ne marche pas toujours forcément bien. Mais comme c’est écrit sur le site de Readability, cela marche de façon surprenante assez bien.

J’en profite pour faire un rappel :  si vous utilisez une URL Feedburner pour suivre mon site, pensez à la remplacer par

https://philippe.scoffoni.net/feed

Je pourrais bien cesser de l’alimenter prochainement.

Si vous lisez cet article dans votre lecteur RSS c’est bien sûr parce que je le diffuse en intégralité et en libre service 😉 !

Imagette page d’accueil cc licensed flickr photo shared by HiMY SYeD / photopia

Philippe Scoffoni

Je barbote dans la mare informatique depuis 30 ans (premier ordinateur à 16 ans, un ORIC ATMOS) et je travaille à mon compte au travers de ma société Open-DSI. J'accompagne les associations, TPE et PME dans leurs choix et dans la mise en oeuvre se solutions informatiques libres.

6 réponses

  1. Antonin M. dit :

    Philippe !

    Tu es un ange.

    MERCI pour cet outils extrêmement utile qui me serait même pas venu à l’idée de chercher et qui pourtant va m’être d’une très grande utilité.

  2. Polochon_street dit :

    Heu, y’a aussi un logiciel tout simple appelé yarssr qui fait comme tu veux, je crois? Je suis pas sûr que c’est ce que tu cherches, hein.

  3. Philippe dit :

    @antonin : Houla, quelle déclaration enflamée, c’est la première. J’aime bien l’informatique dans les nuages (pas pour tout le monde et pas n’importe comment 😀 ) tu crois que ça me donne ce coté angélique 😀 ? Tant mieux si ça rend service !
    @Polochon_street : pas vraiment, du moins c’est pas l’impression qu’il m’a donné en allant voir le site. je cherchais un outils qui se place en amont du lecteur de flux RSS.

  4. Didier Bretin dit :

    Bonjour,

    Si j’ai bien compris, tu captures les flux RSS tronqués avec ce logiciel que tu as installé sur ton serveur chez Gandi, puis tu t’es abonné aux flux reconstitué par ce logiciel avec ton lecteur RSS préféré ? J’ai bien compris ?

    Au passage quel lecteur RSS utilises-tu ?

    Cordialement.

  5. Didier Bretin dit :

    Merci pour l’information. Justement je voulais tester newsbeuter depuis longtemps ;).

  6. Philippe dit :

    @Didier : Tu as bien compris 🙂 ! J’utilise newsbeuter un lecteur de flux RSS en mode texte