4.7.07

Qu'est-ce qu'un flux RSS ?

De nombreuses personnes me demandent ce qu'est RSS et certains ont reproduit sur leur blog un l'extrait de mon ouvrage "RSS, Blog : un nouvel outil pour le management" publié chez M2 Editions que je vous livre ci-dessous.


RSS – « Rich Site Summary » ou « RDF[1] Site Summary » est un jeu de plusieurs standards. Ils ont initialement été élaborés comme un cadre technique permettant de traiter les métadonnées[2] pour diffuser des informations sous forme de petits billets (news) ou alertes. Ces standards utilisent les balises XML qui qualifient l’information transmise. Le principe de RSS est simple : d’un côté, vous avez un éditeur qui peut être une personne physique (1) ou un programme (2) et de l’autre un récepteur (3) qui peut également être un programme informatique.



Figure 2 Relations entre les émetteurs de flux et agrégateurs de news

Les éditeurs (1) ou (2) peuvent soit formater directement les informations à transmettre au standard RSS, soit utiliser les services d’un générateur de flux que l’on retrouve fréquemment sous forme de module dans les blogs (4) et de plus en plus souvent dans les applications de gestion documentaire, des packages logiciels ou des applications écrites par les développeurs de l’entreprise (5). A ce stade les informations sont simplement mises à dispositions des récepteurs potentiels qui doivent venir la chercher à l’aide d’agrégateurs de news (6) qui ont pour missions d’interroger les serveurs dans lesquels sont stockées les informations structurées au format RSS. Ceci explique la raison pour laquelle la flèche des flux (7) est positionnée de droite à gauche. Le rôle des agrégateurs est de rechercher pour votre compte les nouvelles informations qui sont publiées par les canaux d’information auxquels vous avez souscrit. La syndication du contenu correspond à cette action de recherche et de rapatriement des informations mises à disposition du public.

Les premières entreprises à avoir adopté RSS ont été principalement des médias (broadcasters) car ils produisent et reçoivent de nombreuses informations en provenance de sources diverses. Selon une étude[3] de la Fédération internationale de la presse périodique aux Etats-Unis, en avril 2005, environ 30 % des titres utilisait cette technique. Les médias français doivent au moins être le même pourcentage à fournir des flux RSS si ce n’est plus. Ils les emploient pour agréger des titres de news sur différents sites Internet et établir des liens sur les textes des articles publiés. Les articles proprement dits ne sont habituellement pas partagés, mais seulement les métadonnées et la description. Ces métadonnées peuvent inclure un titre, une URL, une courte description et un élément de catégorisation. En fait, les flux RSS reposent sur plusieurs variations du standard RSS et d’ATOM que nous décrivons page 41. Toutes ces variations techniques, ne font en fait qu’un seul standard dans le contexte de ce livre. Elles peuvent être assimilées à des dialectes dérivés de XML. L’application la plus commune est celle connue sous la forme de blogs. les logiciels de blogs peuvent, ou pas, générer des flux RSS/ATOM. En fait, la souplesse du langage XML permet d’envisager de nombreuses autres applications des flux RSS plus professionnelles. Cet ouvrage en décrit quelques-unes au chapitre sur les applications page 113.

1.1. Qu’est-ce qu’un flux RSS ?



Un flux RSS est une news (que nous préférons à l’expression française de “billet ”) ou une alerte codée selon les spécifications des standards RSS/ATOM afin qu’elle puisse être lue et interprétée par les agrégateurs de news ou les applications, configurés en fonction de ces mêmes standards.

Le terme « news » nous semble mieux approprié car nous verrons que RSS s’applique à bien d’autres choses que des billets publiés sur un blog. Les alertes, la gestion des listes, d’une collection d’objets, d’évènements font parti des possibilité avec en constante la notion de relative fraicheur de l’information.

Les agrégateurs, ou les applications dédiées, comportent une fonction logicielle (bot) chargée de rechercher, d’identifier et de rapatrier les nouvelles informations publiées sous la forme de flux. D’un point de vue technique, le logiciel envoie selon des fréquences variables en fonction de son degré de sophistication des requêtes aux sites émetteurs pour savoir si de nouvelles news ou alertes ont été publiées. Les plus élémentaires envoient systématiquement ces requêtes toutes les heures, ou fraction d’heures. My.Yahoo ! dispose d’un algorithme permettant d’identifier la fréquence d’émission des sources. Si une source émet une nouvelle par semaine, alors la mise à jour se fera à ce rythme. Si l’émetteur est plus prodigue et émet une fois par jour, alors l’agrégateur s’adapte et consulte également la source selon cette même fréquence. Ces stratégies ont été mises en œuvre[4] en réponse aux premières erreurs qui ont conduit à saturer la bande passante des émetteurs les plus populaires.

Les flux RSS sont employés dans le monde de l'e-commerce comme un moyen pour fournir l'information dans un format très compact. Par exemple, Amazon fournit[5] des flux élaborés sur sa plateforme « Web Services »[6]. Cette technique permet d’identifier des livres en relation avec certains mots clefs ou selon des catégories définies par le vendeur[7].



Figure 3 Flux RSS proposés par Amazon, classifiés par catégories


Jean-Claude MORAND

[1] RDF signifie « Resource Description Framework », c’est l’un des deux fondements du « semantic web » promus par le W3C avec OWL (Ontology Working language). En plus des définitions du glossaire, des informations complémentaires sont disponibles sur le site du W3C sous www.w3.org/sw

[2] Voir définition dans le glossaire

[3] Source : publications.mediapost.com/index.cfm?fuseaction=Articles.san&s=31662&Nid=14155&p=276816

[4] Pas encore pour tous les agrégateurs…mais cela s’impose pour tous les nouvelles versions.

[5] Voir www.amazon.com/gp/browse.html/ref=sd_allcat_ws/104-2982556-0543145?node=3435361

[6] WSDL est un standard XML permettant d’interfacer des applications entre différentes plateformes web. Microsoft a par ailleurs démontré une application utilisant les fonctions natives de RSS, lors de leur annonce du 25 juin 2005 présentant le support RSS pour leur futur système d’exploitation Longhorn/Vista.

[7] Source www.amazon.com/exec/obidos/subst/xs/syndicate.html

Aucun commentaire:

(C) Jean-Claude MORAND - 2004-2011 - Cyberstrat (tm) est une marque déposée par Jean-Claude Morand