Drupal et le web de données, le web sémantique vu par l'équipe de Bluedrop.fr

image
Le web sémantique, on en parle ? Enfin... On essaie d'en parler clairement, calmement, ouvertement, pour que tout le monde suive ? Comment ça marche ? Et pourquoi Drupal est considéré comme le CMS référence en la matière...

Le web sémantique, on en parle ? Enfin... On essaie d'en parler clairement, calmement, ouvertement, pour que tout le monde suive ? Comment ça marche ? Et pourquoi Drupal est considéré comme le CMS référence en la matière...

Le web sémantique ou web des données ou web 3.0, c'est quoi papa ?

Le web sémantique c’est tout d’abord l’idée que dans la masse des informations déjà présentes sur Internet se cachent d’autres informations, moins faciles d’accès ou pas encore accessibles, et qui peuvent être sources de connaissances pour peu qu’on sache comment les faire émerger. Pour parvenir à cela, il faut transformer le web de son état actuel – où le contenu fait sens pour des humains qui lisent les pages, pour le faire passer à un état sémantique – où le contenu fait sens pour des ordinateurs. Le but ? Comme d’habitude faire travailler les ordinateurs à notre place.

Prenons comme exemple une requête simple (et masculine). Je demande à la machine : « achète-moi des pizzas pour le match de ce soir ».
L’ordinateur doit comprendre qu’il s’agit du match de la France, il doit savoir à quelle heure débute le match, doit comparer les prix des pizzas et passer la commande. Cet exemple ne s’étend évidemment pas au résultat du match. Le web sémantique est donc le mouvement qui s’emploie à développer les outils permettant de réaliser cela. L’idée est simple, sa concrétisation nettement plus complexe.

Ok, donc on fait comment ?

Concrètement, c’est là que ça se corse les gars. Pour parvenir à ce noble objectif d’émergence de connaissances, il faut passer par plusieurs étapes : de la description des données (ce qui implique de trouver les bons descripteurs), à leur structuration, en passant par l’élaboration de langages de publications afin de permettre à des ordinateurs de les lier entre elles et de les traiter. Vous suivez toujours ?

Un exemple est sans doute plus parlant. Prenons un modèle de voiture. Le modèle est décrit sur le site internet du fabriquant. Qui lui-même fait appel à 10 sous-traitants pour réaliser certaines pièces. A leur tour les sites internet de ces sous-traitants ont tous une page pour décrire chacune des pièces qui entrent dans la fabrication de notre véhicule chéri.

Si on trouve un standard de description pour la voiture et l’ensemble des pièces (nom de la pièce, référence, nom du fabriquant, prix, poids, lieu de production, matériau, etc.), nous aurons la première brique de sémantisation.
Si maintenant nous adoptons une norme de publication spécifiquement destinée aux données, la norme RDF (Resource Description Framework) nous avons la deuxième brique. Celle-ci permet par exemple de lier le champ « poids de la pièce » d’un sous traitant en France au champ « part weight » d’un sous-traitant en Angleterre.
Si ensuite nous avons les langages d’interrogations de ces données nous avons la troisième. Et si nous faisons cela pour l’ensemble des voitures, nous avons sémantisé le web des voitures.

Et Drupal ?
Avec la version 7, Drupal emporte le web sémantique nativement dans le Core.

Avec Drupal, il est facile d'intégrer les schémas de données liés définis par la norme RDFa dans vos applications. Les résultats sont automatiquement partagées entre les machines. Les développeurs d'applications peuvent se concentrer sur la fourniture de solutions de visualisation en agrégeant le contenu de sources disparates. Avec Drupal, les développeurs n'ont pas à se préoccuper de la capture, de l'organisation et de la maintenance des métadonnées.

Comment partager mes données dans le web 3.0 à partir de mon site Drupal ?

Drupal fait en sorte de structurer vos données et de les rendre réutilisables par d'autres sites. Le CMS le fait en ajoutant des informations autour de vos champs, de vos données. Vos données sont alors structurées "RDF" (sorte de référentiel de description universelle de vos données). Ce modèle permet de rendre interopérables les données provenant de multiples sources du web. 

Les avantages à "sémantiser" vos contenus sont nombreux. Parmi eux, notez que google peut afficher les résultats de recherche de façon plus claire et intuitive (et favoriser le classement de vos contenus). 

Comment agréger des données sémantiques dans mon site Drupal ?

Drupal dispose d'un module SPARKLE en cours de stabilisation. Le projet Sparkle permet de rechercher, ajouter, modifier ou supprimer des données RDF disponibles à travers Internet. Le web de données est alors accessible à l'intérieur de votre site !

...Et au fait, elles arrivent quand les pizzas ?!

Pour aller plus loin : 

Drupal et le sémantique : 

Exemples de modules Drupal : 

Vous pouvez également lire les posts de notre ami Christian Artin sur le sujet :) www.debitdedata.net