Projet Storm : translittération et web sémantique avec Drupal
En collaboration avec la société d’édition de logiciels Armadillo qui a initié le projet STORM, l’agence web ebizproduction / bluedrop.fr a développé la plateforme web Drupal ayant pour but la sauvegarde de la translittération trilingue d’ontologies notamment en français, en arabe et en anglais.
Les partenaires du projet STORM ont reçu le soutien financier du Fonds national pour la Société Numérique (FSN) Dans le cadre de l’Appel à Projets « Technologies des contenus numériques ».
Le projet
La société de solutions progicielles et de gestion de traitement de données hétérogènes Armadillo, a initié le projet STORM en partenariat avec les laboratoires InVisu du CNRS et de l’INHA, et ELLIADD de l’Université de Franche Comté. L’objectif du projet STORM est de mettre en place une solution multilingue pour la gestion et la diffusion de collections numériques culturelles en plusieurs langues dont l’arabe, l’anglais, le français. D’autre part, le projet consiste également à la création d’une application open data basée sur les technologies du web sémantique dont le format RDF et le langage SparQL.
Pourquoi le web sémantique ?
Le web sémantique s’est imposé comme technologie incontournable pour la diffusion de la richesse patrimoniale et culturelle dont la langue. Le projet STORM s’appuie sur les dernières innovations du web sémantique et du Big Data. Standardisé par le W3C, le web sémantique propose un modèle qui permet de partager et de réutiliser les données entre plusieurs applications ou utilisateurs. Le web sémantique repose sur l’utilisation de formats de données et de protocoles d’échange normés sur le web dont le format basique : le RDF. Ce format est destiné à décrire de façon formelle les ressources web et leurs métadonnées pour un traitement automatique. Quant au langage de requête SparQL, celui-ci permet de rechercher, d’ajouter, de modifier voire de supprimer les données RDF.
Notre mission : La plateforme Drupal
Notre intervention dans ce projet concernait le développement de la plateforme web multilingue sur Drupal 7 en s’appuyant sur les technologies triplestore d’Armadillo qui fournit une base de données allouée au stockage et à la récupération des données RDF. Par ailleurs, la plateforme dispense d’un moteur de recherche linguistique Nooj du laboratoire ELLIAD.
La plateforme permet de trouver les translittérations (arabe, français, anglais) d’un mot clé saisi dans la barre de recherche. Les résultats proposent également une orthographe différente ou des mots issus dont la signification est proche pour une meilleure translittération et une identification juste d’un objet.
Prenons l’exemple du mot « habitation » :
La plateforme propose également la lecture des informations concernant ce mot, les relations avec d’autres mots et même des documents associés au mot.
Lexique pour aller plus loin :