|
|
|
|||||||||
|
||||||||||
|
Conception d'applications documentaires XML/SDXQuelques exemples d'applications documentaires SDX réalisées par Medusis : Archives du journal La CroixMedusis a développé l'application de recherche dans les archives du journal La Croix qui permet de chercher plus de 200 000 articles en texte intégral et par mots-clé. Les articles du journal sont enrichis par des documentalistes qui renseignent pour chaque article des descripteurs (lieux, personnes, thèmes, etc.) issus d'une liste d'autorité; cet enrichissement a lieu sur un système ancien qui produit du texte ascii structuré. Medusis a mis en place un outil de transformation des articles vers XML qui a été utilisé pour transformer le stock d'articles existants et qui continue d'être utilisé aujourd'hui pour la transformation de la production quotidienne du journal. L'application est rapidement devenue l'un des outils de travail des journalistes au quotidien, qui, tout comme les internautes, peuvent directement accéder aux archives du journal depuis leur poste de travail; ils ont en outre accès au chemin de fer du journal de chaque jour, directement depuis les résultats de recherche. Début 2004, l'application, qui tournait sous SDX 2.0 est passée sous SDX 2.2 et s'est enrichie d'une génération de fichiers PDF dynamiques (à l'intérieur desquels les mots-clé de la recherche sont mis en valeur). Moteur de recherche Notre TempsMedusis a développé le moteur de recherche du site Notre Temps: les articles du site, générés par un système propriétaire, sont extraits quotidiennement dans un format XML qui regroupe leurs méta-données et leur contenu, et indexés, de telle sorte que l'index cherchable ne contient que le corps de chaque article, ce qui rend la recherche très pertinente. (Au contraire, un index résultant du travail d'un spider classique contiendrait des éléments de mise en page, répétés d'un article à l'autre, et que le spider ne pourrait pas distinguer du contenu original de l'article.) Correspondance du père d'AlzonLe père Emmanuel d'Alzon est le fondateur de la Congrégation des Augustins de l'Assomption; entre 1810 et 1880, il a écrit plus de 8000 lettres qui ont été recueillies, mises en forme et indexées par des pères de la congrégation. Leur mise en ligne était un projet de longue date qui se heurtait à la difficulté de trouver un moteur performant et bon marché (coût de licence et coût d'exploitation). Les performances de SDX et l'expérience de Medusis ont permis de mener à bien le projet de mise en ligne des lettres du père d'Alzon dans un délai particulièrement court et pour un budget maîtrisé. L'application permet d'utiliser le rebond sur mot-clé, la recherche croisée par champs ainsi que la génération de PDF dynamiques. La Documentation CatholiqueSuite au succès des archives La Croix, Medusis a été chargée de développer l'application de recherche et de consultation des articles de La Documentation Catholique. Cette application repose sur les mêmes principes que celle des archives La Croix mais a nécessité de mettre au point un outil de transformation des articles d'un format HTML "lâche" vers XML; cette transformation est effectuée entièrement par une succession de feuilles XSL, après un "nettoyage" du HTML par tidy. |
| Medusis, maison fondée à Paris en 1999. |