Journées du Logiciel Libre 2019

»Documenter la transition : valoriser les réflexions de la société civile avec Scrutari«
2019-04-06, 11:00–12:00, Salle danse 1er étage

Un moteur de recherche qui traite du fond, pas du flux... et qui ne pense pas à notre place !

Déroulé de la présentation

0. Contexte et présentation des intervenant·es, par pyg (5')

1. Présentation politique de la COREDEM et de Scrutari, par Mathieu (10')

La Coredem, pour documenter la transition

Né d’un projet commun entre la FPH (Fondation Charles Léopold Mayer pour le Progrès de l’Homme) et Ritimo en 2009, le projet Coredem rassemble des organisations qui ont décidé de se fédérer, de mutualiser leurs informations et analyses et de faciliter l’accès à leurs ressources documentaires respectives touchant aux questions de justice sociale et environnementale, d'accès aux droits, de solidarité internationale et de démocratie globale.

La capacité à produire du savoir et de la connaissance est depuis toujours un enjeu fondamental de la construction de sociétés démocratiques. En effet, la capacité des différents acteurs à faire entendre leur voix, à peser au moment d'interpréter les évènements et d'écrire le récit de histoire commune, influe sur la façon dont une société s'appréhende elle-même et le monde autour, et donc la direction de notre évolution commune. C'est pourquoi la société civile, à travers ses diverses organisations, espaces de travail, recherches, mobilisations et collaborations œuvre à produire de l'information, des analyses propres et indépendantes des intérêts des puissants, et à la diffuser.

Donner de la visibilité à l’information que nous produisons, à notre version de l’histoire collective partagée, est vital pour peser sur la direction que prend notre destin humain partagé. De la même façon, savoir stocker, valoriser et faciliter l’accès à ce stock d’informations, sous forme de ressources documentaires, pour leur utilisation future, c’est gérer notre mémoire collective ; dans un temps où l’information devient du prêt-à-consommer, savoir enregistrer la mémoire sur le long terme et la mettre à disposition, c’est aussi résister.

Ainsi, Coredem est un projet et une proposition de mutualisation de l’information : un système de partage et de mise en relation des données afin d'amplifier leur impact et leur traçabilité dans le temps. En valorisant l’information que nous produisons et en travaillant en réseau, nous construisons la mémoire collective de celles et ceux qui (aspirent à et) construisent au quotidien un monde plus juste et plus durable.

Scrutari, le moteur de recherche qui ne pense pas à votre place !

La question de l’accès à une information fiable, diverse et de qualité est plus que jamais un enjeu crucial pour les processus démocratiques du XXIe siècle. Dans un temps où nous sommes noyé·e·s par la sur-abondance d’information, où les « fake-news » déstabilisent la confiance des citoyen·ne·s en l’information qui leur parvient, et où la diversité des opinions est étouffée par la concentration économique de producteur·rice·s de l’information, Scrutari se veut être un outil au service de la recherche d’information autonome et critique.

D’une part, tous les sites qui participent au projet fournissent, en amont de la mise en ligne/en réseau de leur information, à un travail de sélection et de vérification de l’information, sur la forme comme sur le fond. Utiliser le moteur de recherche Coredem, c’est donc être assuré·e de la fiabilité des résultats proposés.

D’autre part, c’est un moteur de recherche « anti-bruit » : moins de résultats, mais des résultats plus pertinents, grâce à un référencement par les principaux mots du titre, du sous-titre, et la prise en compte des mots-clés des documents. Un gain de temps et d’énergie précieux pour celles et ceux en recherche constante d’information.

Le moteur de recherche Scrutari traite du fond, pas du flux : il donne accès à des analyses, de la réflexion critique, autonome et indépendante des grands groupes d’intérêts économico-médiatiques. Cette garantie de la qualité de l’information est non négligeable.

De plus, Scrutari est un logiciel libre, offrant à chacun·e la possibilité de construire son propre moteur de recherche en s'inspirant de la démarche de la Coredem.

Enfin, si les moteurs de recherche hégémoniques ont tendance à nous enfermer dans des « bulles », nous renvoyant systématiquement à des sources similaires à celles qu’on a l’habitude de consulter, Scrutari parie au contraire sur la capacité des lecteur·rice·s à tirer leurs propres conclusions face aux diverses sources proposées par les organisations qui participent à ce projet.

2. Présentation technique de Scrutari et démonstrations, par Vincent (25-30')

Scrutari : du fond, pas du flux !

Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta-données transmises par les sites abonnés et non sur les documents des site eux-mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques. L'objectif est de sacrifier l'exhaustivité au bénéfice de la pertinence. En particulier, Scrutari permet de maitriser l'algorithme de recherche et donc de maitriser l'ordre des résultats (par exemple, pour mettre en avant les documents qui sont estimés les plus importants).

Sous le capot

Le système Scrutari est divisé en trois parties bien distinctes :

  1. Le format ScrutariData de description des méta-données d'un site. Ce format fait la part belle aux titres et sous-titres et à l'indexation par des mots-clés. C'est un format défini en XML ; il peut donc être implémenté pour n'importe quel site et quelque soit le langage de programmation (comme le sont les flux RSS).
  2. Le serveur Scrutari qui recueille les méta-données au format ScrutariData transmises par les sites abonnés au serveur et qui traite les requêtes envoyées par les clients du serveur. En plus des recherches libres classiques (i·e· des mots saisis directement par l'utilisateur), le serveur Scrutari propose également des outils d'analyse des méta-données (comparaison entre thésaurus, statistiques, etc.). Le serveur Scrutari est écrit en Java et s'appuie sur le moteur de servlets Tomcat.
  3. Les clients de Scrutari qui communiquent avec le serveur Scrutari via des requêtes HTTP classiques en utilisant un format XML spécifique ou un format simplifié en texte brut (le protocole SimpleScrutari). Les clients Scrutari peuvent donc être développés dans n'importe quel langage de programmation. Deux clients sont actuellement disponibles : un client simple en PHP conçu pour s'intégrer facilement dans un site web et un client en XUL conçu comme une extension de Firefox.

Ces trois parties du système Scrutari communiquent entre elles via des formats texte (XML ou format SimpleScrutari) suivant le protocole HTTP. Aussi n'y a-t-il aucune contrainte quant au langage de programmation utilisé du moment que ce langage est capable d'écrire du texte, d'analyser du XML et de communiquer via HTTP. Le choix du langage se fera donc à la convenance du développeur. On pourra ainsi tout aussi bien développer son propre client que se passer du serveur Scrutari pour lire directement les fichiers XML au format ScrutariData fourni par les sites.

Démonstrations

  • Réalisation de requêtes sur un moteur de recherche classique (type Qwant, histoire de troller gentillement Tristan Nitot ;-) : "justice climatique", "transition énergétique", "société durable", par exemple
  • Exécution des mêmes requêtes sur Scrutari
  • Comparaison des résultats et des sources
  • Production des graphes de ces requêtes

3. Mot de conclusion sur la nécessité de renforcer l'interconnaissance et les alliances entre libristes et acteur·rices de la transition (justice sociale et environnementale, accès aux droits, solidarité internationale), par pyg (5')

42. Q&A (10-15')

Liens

COREDEM et Ritimo

Scrutari