6 avr. , 11:00–12:00 (Europe/Paris), Salle danse 1er étage
Un moteur de recherche qui traite du fond, pas du flux... et qui ne pense pas à notre place !
Déroulé de la présentation
0. Contexte et présentation des intervenant·es, par pyg (5')
1. Présentation politique de la COREDEM et de Scrutari, par Mathieu (10')
La Coredem, pour documenter la transition
Né d’un projet commun entre la FPH (Fondation Charles Léopold Mayer pour le Progrès de l’Homme) et Ritimo en 2009, le projet Coredem rassemble des organisations qui ont décidé de se fédérer, de mutualiser leurs informations et analyses et de faciliter l’accès à leurs ressources documentaires respectives touchant aux questions de justice sociale et environnementale, d'accès aux droits, de solidarité internationale et de démocratie globale.
La capacité à produire du savoir et de la connaissance est depuis toujours un enjeu fondamental de la construction de sociétés démocratiques. En effet, la capacité des différents acteurs à faire entendre leur voix, à peser au moment d'interpréter les évènements et d'écrire le récit de histoire commune, influe sur la façon dont une société s'appréhende elle-même et le monde autour, et donc la direction de notre évolution commune.
C'est pourquoi la société civile, à travers ses diverses organisations, espaces de travail, recherches, mobilisations et collaborations œuvre à produire de l'information, des analyses propres et indépendantes des intérêts des puissants, et à la diffuser.
Donner de la visibilité à l’information que nous produisons, à notre version de l’histoire collective partagée, est vital pour peser sur la direction que prend notre destin humain partagé. De la même façon, savoir stocker, valoriser et faciliter l’accès à ce stock d’informations, sous forme de ressources documentaires, pour leur utilisation future, c’est gérer notre mémoire collective ; dans un temps où l’information devient du prêt-à-consommer, savoir enregistrer la mémoire sur le long terme et la mettre à disposition, c’est aussi résister.
Ainsi, Coredem est un projet et une proposition de mutualisation de l’information : un système de partage et de mise en relation des données afin d'amplifier leur impact et leur traçabilité dans le temps. En valorisant l’information que nous produisons et en travaillant en réseau, nous construisons la mémoire collective de celles et ceux qui (aspirent à et) construisent au quotidien un monde plus juste et plus durable.
Scrutari, le moteur de recherche qui ne pense pas à votre place !
La question de l’accès à une information fiable, diverse et de qualité est plus que jamais un enjeu crucial pour les processus démocratiques du XXIe siècle. Dans un temps où nous sommes noyé·e·s par la sur-abondance d’information, où les « fake-news » déstabilisent la confiance des citoyen·ne·s en l’information qui leur parvient, et où la diversité des opinions est étouffée par la concentration économique de producteur·rice·s de l’information, Scrutari se veut être un outil au service de la recherche d’information autonome et critique.
D’une part, tous les sites qui participent au projet fournissent, en amont de la mise en ligne/en réseau de leur information, à un travail de sélection et de vérification de l’information, sur la forme comme sur le fond. Utiliser le moteur de recherche Coredem, c’est donc être assuré·e de la fiabilité des résultats proposés.
D’autre part, c’est un moteur de recherche « anti-bruit » : moins de résultats, mais des résultats plus pertinents, grâce à un référencement par les principaux mots du titre, du sous-titre, et la prise en compte des mots-clés des documents. Un gain de temps et d’énergie précieux pour celles et ceux en recherche constante d’information.
Le moteur de recherche Scrutari traite du fond, pas du flux : il donne accès à des analyses, de la réflexion critique, autonome et indépendante des grands groupes d’intérêts économico-médiatiques. Cette garantie de la qualité de l’information est non négligeable.
De plus, Scrutari est un logiciel libre, offrant à chacun·e la possibilité de construire son propre moteur de recherche en s'inspirant de la démarche de la Coredem.
Enfin, si les moteurs de recherche hégémoniques ont tendance à nous enfermer dans des « bulles », nous renvoyant systématiquement à des sources similaires à celles qu’on a l’habitude de consulter, Scrutari parie au contraire sur la capacité des lecteur·rice·s à tirer leurs propres conclusions face aux diverses sources proposées par les organisations qui participent à ce projet.
2. Présentation technique de Scrutari et démonstrations, par Vincent (25-30')
Scrutari : du fond, pas du flux !
Scrutari est un moteur de recherche destiné à effectuer des recherches sur un nombre précis de sites (les sites « abonnés »). Sa particularité est de baser sa recherche sur les méta-données transmises par les sites abonnés et non sur les documents des site eux-mêmes (pages HTML, fichier PDF, etc.), contrairement aux moteurs de recherche classiques. L'objectif est de sacrifier l'exhaustivité au bénéfice de la pertinence. En particulier, Scrutari permet de maitriser l'algorithme de recherche et donc de maitriser l'ordre des résultats (par exemple, pour mettre en avant les documents qui sont estimés les plus importants).
Sous le capot
Le système Scrutari est divisé en trois parties bien distinctes :
- Le format ScrutariData de description des méta-données d'un site. Ce format fait la part belle aux titres et sous-titres et à l'indexation par des mots-clés. C'est un format défini en XML ; il peut donc être implémenté pour n'importe quel site et quelque soit le langage de programmation (comme le sont les flux RSS).
- Le serveur Scrutari qui recueille les méta-données au format ScrutariData transmises par les sites abonnés au serveur et qui traite les requêtes envoyées par les clients du serveur. En plus des recherches libres classiques (i·e· des mots saisis directement par l'utilisateur), le serveur Scrutari propose également des outils d'analyse des méta-données (comparaison entre thésaurus, statistiques, etc.). Le serveur Scrutari est écrit en Java et s'appuie sur le moteur de servlets Tomcat.
- Les clients de Scrutari qui communiquent avec le serveur Scrutari via des requêtes HTTP classiques en utilisant un format XML spécifique ou un format simplifié en texte brut (le protocole SimpleScrutari). Les clients Scrutari peuvent donc être développés dans n'importe quel langage de programmation. Deux clients sont actuellement disponibles : un client simple en PHP conçu pour s'intégrer facilement dans un site web et un client en XUL conçu comme une extension de Firefox.
Ces trois parties du système Scrutari communiquent entre elles via des formats texte (XML ou format SimpleScrutari) suivant le protocole HTTP. Aussi n'y a-t-il aucune contrainte quant au langage de programmation utilisé du moment que ce langage est capable d'écrire du texte, d'analyser du XML et de communiquer via HTTP. Le choix du langage se fera donc à la convenance du développeur. On pourra ainsi tout aussi bien développer son propre client que se passer du serveur Scrutari pour lire directement les fichiers XML au format ScrutariData fourni par les sites.
Démonstrations
- Réalisation de requêtes sur un moteur de recherche classique (type Qwant, histoire de troller gentillement Tristan Nitot ;-) : "justice climatique", "transition énergétique", "société durable", par exemple
- Exécution des mêmes requêtes sur Scrutari
- Comparaison des résultats et des sources
- Production des graphes de ces requêtes
3. Mot de conclusion sur la nécessité de renforcer l'interconnaissance et les alliances entre libristes et acteur·rices de la transition (justice sociale et environnementale, accès aux droits, solidarité internationale), par pyg (5')
42. Q&A (10-15')
Liens
COREDEM et Ritimo
- Le site web de la COREDEM : https://www.coredem.info/
- Le site web de Ritimo : https://www.ritimo.org/
- La base documentaire du réseau Ritimo, la Ritimothèque : http://www.ritimo.fr/opac_css/
Scrutari
- Le moteur de recherche (passera en httpS d'ici aux JdLL) : https://scrutari.coredem.info/
- Le code source de Scrutari : https://framagit.org/Scrutari
- La documentation de Scrutari : http://www.scrutari.net/dokuwiki/
Mathieu Wostyn est agitateur numérique au sein du réseau Ritimo, un réseau qui fédère, depuis plus de 30 ans, 70 lieux et organisations ouvert·es au public (centres de documentation, lieux ressources, médias et projets documentaires en ligne…) qui informent, mobilisent et agissent pour la solidarité internationale.
Directeur et délégué général de Framasoft
Coordinateur des projets « Dégooglisons Internet » et « Contributopia »
Vincent Calame est développeur informatique. Il est l'un des fondateurs d'Exemole, une SARL qui œuvre dans le domaine de la structuration de l’information. Il a développé les logiciels libres Desmodo, un outil cartographique de mise en relations de concepts qui peut notamment être utilisé comme alternative au compte-rendu de réunion classique et qui facilite l’analyse transversale ; BaseDeFiches, une base de données sur serveur qui repose sur un modèle fiches-mots clés hautement configurable et Scrutari, un moteur de recherche lié aux bases de fiches mais autonome et qui permet d’agréger des données issues de bases différentes.