Journées du Logiciel Libre 2023

Web scrapping : retrospective et leçons tirées de l'intégration de 675 sources à Meta-Press.es
2 avr. , 13:00–13:55 (Europe/Paris), Salle des possibles

Florilège de bizarreries qu'on croise vraiment sur le web…


Analyser une page web à partir de JavaScript dans une WebExtension, ça avait l'air simple pourtant !
Oui, mais le serveur il répond du JSONP en fait et le content-type ment comme un patient du DrHouse ! En plus y'a d'abord une redirection et puis le charset, bah c'est pas UTF8 … T_T
Florilège de ce que l'humanité fait vraiment du web dans 64 pays et 71 langues…


Intervention tout public – non Catégorie de public visée

Particulier, Associatif, Entreprise

Nom de l'association ou entreprise

Meta-Press.es

La liberté ne s'use, que si on ne s'en sert pas :
- Fondateur de logiciel libre Meta-Press.es
- Trésorier du Fonds de Défense de la Neutralité du Net
- Membre d'honneur de Framasoft

Autre(s) intervention(s) de l'orateur :