Journées du Logiciel Libre 2023

Web scrapping : retrospective et leçons tirées de l'intégration de 675 sources à Meta-Press.es
02/04/2023 , Salle des possibles

Florilège de bizarreries qu'on croise vraiment sur le web…


Analyser une page web à partir de JavaScript dans une WebExtension, ça avait l'air simple pourtant !
Oui, mais le serveur il répond du JSONP en fait et le content-type ment comme un patient du DrHouse ! En plus y'a d'abord une redirection et puis le charset, bah c'est pas UTF8 … T_T
Florilège de ce que l'humanité fait vraiment du web dans 64 pays et 71 langues…


Intervention tout public – non Catégorie de public visée

Particulier, Associatif, Entreprise

Nom de l'association ou entreprise

Meta-Press.es