Journée Communs du Numérique et IA
Wikimédia Canada et l’INRS organisent la Journée Communs du Numérique et IA le 1er novembre 2024 à l’Hôtel Concorde, dans la ville de Québec, avec le soutien du Consulat Général de France à Québec et du CRIHN.
Cette journée vise à ouvrir une discussion sur la place des communs de la connaissance comme ressource d’entraînement pour les IA dans les territoires francophones. Les grands modèles de langue (LLM, tels que ceux à la base de services comme ChatGPT) présentent un biais anglo-saxon, car ils sont majoritairement entraînés sur des corpus anglophones. L’entraînement d’IA sur des corpus dans d’autres langues, dont le français, mais aussi les langues des territoires francophones (langues autochtones, langues régionales), revêt donc une importance cruciale pour le maintien de la diversité culturelle dans l’accès au savoir que ces nouveaux outils rendent possible. Ce défi est présenté dans les politiques publiques québécoises et françaises comme un enjeu de souveraineté.
Cet événement s’inscrit dans le cadre de la WikiConvention francophone, qui se déroulera le 2 et 3 novembre au même endroit.
Les communs de la connaissance, et en particulier les projets Wikimédia (dont l’encyclopédie Wikipédia et les ressources orales de Lingua Libre), constituent des données précieuses pour l’entraînement d’IA dans des langues à ressources limitées. De même, les fonds patrimoniaux (bibliothèques et archives nationales, fonds audiovisuels) sont convoités pour entraîner des IA francophones. Dans les deux cas (communs de la connaissance et domaine public), se pose la question des types de relations (économiques, juridiques et éthiques) à construire avec les acteurs de l’industrie de l’IA.
Le dialogue entre les projets Wikimédia et les établissements publics patrimoniaux concernant ces enjeux reste très limité à ce jour. Or, il est crucial d’approfondir ces échanges à un moment où se cristallisent des relations et des modèles qui auront un impact sur les années à venir. Cette journée vise à rassembler des acteurs des communs, des acteurs publics et des acteurs industriels de l’IA pour dialoguer et envisager de nouvelles pistes de collaboration.
Deux axes sont proposés pour creuser ces enjeux :
– Communs et domaine public : au-delà de la fourniture de données pour l’entraînement des modèles, quelles relations durables ?
– La diversité linguistique et culturelle dans les modèles d’IA : quelle contribution des communs et du domaine public ?
Programme :
9:00 – 9:15 | Ouverture de la journée par Louis Germain, directeur général de Wikimédia Canada et Maryana Iskander, PDG de la Fondation Wikimédia (intervention vidéo) |
9:15-10:15 | Panel – Quelles relations entre Wikimédia et les grands modèles de langue (LLMs) ? Animation par Jenny Ebermann, directrice exécutive de Wikimédia Suisse Intervenantes et intervenants : – Rémy Gerbet, directeur exécutif de Wikimédia France – Anastasia Stasenko par zoom, co-fondatrice de la start-up pleias – Liam Wyatt, gestionnaire de programme à Wikimedia Enterprise |
10:15-10:45 | Pause |
10:45 – 11:45 | Panel – Bibliothèques francophones et corpus d’entraînement des IA Animation par Nathalie Casemajor, professeure à l’Institut national de la recherche scientifique Intervenantes et intervenants : – Jean-Philippe Moreux, chef de mission IA à la Bibliothèque nationale de France – Viriya Thach, responsable du secteur stratégie numérique et intelligence d’affaires à Bibliothèque et Archives nationales du Québec – Daniel van Strien, machine learning librarian à Hugging Face (intervention vidéo) |
11:45 – 12:30 | Atelier – Enjeux communs entre Wikimédia et acteurs publics Animation par Nathalie Casemajor, professeure à l’Institut national de la recherche scientifique |
12:30 – 14:00 | Pause du midi |
14:00 – 15:00 | Panel – Diversité dans les IA francophones Animation par Ayla Rigouts Terryn, professeure à l’Université de Montréal Intervenantes et intervenants : – Lucie Gianola, chargée de mission pour les technologies, la recherche et l’innovation à la Délégation générale à la langue française et aux langues de France, Ministère de la Culture, France – Thomas Mboa, chercheur en résidence au Centre d’expertise international de Montréal en intelligence artificielle – Stéphane Nepton, coordonnateur de projet au Printemps numérique, ambassadeur numérique autochtone |
15:00 – 15:15 | Pause |
15:15 – 16:15 | Atelier – Pistes d’action croisée pour le futur |
16:15 – 16:30 | Clôture de la journée |