Accueil » Les projets IMPACT » Open Language and Knowledge for Citizens – OLKi

Open Language and Knowledge for Citizens – OLKi

Contexte sociétal

Le projet OLKi est d’abord ancré dans un contexte sociétal où s’exprime une inquiétude et une incompréhension grandissante de la part des citoyens vis-à-vis de l’intelligence artificielle, inquiétude nourrie par des scandales répétés et médiatisés menant à une méfiance et au risque de rejet de l’Intelligence Artificielle (IA) dans son ensemble. Cette incompréhension s’étend au-delà de la sphère citoyenne et affecte la communauté scientifique elle-même, qui ne prend pas toujours la mesure de l’importance des données, en particulier langagières, et laisse s’écouler ce flux de richesse hors de nos frontières au seul bénéfice de quelques acteurs accaparant l’ensemble des données citoyennes et de recherche.

Consortium de recherche

Le projet OLKi est porté par cinq laboratoires fondateurs :

  • Le LORIA pour les aspects informatiques et intelligence artificielle
  • L’ATILF pour les notions de linguistique
  • L’IECL pour la formalisation mathématique, notamment concernant l’apprentissage automatique
  • Les Archives Henri Poincaré pour les questions épistémologiques et éthiques
  • Le CREM pour les questions d’usage des médias et des réseaux sociaux

Le comité opérationnel du projet est ainsi composé de deux membres de chaque laboratoire et animé par Christophe Cerisara, chercheur CNRS au LORIA et Aurore Coince, chargée de projet et de partenariat (aurore.coince@univ-lorraine.fr).

Chiffres clés

6

doctorants

4

Post-doctorants

57

Scientifiques impliqués

1,5 M€

de budget

(69% masse salariale, 29% fonctionnement, 2% Investissement)

+ de 120

publications sur HAL

Contexte scientifique

A ce contexte sociétal s’ajoute un contexte scientifique marqué par le raz de marée des méthodes d’apprentissage profond (deep learning) et de ses applications en particulier dans le domaine du traitement automatique du langage naturel et de l’intelligence artificielle.

OLKi s’inscrit pleinement dans ce contexte en participant à la conception de nouveaux algorithmes d’apprentissage automatique dédiés à l’extraction de connaissance à partir des données langagières, mais en mettant l’accent sur la transparence et le caractère explicable des algorithmes, la science ouverte et respectueuse de la vie privée.

Objectifs

Développer de nouveaux algorithmes améliorant la compréhension automatique de documents en langage naturel. Une importance particulière sera donnée à la possibilité d’interpréter les connaissances apprises par ces algorithmes, à la transparence et à l’ouverture des algorithmes ainsi qu’au caractère interdisciplinaire des recherches.

Développer une plateforme de diffusion de ressources langagières fédérée pour permettre et faciliter la mise en commun des ressources ouvertes utiles aux scientifiques.

Offrir aux usagers de la plateforme des fonctionnalités de communication instantanée dédiées à la recherche scientifique (par ex. équations, courbes…) et aux ressources langagières (liens vers les ressources, extraction d’exemples…). Cette plateforme intègrera l’actuel Fediverse et y ajoutera une nouvelle modalité scientifique.

Plateforme

Le projet ambitionne de développer une plateforme de communication et d’hébergement de ressources scientifiques.