Cette page présente des informations sur l'IA du point de vue de l'Université d'Ottawa. Des chercheuses et chercheurs de l'Université d'Ottawa sont impliqués depuis des années dans la recherche sur l'intelligence artificielle. Après le lancement de ChatGPT en 2022, l'Université et le Service d'appui à l'enseignement et à l'apprentissage (SAEA) ont rapidement suivi avec des conseils sur l'intégrité académique et sur l'enseignement et l'apprentissage liés à l'IA générative. Enfin, l'Université d'Ottawa, en tant qu'établissement fièrement bilingue, s'intéresse particulièrement à la manière dont les outils d'IA générative fonctionnent différemment dans différentes langues.
La plupart des outils d'IA générative les plus connus sont principalement entraînés en anglais. Par exemple, les données issues de l'exploration du web de Common Crawl, qui sont utilisées comme partie du corpus d'entraînement de la plupart des grands modèles de langage, comprennent plus de 45 % de données en anglais, moins de 5 % de données en français et moins d'un millième de pour cent pour les langues autochtones d'Amérique du Nord identifiées combinées.
Dans sa FAQ pour les éducatrices et éducateurs, OpenAI reconnaît que le modèle de ChatGPT « est orienté vers les points de vue occidentaux et fonctionne mieux en anglais. Certaines mesures visant à prévenir les contenus nuisibles n'ont été testées qu'en anglais ». Bien que des modèles linguistiques tels que Cedille soient en cours de développement pour le français et d'autres langues, les outils d'IA générative les plus connus continuent de surreprésenter l'anglais et de sous-représenter d'autres langues. De telles inégalités linguistiques suscitent des préoccupations au sein de l'Université d'Ottawa, établissement bilingue.