Latam-GPT, le modèle d'intelligence artificielle formé pour mieux comprendre l'Amérique latine que ChatGPT

Latam-GPT, le modèle d'intelligence artificielle formé pour mieux comprendre l'Amérique latine que ChatGPT
Amérique latine et Caraïbes
ChiliChili
Éducation numérique

 

La première version de cette technologie, développée par le Chili et le Brésil en collaboration avec des professionnels d’autres pays de la région, sera lancée dans quelques semaines.

Latam-GPT
 

Latam-GPT, premier modèle linguistique d'intelligence artificielle créé au Chili en partenariat avec le Brésil, vise à concurrencer ChatGPT , Gemini, DeepSeek et d'autres technologies. Ce projet, qui se concentrera sur l'Amérique latine et les Caraïbes, a été présenté comme une étape importante par le président Gabriel Boric lors de son dernier discours public prononcé ce dimanche : « L'avenir numérique doit aussi parler notre langue, avec nos voix et pour nos peuples. »

Rodrigo Durán, directeur du Centre national d'intelligence artificielle (Cenia), l'organisation privée à but non lucratif qui a coordonné le développement de Latam-GPT, affirme que l'esprit de cette initiative n'est pas de concurrencer directement d'autres acteurs internationaux, mais plutôt d'améliorer les performances de toute solution technologique pour les pays de la région.

Le dirigeant explique qu'il ne s'agit pas simplement de créer une plateforme : « Nous souhaitons promouvoir l'adoption de ces technologies dans une perspective éthique et responsable. C'est notre objectif avec ce projet : mettre l'intelligence artificielle au service des populations d'Amérique latine. »

Un chatbot à l'identité latino-américaine

Lorsque ChatGPT a été lancé fin 2022, un groupe de chercheurs de Ceina avait déjà commencé à travailler à plein régime sur ce modèle de langage d'intelligence artificielle quelques mois plus tôt et, en deux ans, avait réussi à rassembler une multitude d'informations clés provenant de différents pays pour renforcer son algorithme.

La différence avec les autres modèles réside dans le fait qu'il sera entraîné avec une grande partie des données de la région. « Il ne sera pas plus performant pour répondre à des questions comme la biochimie ou les modèles économiques, sauf s'ils proviennent d'Amérique latine, mais sa grande force résidera dans sa connaissance du contexte local. Autrement dit, Latam-GPT en saura plus et mieux sur l'Amérique latine que tout autre modèle non entraîné avec ces données », explique Durán.

Cette technologie sera accessible gratuitement à tous, et la première version du Modèle linguistique à grande échelle (MLL) sera publiée entre juin et juillet, a déclaré le sous-secrétaire chilien aux Sciences, Cristián Cuevas Vega. « L'objectif est de refléter la diversité culturelle de l'Amérique latine. Nous cherchons également à offrir, d'une manière ou d'une autre, l'indépendance et la souveraineté technologiques à la région », a-t-il affirmé.

Le Brésil a rejoint le projet après la visite de Boric en avril, où les deux pays ont signé un protocole d'accord pour collaborer au développement de l'intelligence artificielle. Cependant, d'autres pays, comme la Colombie et le Paraguay, sont déjà intéressés par cette initiative, qui bénéficie de la collaboration de près de trente institutions de différents pays de la région, ainsi que des investissements de la Banque de développement de l'Amérique latine et des Caraïbes, anciennement connue sous le nom de Société andine de développement (CAF), et de la Fondation de l'Observatoire des données via des prêts Amazon Web Services (AWS).

Álvaro Soto, directeur du CENIA (au centre), avec l'équipe du projet Latam-GPT, qui se concentrera sur l'Amérique latine et les Caraïbes.

Le plus grand défi a été de constituer une base de données suffisamment vaste et représentative pour la région. Contrairement à des entreprises comme Google, Meta et Open IA, Cenia ne dispose pas de ses propres sources de données. C'est pourquoi elle a lancé une campagne pour inviter les centres de recherche, les institutions publiques, les archives, les bibliothèques, les universités, les organisations sociales, les maisons d'édition, les producteurs de films et les particuliers de toute la région ayant accès à de vastes volumes de données à collaborer à la formation Latam-GPT.

Les données transmises par ces organisations sont traitées et affinées au Cenia, où travaillent une douzaine de coordinateurs de différents domaines et une soixantaine de collaborateurs. Le sous-secrétaire Cuevas prévoit que ce groupe pourrait s'élargir. « Nous développons ce projet en open source [código abierto en español] afin que chacun, où qu'il soit dans le monde, puisse interagir avec notre modèle d'IA. »

S'adapter à Mapudungu et Rapanui

Au Chili, on espère adapter le modèle aux langues autochtones. Des chercheurs travaillent d'ailleurs déjà au développement d'un logiciel pour des langues telles que le mapudungu, parlé par les Mapuches du sud du Chili, et le rapanui, la langue des communautés ancestrales de l'île de Pâques. Durán indique que ce logiciel pourrait être disponible en mars 2026, sous réserve du développement d'un traducteur : « C'est complexe lorsqu'il s'agit de langues non écrites ou autochtones, qui disposent de peu de ressources écrites, car nous rencontrons de nombreux concepts sans traduction littérale. »

Pour l'instant, la première version de Latam-GPT sera disponible en espagnol, portugais et anglais. Elle devrait initialement fonctionner comme un chatbot , mais d'autres fonctionnalités pourraient être étendues ultérieurement.

Journal Maolis Castro wEl Pais, Espagne Santiago du Chili - 4 juin 2025 -