Con foco en la autonomía tecnológica, la diversidad cultural y el acceso abierto, el primer modelo de lenguaje regional busca posicionar a América Latina como protagonista en el desarrollo de inteligencia artificial.
Más de 30 instituciones de 12 países trabajan en conjunto para desarrollar LatamGPT, el primer modelo de lenguaje de gran escala entrenado con datos representativos de América Latina y el Caribe.
Se trata de un proyecto colaborativo, gratuito y de código abierto, liderado por el Centro Nacional de Inteligencia Artificial (CENIA) y respaldado por el Ministerio de Ciencia, Tecnología, Innovación y Conocimiento de Chile, que busca generar capacidades propias en inteligencia artificial con un enfoque regional.
A través de una red de universidades, centros de investigación, organismos públicos y expertos de toda la región, LatamGPT se construye de forma colectiva para responder a un desafío común: reducir la dependencia tecnológica de modelos desarrollados mayoritariamente en el hemisferio norte, en contextos ajenos a la realidad latinoamericana, y avanzar hacia una IA contextualizada y al servicio de las personas.
“Es un esfuerzo colectivo y abierto, que es reflejo de lo que esperamos sea este modelo de lenguaje. Cuando hablamos de IA ésta tiene que proyectar el mundo que somos, su diversidad. Y en el caso de Latinoamérica, no solo hablar español o portugués, sino que entender nuestra idiosincrasia, aportar desde la cultura y desde la visión del mundo”, señaló la ministra de Ciencia de Chile, Aisén Etcheverry.
LatamGPT se entrena con datos provenientes de la propia región, recopilados por instituciones locales. Esto permite representar de manera más precisa las particularidades culturales y sociales de América Latina y el Caribe.
“Uno de los problemas que tenemos en Latinoamérica y el Caribe es que los LLM (Large Language Model) que usamos son bastante limitados en el conocimiento que tienen sobre la región. Es importante que acá podamos desarrollar capacidades para tener cierta independencia y tomar decisiones de cómo esta tecnología impacta a la sociedad. Hasta el momento no tenemos un modelo de lenguaje regional”, explicó Álvaro Soto, director de CENIA.
Una de las prioridades del proyecto es fomentar la preservación de lenguas originarias, incorporando datos en lenguas indígenas y dialectos locales. Ya se cuenta, por ejemplo, con pilotos con lengua Rapa Nui y Mapudungún.
Se espera que el modelo tenga aplicaciones concretas en áreas clave como educación, salud, servicios públicos o desarrollo económico, con versiones adaptadas a distintas necesidades y capacidades técnicas.
El modelo se entrena sobre una infraestructura de supercómputo en centros como la Universidad de Tarapacá de Chile.
Conceptos clave de LatamGPT
Soberanía tecnológica: busca que los países de la región puedan desarrollar tecnologías estratégicas basadas en sus propios datos y conocimientos.Colaboración regional: más de 60 investigadores e investigadoras de países como Argentina, Colombia, México y Uruguay participan activamente en el diseño, entrenamiento y validación del modelo.
Entrenamiento con datos locales: el modelo se basa en información curada por cada país participante, lo que mejora su precisión y pertinencia para contextos latinoamericanos.
Acceso abierto: LatamGPT será gratuito, inclusivo y de carácter público, facilitando el acceso a tecnologías avanzadas en toda la región.
Enfoque ético: se resguardan los principios de privacidad, diversidad y uso responsable de los datos, cumpliendo con las normativas vigentes.
LatamGPT no solo es una herramienta tecnológica: es también un símbolo de lo que puede lograr América Latina cuando sus países trabajan unidos en torno a un objetivo común. Una inteligencia artificial hecha por y para la región.