A Comissão da União Europeia apresentou, nesta terça-feira, 4, um novo modelo de inteligência artificial chamado OpenEuroLLM. Este projeto visa diminuir a dependência da região em relação a empresas de IA que geralmente estão localizadas nos Estados Unidos ou na China. O objetivo principal do OpenEuroLLM é desenvolver a primeira família de modelos de linguagem de código aberto, com suporte para todos os idiomas dos países participantes da União Europeia.
Com um investimento total de 37,4 milhões de euros, dos quais mais de 20 milhões foram financiados pelo Programa Europa Digital, criado em 2021, o projeto busca fomentar a pesquisa em tecnologia na União Europeia e reduzir a dependência tecnológica da zona do Euro. O OpenEuroLLM estabelece uma parceria entre centros de pesquisa, empresas e conglomerados europeus especializados em Computação de Alto Desempenho (HPC), sendo o primeiro conglomerado financiado pela DIGITAL a receber o selo de reconhecimento pela Plataforma de Tecnologias Estratégicas Europeia (STEP).
O projeto tem como meta construir um Grande Modelo de Linguagem (LLM) de última geração, comparável às atuais líderes do mercado, como ChatGPT (OpenAI), Gemini (Google), DeepSeek, Hunyuan (Tencent) e Ernie (Baidu). Além de replicar funções existentes, a iniciativa busca desenvolver capacidades únicas, atendendo às demandas específicas da União Europeia e garantindo uma IA de alta qualidade sem depender de serviços internacionais.
As principais instituições envolvidas no desenvolvimento do OpenEuroLLM incluem a Unbabel, o Instituto Superior Técnico (Portugal), o Instituto de Telecomunicações (Portugal), a Universidade de Edimburgo (Escócia), a Universidade Paris-Saclay (França), a Universidade Paris-Sorbonne (França), a Universidade de Amsterdã (Países Baixos), entre outros centros de pesquisa, empresas e startups europeias.
Inicialmente, o OpenEuroLLM estará disponível apenas para desenvolvedores no repositório do Hugging Face. Posteriormente, será lançado oficialmente como um conjunto de modelos de fundação totalmente abertos, incluindo documentação, códigos de treinamento, métricas de avaliação e conjuntos de dados de treinamento. O foco no desenvolvimento local de IA é evidente, uma vez que, apesar de ser um modelo aberto, ele também estará acessível a clientes de outras regiões que queiram uma alternativa aos modelos atuais, embora a pesquisa se concentre em resolver demandas regionais. No entanto, uma versão final pública ainda não está disponível.