“Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da Inteligência Artificial", refere o coordenador do projeto, António Branco, do Departamento de Informática da Faculdade de Ciências.

O conjunto dos dois modelos "é líder mundial em termos de grandes modelos de linguagem desenvolvidos especificamente para a língua portuguesa que são totalmente abertos e documentados", refere a universidade em comunicado.

Estes modelos são de "código aberto, gratuitos e distribuídos sob uma licença aberta, e as suas características e desempenho de topo encontram-se pormenorizadamente validados e documentados em artigos científicos", o que permite que qualquer pessoa possa aceder, adianta o comunicado.

Segundo o coordenador, citado no comunicado, os dois modelos "estão na base de toda a gama de aplicações de IAG, incluindo as mais mediáticas, como os 'chatbots' ou os tradutores automáticos, e sendo maiores, têm melhor desempenho”.

António Branco destacou as parcerias já realizadas e o uso destas estruturas para o desenvolvimento de aplicações, como sucede com a start-up do MediAlbertina, "para a IA generativa aplicada à medicina em língua portuguesa".

À "família dos codificadores Albertina, foi agora acrescentado o Albertina 1.5B, o maior dos modelos desta família até ao momento, com 1.500 milhões de parâmetros". Por sua vez, "à família dos descodificadores Gervásio, foi também acrescentado um modelo maior, o Gervásio 7B, com 7.000 milhões de parâmetros, juntando-se ao modelo já existente com 1.000 milhões de parâmetros", refere a universidade.

O coordenador do primeiro grande modelo de Inteligência Artificial Generativa para a língua portuguesa considera que estas ferramentas vão ajudar na democratização e domesticação da tecnologia, porque não está nas mãos de empresas privadas, com conteúdo de acesso restrito.