Solucionando o dilema do 'Whac-a-mole': uma maneira mais inteligente de remover o viés dos modelos de visão de IA

O Desafio do Viés em Modelos de IA

No cenário atual, hospitais e clínicas estão utilizando modelos de inteligência artificial (IA) para classificar lesões cutâneas, determinando se são benignas ou se apresentam risco de desenvolver câncer. Entretanto, se um modelo for enviesado em relação a certos tons de pele, ele pode falhar em identificar pacientes de alto risco. Este é apenas um dos inúmeros exemplos que ilustram o desafio do viés, uma questão persistente que a pesquisa em IA continua a enfrentar.

O Dilema do 'Whac-A-Mole'

O viés nos modelos de IA é frequentemente discutido em relação aos dados de treinamento; no entanto, a arquitetura do modelo também pode conter e amplificar esse viés, afetando negativamente o desempenho em cenários do mundo real. Em casos de alta responsabilidade, como na medicina, as consequências do baixo desempenho transformam o viés em uma questão crítica de segurança. Um novo artigo de pesquisadores do MIT, Worcester Polytechnic Institute, e Google, aceito para a Conferência Internacional de Representações Aprendidas de 2026, propõe uma abordagem inovadora de desenviesamento chamada Weighted Rotational DebiasING (WRING).

Como Funciona o WRING?

O WRING pode ser aplicado a modelos de linguagem visual (VLMs), como o OpenAI's OpenCLIP. Esses modelos são multimodais, capazes de entender e interpretar diferentes modalidades de dados como vídeo, imagem e texto simultaneamente. Embora abordagens de desenviesamento para VLMs já existam, a mais utilizada é a projeção de desenviesamento, que levam ao que foi chamado de “dilema do Whac-A-Mole”.

A projeção de desenviesamento é uma abordagem de pós-processamento que remove informações enviesadas das representações do modelo, projetando subespaços fora do espaço de representação de relações, o que corta o viés. Contudo, essa abordagem tem suas desvantagens. “Quando você faz isso, inadvertidamente comprime tudo ao redor”, diz Walter Gerych, primeiro autor do artigo. “Todas as outras relações que o modelo aprende mudam quando você faz isso.”

O WRING, por sua vez, move certas coordenadas dentro do espaço de alta dimensão de um modelo — aquelas que parecem ser responsáveis pelo viés — para um ângulo diferente, de forma que o modelo já não consiga distinguir entre diferentes grupos dentro de um certo conceito. Isso muda a representação dentro de um espaço específico enquanto mantém intactas as outras relações do modelo.

Resultados Promissores e Futuro

As descobertas dos pesquisadores mostraram que o WRING reduziu significativamente o viés em um conceito-alvo sem aumentar o viés em outras áreas. Por enquanto, a abordagem está limitada a modelos CLIP, que conectam imagens a linguagem para busca ou classificação. “Expandir isso para modelos de linguagem generativa estilo ChatGPT é o próximo passo razoável para nós”, afirma Gerych.

Com resultados promissores e uma abordagem eficiente e minimamente invasiva, o WRING representa um avanço considerável na luta contra o viés em modelos de IA. Essa pesquisa é apoiada em parte por prêmios prestigiados como o National Science Foundation CAREER Award e o MIT-Google Computing Innovation Award.

O viés em IA não é apenas uma questão técnica, mas um desafio prático que exige soluções inovadoras e eficazes. O trabalho contínuo nesta área não só melhora o desempenho dos modelos de IA, mas também garante uma aplicação mais justa e segura em áreas críticas como a saúde.

Escrito por Equipe Portal CTMC