declaracao-sobre-a-necessidade-de-repensar-a-ia

Há algumas semanas, a nossa fatura de infraestrutura revelou-nos algo que o nosso roteiro (roadmap) não tinha previsto. As ações automáticas de IA que mantêm o nosso ecossistema unido unificando registos duplicados de doentes e interligando eventos fragmentados numa única jornada de cuidados estavam a custar muito mais do que o valor de qualquer operação individual poderia justificar. Cada passagem de unificação corria contra modelos de grande dimensão que tinham de ser consultados na íntegra para recuperar factos que, em princípio, ocupam escassos bytes. Isto não era uma anomalia de faturação, mas sim um sintoma.

Rastreámos o problema até à forma como os modelos são armazenados: como pesos de uma grande rede neuronal. Esses pesos são aprendidos uma vez e depois congelados. A abordagem funciona e gerou a capacidade sobre a qual todos estão agora a construir; no entanto, no momento em que é necessário manter esse conhecimento, em vez de simplesmente usá-lo, as fissuras aparecem.

Especificamente, quatro delas:

Opacidade: Um julgamento como "este registo e aquele registo descrevem a mesma pessoa" não está armazenado em nenhum lugar que se possa apontar. Está disperso por milhões de parâmetros, e o modelo não consegue explicar por que razão tomou a decisão que tomou.
Ausência de edições limpas: Corrigir um facto desatualizado significa reformar ou ajustar o modelo (fine-tuning), sem qualquer garantia de que a correção permaneça onde foi colocada.
Esquecimento: Ensinar algo novo ao modelo faz com que este degrade silenciosamente o que já sabia. A área chama a isto "esquecimento catastrófico", e o nome não é um exagero.
Custo: Tanto o treino como a inferência diária consomem energia e capital, e a fatura cresce com a escala e não com a utilidade.

Eis a parte que merece uma reflexão profunda. O cérebro humano executa uma competência comparável e mais abrangente com cerca de vinte watts. Consegue-o com uma forte modularidade funcional e uma aprendizagem maioritariamente local, onde uma ligação muda com base nos dois neurónios que interliga, em vez de um recalculo em todo o sistema. Não estamos a alegar que copiamos o cérebro. Estamos a salientar que a matriz de pesos densa é uma opção e não uma lei da natureza, e que algo muito mais económico é comprovadamente possível.

Por isso, começámos a construir em direção a uma base diferente. Exámos o argumento técnico num livro branco (white paper), Beyond the Weight Matrix ("Para além da Matriz de Pesos"), e a versão curta é a seguinte.

Em vez de uma grande rede congelada, o conhecimento reside em muitos pequenos compartimentos. Cada compartimento detém um único fragmento daquilo que o sistema sabe, e cada um pode ser lido ou substituído por si só, sem perturbar o resto. Dentro de um compartimento, um fragmento é escrito como uma equação explícita e não como um padrão de pesos oculto. Essa diferença importa mais do que parece: ao contrário de um peso, uma equação pode ser lida por uma pessoa e reescrita no próprio local.

As atualizações também se comportam de forma diferente. A nova informação não altera silenciosamente um valor armazenado. Em vez disso, propõe uma alteração, e essa alteração só é admitida depois de passar por uma barreira de verificação que a confronta com compartimentos relacionados e, quando aplicável, com evidências externas. Se a informação recebida falhar a verificação, o sistema pode recusá-la. Cada alteração que consegue entrar carrega consigo um registo do motivo pelo qual foi feita.

O problema mais difícil é a fluência. A maior parte do que um utilizador competente de uma língua sabe não é um facto linear. Preferimos dizer "chá forte" a "chá poderoso", mas preferimos "motor poderoso" a "motor forte", e nenhuma regra gramatical explica a diferença. Este conhecimento gradual, dependente do contexto, constitui a maior parte da competência e resiste a ser escrito. A nossa abordagem mantém-no explícito de qualquer forma: cada preferência é armazenada com a respetiva força numa ranhura (slot) nomeada e editável, de modo a que a magnitude que um modelo comum ocultaria se torne algo que um auditor pode ler e um técnico de manutenção pode alterar.

Por que razão isto é mais importante na saúde? Porque qualidades que noutros setores são meramente convenientes, aqui tornam-se requisitos.

Uma decisão de unificação de registos que afete os cuidados de um doente tem de ser inspecionável, não uma caixa negra.
Um facto que se venha a revelar errado tem de ser corrigível em minutos, e não no ciclo de treino seguinte.
Qualquer inferência clínica ou administrativa deve ser capaz de declarar em que se fundamentou.

O trabalho regulado e sujeito a auditorias frequentes é exatamente onde o conhecimento editável e verificável justifica o seu esforço, e tende a envolver uma elevada quota de factos claros e verificáveis. É por isso que estamos a começar aqui, e não com a linguagem de âmbito aberto.

Devemos também ser honestos convosco. Esta é uma direção, não um produto acabado, e tem um problema em aberto genuíno no seu núcleo. Como as preferências graduais dependem do contexto, e o contexto pode invertê-las, o sistema não pode armazenar uma regra para cada par de expressões. No pior dos cenários, precisaria de uma regra para cada contexto, e o número de contextos na linguagem natural é suficientemente grande para reconstruir a própria matriz de pesos que nos propusemos evitar só que detalhada extensamente. O trabalho que transforma esta proposta num sistema funcional é, em grande parte, o trabalho de comprimir esse crescimento: fatorizar a estrutura partilhada e organizar os contextos em hierarquias para que a representação se expanda lentamente. Se isso pode ser feito mantendo a capacidade de edição que motivou o esforço inicial é a questão da qual depende o sucesso ou o fracasso de toda a arquitetura.

É por isso que estamos a publicar em vez de manter este projeto internamente. Nenhuma empresa vai resolver o problema da compressão sozinha, e a área passou anos a refinar um paradigma enquanto subinvestia nas alternativas. O custo energético das matrizes de pesos congeladas está a tornar-se uma responsabilidade à escala da indústria, e não apenas uma linha de custos num balanço financeiro. A saúde, em particular, não pode suportar modelos que não tem forma de auditar ou corrigir, e nenhuma organização detém, por si só, dados, métodos ou o contexto clínico suficientes para lá chegar sozinha.

Assim, pedimos à comunidade de investigação que direcione parte da sua atenção para este caminho:

Políticas de referência (benchmarks) partilhadas sobre a precisão com que um modelo pode ser editado e a sua resiliência após essa edição.
Métodos abertos para comprimir o conhecimento condicionado pelo contexto. Este é o estrangulamento (bottleneck) e pertence a todos os que trabalham nesta área.
Interfaces comuns entre compartimentos, para que um resultado produzido num laboratório possa ser reutilizado noutro local, em vez de ser reconstruído do zero.

Continuaremos a publicar o que aprendermos, incluindo as partes que falharem. Se trabalha em sistemas neuro-simbólicos, edição de modelos, inferência eficiente ou representação de conhecimento clínico, valorizaríamos a oportunidade de trocar impressões. O livro branco é o ponto de partida.

Receba o nosso boletim informativo!

Receber notícias

Declaração sobre a necessidade de repensar a IA