IA médica acaba de ser perdida para um modelo geral

Existe uma categoria de saúde digital que atraiu muito dinheiro e credibilidade. É o modelo de IA medicamente aprimorado. A proposta é bastante intuitiva: pegue um modelo de fronteira, adicione informações médicas selecionadas e você construirá algo em que os médicos podem confiar de uma forma que não podem confiar em um modelo de uso geral. bot de bate-papo. Na verdade, OpenEvidência arrecadou centenas de milhões de dólares com base nessa premissa. Atualizado construiu sua própria camada de IA na mesma lógica. A suposição aqui é que mais conhecimento médico deveria produzir melhor inteligência médica. Um estudo publicado recentemente em Medicina da Natureza sugere o contrário.
A matemática que alguém deveria fazer
Em primeiro lugar, é interessante observar um pouco da matemática básica. O corpus total da literatura biomédica representa coletivamente centenas de bilhões de palavras. Os modelos Frontier AI treinam em trilhões. O modelo especializado não adiciona remédios a um recipiente vazio; está acrescentando centenas de bilhões de palavras a um sistema que já absorveu trilhões, nas áreas de informação médica, biologia, química, estatística e farmacologia. Então começo a me perguntar se isso é mais como uma gota no balde de informações.
Meu cálculo aproximado coloca o conhecimento incremental que essas ferramentas especializadas agregam em algo em torno de um décimo de um por cento do que um modelo padrão já sabe. A camada especializada pode contribuir com algo marginalmente. O que este estudo sugere – algo contraintuitivo – é que já não contribui o suficiente para a importância.
Pagando um prêmio?
Pesquisadores da NYU Langone compararam o OpenEvidence e o UpToDate Expert AI com três modelos de fronteira que incluíam GPT-5.2, Gemini 3.1 Pro e Claude Opus 4.6. Os modelos foram desafiados em exames de licenciamento médico, benchmarks de alinhamento clínico e 100 consultas médicas reais com base na prática clínica real. Os resultados foram revisados cegamente por médicos praticantes.
Os modelos de fronteira venceram em todas as três categorias. Mas havia mais: as ferramentas clínicas especializadas não tiveram desempenho melhor do que a Visão geral da IA da Pesquisa Google. Esse é o recurso do navegador que a maioria dos usuários não sabe que existe, muito menos pelo qual paga. Aqui está minha conclusão: uma IA clínica desenvolvida especificamente, comercializada para médicos e com preços adequados, está funcionando em paridade com um navegador padrão.
Já vimos isso antes
A medicina não é a primeira área a fazer esta aposta e o precedente não é muito encorajador. Em 2023, a Bloomberg investiu pesadamente em um modelo financeiro especializado chamado BloombergGPT e foi treinada em bilhões de tokens de dados de mercado proprietários. A lógica era quase idêntica ao argumento da IA clínica e sugeria que as finanças eram demasiado especializadas e consequentes para serem dominadas pelos modelos gerais. Apesar do acesso a um volume extraordinário de informações proprietárias, a BloombergGPT realizado de forma comparável aos modelos de uso geral em tarefas financeiras.
Para onde vai o valor
A verdadeira questão não é se a perícia médica é importante; isso acontece. A questão é onde reside o valor quando inteligência geral torna-se amplamente capaz de lidar com a maior parte do que os modelos especializados deveriam dominar. Se os modelos de fronteira continuarem a igualar ou exceder a IA clínica especializada, a vantagem competitiva pode mudar para outro lugar. A nova utilidade e diferenciação competitiva podem mudar para outras áreas, incluindo dados clínicos proprietários, integração de fluxo de trabalho, confiança institucional, governação, conhecimentos regulamentares e a capacidade arduamente conquistada de implementação em ambientes reais de cuidados de saúde. Em última análise, o próprio modelo torna-se infraestrutura à medida que o valor sobe na pilha, em direção a coisas que o ajuste fino de um modelo de fronteira simplesmente não consegue fazer.
Uma exceção pequena, mas importante
É importante notar que os autores do estudo foram honestos sobre o que as suas descobertas não cobrem. Tarefas altamente especializadas ainda podem beneficiar de abordagens específicas de domínio, e um facto clínico único, mesmo obscuro, pode ser decisivo no caso certo. Esses casos extremos são reais. Eles também estão se tornando uma parte menor da história. Healthcare AI construiu seu identidade em torno da crença de que a complexidade clínica exigia especialização clínica. O que as evidências sugerem agora é que a camada especializada tem menos importância do que se supunha porque a base abaixo dela tornou-se extraordinariamente capaz. O fosso era real. Simplesmente não era permanente.