Os sistemas de inteligência artificial (IA) têm o potencial de auxiliar o diagnóstico do câncer de próstata, prevenindo o sobrediagnóstico e reduzindo a dependência de radiologistas experientes. Estudo do Consórcio PI-CAI (Prostate Imaging: Cancer AI) mostra um sistema de IA que pode ser uma ferramenta de suporte dentro de um cenário de diagnóstico primário, com benefícios para pacientes e radiologistas. “A validação prospectiva é necessária para testar a aplicabilidade clínica deste sistema”, propõem os pesquisadores.

Neste estudo internacional (NCT05489341), o objetivo foi avaliar o desempenho dos sistemas de inteligência artificial (IA) na detecção de câncer de próstata clinicamente significativo na ressonância magnética em comparação com radiologistas usando o Prostate Imaging—Reporting and Data System versão 2.1 (PI-RADS 2.1) e o padrão de atendimento na prática de rotina multidisciplinar.

Para a análise pareada e confirmatória de não inferioridade, os pesquisadores treinaram e buscaram validar externamente um sistema de IA (desenvolvido dentro do consórcio internacional PI-CAI) para detectar câncer de próstata de grau Gleason grupo 2 ou superior usando uma coorte retrospectiva de 10.207 exames de ressonância magnética de 9.129 pacientes.  Desses exames, 9207 casos de três centros (11 locais) baseados na Holanda foram usados ​​para treinamento e ajuste, enquanto 1000 casos de quatro centros (12 locais) baseados na Holanda e Noruega foram usados ​​para testes. Paralelamente, foi realizado um estudo multileitor, multicasos por observador com 62 radiologistas (45 centros em 20 países, com mediana de 7 [IQR 5–10] anos de experiência na leitura de ressonância magnética de próstata) usando PI-RADS (2.1) em 400 exames de ressonância magnética pareados da coorte de teste.

Os desfechos primários foram a sensibilidade, especificidade e a área sob a curva característica de operação do receptor (AUROC) do sistema de IA em comparação com a de todos os leitores usando PI-RADS (2.1) e em comparação com a das leituras históricas de radiologia feitas durante a prática de rotina multidisciplinar (ou seja, o padrão de atendimento com o auxílio do histórico do paciente e consulta de pares). Histopatologia e pelo menos 3 anos (mediana 5 [IQR 4–6] anos) de acompanhamento foram usadas ​​para estabelecer o padrão de referência. O plano de análise estatística foi pré-especificado com uma hipótese primária de não inferioridade (considerando uma margem de 0,05) e uma hipótese secundária de superioridade em relação ao sistema de IA, se a não inferioridade fosse confirmada.

Os resultados relatados por Saha et al. no Lancet Oncology mostram que dos 10.207 exames incluídos de 1º de janeiro de 2012 a 31 de dezembro de 2021, 2.440 casos tiveram câncer de próstata de grau Gleason 2 ou superior confirmado histologicamente. No subconjunto de teste de 400 casos em que o sistema de IA foi comparado com os radiologistas participantes do estudo, os autores descrevem que o sistema de IA mostrou um AUROC estatisticamente superior e não inferior de 0,91 (IC de 95% 0,87–0,94; p<0,0001), em comparação ao grupo de 62 radiologistas com um AUROC de 0,86 (0,83–0,89), com limite inferior do IC de Wald de 95% bilateral para a diferença em AUROC de 0,02. No ponto operacional médio PI-RADS 3 ou superior de todos os leitores, o sistema de IA detectou 6,8% mais casos com câncer de próstata de grau Gleason do grupo 2 ou superior na mesma especificidade (57,7%, IC de 95% 51,6–63,3), ou 50,4% menos resultados falso-positivos e 20,0% menos casos com câncer de grau Gleason do grupo 1 na mesma sensibilidade (89,4%, IC de 95% 85,3–92,9).

Em todos os 1000 casos de teste em que o sistema de IA foi comparado com as leituras de radiologia feitas durante a prática multidisciplinar, a não inferioridade não foi confirmada, pois o sistema de IA mostrou menor especificidade (68,9% [IC de 95% 65,3–72,4] vs 69,0% [65,5–72,5]) na mesma sensibilidade (96,1%, 94,0–98,2) que o ponto operacional PI-RADS 3 ou superior. O limite inferior do IC de Wald de 95% bilateral para a diferença na especificidade (−0,04) foi maior do que a margem de não inferioridade (−0,05) e um valor de p abaixo do limite de significância foi alcançado (p < 0,001).

Em síntese, o sistema de IA foi superior aos radiologistas que usam PI-RADS (2,1) na detecção de câncer de próstata clinicamente significativo e comparável ao padrão de tratamento. “O sistema mostra o potencial de ser uma ferramenta de suporte dentro de um cenário de diagnóstico primário, com vários benefícios associados para pacientes e radiologistas. A validação prospectiva é necessária para testar a aplicabilidade clínica deste sistema”, concluem os autores.

Referência:

Published: June 11, 2024DOI:https://doi.org/10.1016/S1470-2045(24)00220-1