Descoperirea de medicamente e scumpă și lentă: ani de explorare a spațiului chimic, mii de candidați care eșuează în faze târzii. Modelele de învățare automată scurtează drumul în trei etape. Mai întâi, generarea de molecule noi cu proprietăți dorite: modele generative (transformere, difuzie) propun structuri sintetizabile, balansând potența, selectivitatea și ADMET. Apoi, screening virtual: rețele graf orientate pe molecule estimează conexiuni țintă-ligand, reducând bibliotecile de la milioane la sute pentru testare. În final, optimizarea ciclică: bucle închise „propun-sintetizează-testează-învăță” accelerează iterarea.
Integrarea cu biologia structurală amplifică puterea: predicții de structuri proteice, docking flexibil, simulări rapide folosesc GPU-uri pentru a prioritiza experimentele umede. În paralel, analiza datelor clinice reale detectează efecte adverse timpurii sau repoziționări de compuși existenți.
Limitele sunt reale. Modelele pot „învața” biasuri din date, pot propune structuri imposibil de sintetizat la scară sau pot rata rarități biologice. Validarea experimentală rămâne suverană, iar reglementatorii cer trasabilitate și explicabilitate. Etica este esențială: seturile de date trebuie curate, confidențialitatea protejată, iar capabilitățile dual-use gestionate.
Peisajul se mută de la hype la utilitate: companiile pharma adoptă fluxuri AI în fazele timpurii, startup-urile co-dezvoltă candidați, consorțiile deschid biblioteci de date. Nu înlocuiește oamenii de știință, dar le multiplică puterea – un laborator invizibil, 24/7, care sugerează următorul experiment cu cea mai mare șansă de succes.
Surse
Nature Biotechnology; Nature Medicine; arXiv (q-bio.BM, cs.LG); PubMed Central (studii de caz AI-drug discovery)