Кароткі адказ: генератыўны штучны інтэлект у асноўным паскарае ранняе адкрыццё лекаў, ствараючы малекулы-кандыдаты або бялковыя паслядоўнасці, прапаноўваючы шляхі сінтэзу і вылучаючы правераныя гіпотэзы, каб каманды маглі праводзіць менш «сляпых» эксперыментаў. Ён працуе найлепш, калі вы ўводзіце жорсткія абмежаванні і правяраеце вынікі; калі разглядаць яго як аракула, ён можа ўводзіць у зман з упэўненасцю.
Асноўныя высновы:
Паскарэнне : выкарыстоўвайце GenAI для пашырэння генерацыі ідэй, а затым звузіце яе з дапамогай строгай фільтрацыі.
Абмежаванні : перад генерацыяй патрабуюцца дыяпазоны ўласцівасцей, правілы сховішча і абмежаванні навізны.
Праверка : Вынікі разглядайце як гіпотэзы; пацвярджайце з дапамогай аналізаў і артаганальных мадэляў.
Адсочванне : фіксуйце падказкі, вынікі і абгрунтаванне, каб рашэнні маглі быць правераны і перагледжаны.
Супраціў злоўжыванням : прадухіляйце ўцечкі інфармацыі і празмерную ўпэўненасць з дапамогай кіравання, кантролю доступу і праверкі чалавекам.

Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Роля штучнага інтэлекту ў ахове здароўя
Як штучны інтэлект паляпшае дыягностыку, працоўныя працэсы, догляд за пацыентамі і вынікі.
🔗 Ці заменіць штучны інтэлект рэнтгенолагаў?
Даследуе, як аўтаматызацыя паляпшае радыялогію і што застаецца чалавечым.
🔗 Ці заменіць штучны інтэлект лекараў?
Сумленны погляд на ўплыў штучнага інтэлекту на працу і практыку лекараў.
🔗 Найлепшыя інструменты лабараторыі штучнага інтэлекту для навуковых адкрыццяў
Найлепшыя інструменты лабараторыі штучнага інтэлекту для паскарэння эксперыментаў, аналізу і адкрыццяў.
Роля генератыўнага штучнага інтэлекту ў адкрыцці лекаў, адным дыханнем 😮💨
Генератыўны штучны інтэлект дапамагае камандам па распрацоўцы лекаў ствараць малекулы-кандыдаты, прагназаваць уласцівасці, прапаноўваць мадыфікацыі, прапаноўваць шляхі сінтэзу, даследаваць біялагічныя гіпотэзы і скарачаць цыклы ітэрацый, асабліва на ранніх этапах адкрыцця і аптымізацыі лідаў. Nature 2023 (агляд адкрыцця лігандаў) Агляд Elsevier 2024 (генератыўныя мадэлі ў распрацоўцы лекаў de novo)
І так, яно таксама можа ўпэўнена генераваць глупства. Гэта частка здзелкі. Як вельмі захоплены стажор з ракетным рухавіком. Кіраўніцтва клініцыста (рызыка галюцынацый) npj Digital Medicine 2025 (галюцынацыі + сістэма бяспекі)
Чаму гэта важней, чым людзі прызнаюць 💥
Шмат адкрыццяў — гэта «пошук». Пошук па хімічнай прасторы, пошук па біялогіі, пошук па літаратуры, пошук па суадносінах структура-функцыя. Праблема ў тым, што хімічная прастора… па сутнасці, бясконцая. Зводкі хімічных даследаванняў 2015 (хімічная прастора) Ірвін і Шойчэт 2009 (маштаб хімічнай прасторы)
Вы маглі б правесці некалькі жыццяў, проста спрабуючы «разумныя» варыяцыі.
Генератыўны штучны інтэлект змяняе працоўны працэс з:
-
«Давайце праверым, што мы можам прыдумаць»
да:
-
«Давайце створым большы, разумнейшы набор варыянтаў, а потым пратэстуем найлепшыя»
Гаворка ідзе не пра выключэнне эксперыментаў. Гаворка ідзе пра выбар лепшых эксперыментаў . 🧠 Nature 2023 (агляд адкрыццяў лігандаў)
Акрамя таго, і гэта недастаткова абмяркоўваецца, гэта дапамагае камандам абмяркоўваць розныя дысцыпліны . Хімікі, біёлагі, спецыялісты па DMPK, спецыялісты па вылічальнай тэхніцы... у кожнага ёсць свае ментальныя мадэлі. Добрая генератыўная сістэма можа служыць агульным альбомам для эскізаў. Агляд Frontiers in Drug Discovery 2024.
Што робіць генератыўны штучны інтэлект добрай версіяй для адкрыцця лекаў? ✅
Не ўсе генератыўныя штучныя інтэлекты аднолькавыя. «Добрая» версія для гэтай прасторы — гэта не столькі яркія дэманстрацыі, колькі непрывабная надзейнасць (непрывабнасць тут — гэта годнасць). Nature 2023 (агляд адкрыцця лігандаў)
Добрая ўстаноўка генератыўнага штучнага інтэлекту звычайна мае:
-
Зазямленне дамена : навучанне або адаптацыя да хімічных, біялагічных і фармакалагічных дадзеных (не толькі агульнага тэксту) 🧬 Агляд Elsevier 2024 (генератыўныя мадэлі)
-
Абмежаванні першага пакалення : яно можа падпарадкоўвацца такім правілам, як дыяпазоны ліпафільнасці, абмежаванні каркаса, асаблівасці сайтаў звязвання, мэты селектыўнасці JCIM 2024 (мадэлі дыфузіі ў распрацоўцы лекаў de novo) REINVENT 4 (адкрыты фрэймворк)
-
Усведамленне ўласцівасцей : ён стварае малекулы, якія не толькі новыя, але і «не абсурдныя» ў тэрміналогіі ADMET ADMETlab 2.0 (чаму важны ранні ADMET)
-
Справаздачнасць аб нявызначанасці : яна сігналізуе, калі гэта здагадка, а калі яна надзейная (нават прыблізны дыяпазон даверу дапамагае) Прынцыпы праверкі QSAR АЭСР (вобласць прымянення)
-
Кіраванне з удзелам чалавека : хімікі могуць хутка кіраваць, адхіляць і накіроўваць вынікі Nature 2023 (працоўны працэс + кантэкст тэхналогій адкрыццяў)
-
Прасочвальнасць : вы можаце ўбачыць, чаму з'явілася прапанова (прынамсі часткова), або вы дзейнічаеце ўсляпую. Рэкамендацыі АЭСР па QSAR (празрыстасць мадэлі + праверка).
-
Абсталяванне для ацэнкі : стыкоўка, QSAR, фільтры, праверкі рэтрасінтэзу — усё падключана 🔧 Nature 2023 (агляд адкрыцця лігандаў) Машыннае навучанне ў CASP (Coley 2018)
-
Кантроль зрушэнняў і ўцечак : каб пазбегнуць утойлівага запамінання навучальных дадзеных (так, такое здараецца) USENIX 2021 (выманне навучальных дадзеных) Vogt 2023 (праблемы з навізной/унікальнасцю)
Калі ваш генератыўны штучны інтэлект не можа справіцца з абмежаваннямі, ён па сутнасці з'яўляецца генератарам навізны. Весялосць на вечарынках. Менш весялосці ў праграме па барацьбе з наркотыкамі.
Дзе генератыўны штучны інтэлект упісваецца ў канвеер распрацоўкі лекаў 🧭
Вось простая ментальная карта. Генератыўны штучны інтэлект можа ўнесці свой уклад амаль на кожны этап, але ён працуе найлепш там, дзе ітэрацыі дарагія, а прастора для гіпотэз велізарная. Nature 2023 (агляд адкрыцця лігандаў)
Распаўсюджаныя кропкі кантакту:
-
Выяўленне і праверка мішэняў (гіпотэзы, картаграфаванне шляхоў, прапановы біямаркераў) Агляд Frontiers in Drug Discovery 2024
-
Ідэнтыфікацыя хітоў (пашырэнне віртуальнага скрынінгу, генерацыя хітоў de novo) Nature Biotechnology 2019 (GENTRL)
-
Аптымізацыя лідаў (прапанова аналагаў, шматпараметрычная налада) REINVENT 4
-
Даклінічная падтрымка (прагноз уласцівасцей ADMET, часам падказкі па фармулёўцы) ADMETlab 2.0
-
Планаванне кардыялагічнай тэрапіі (КМК) і сінтэзу (прапановы па рэтрасінтэзе, маршрутная трыяж) AiZynthFinder 2020 Coley 2017 (камп'ютэрны рэтрасінтэз)
-
Ведавая праца (сінтэз літаратуры, рэзюмэ канкурэнтнага ландшафту) 📚 Patterns 2025 (LLM у галіне распрацоўкі лекаў)
У многіх праграмах найбольшыя выйгрышы вынікаюць з інтэграцыі працоўных працэсаў , а не з таго, што адна мадэль з'яўляецца «геніяльнай». Мадэль — гэта рухавік, а канвеер — гэта машына. Nature 2023 (агляд адкрыцця лігандаў)
Параўнальная табліца: папулярныя генератыўныя падыходы штучнага інтэлекту, якія выкарыстоўваюцца ў распрацоўцы лекаў 📊
Трохі недасканалая табліца, бо рэальнае жыццё трохі недасканалае.
| Інструмент / Падыход | Найлепшае для (аўдыторыі) | Прыблізная цана | Чаму гэта працуе (і калі не) |
|---|---|---|---|
| Генератары малекул De novo (SMILES, графікі) | Медыцынская хімія + камп'ютэрная хімія | $$-$$$ | Выдатна хутка даследуе новыя аналагі 😎 - але можа выплюнуць нестабільныя неадпаведнасці REINVENT 4 GENTRL (Nature Biotech 2019) |
| Генератары бялкоў / структур | Каманды біялагічных спецыялістаў, структурная біялогія | $$$ | Дапамагае прапанаваць паслядоўнасці + структуры, але «выглядае праўдападобна» — гэта не тое ж самае, што «працуе». AlphaFold (Nature 2021) RFdiffusion (Nature 2023) |
| Малекулярны дызайн у стылі дыфузіі | Пашыраныя каманды машыннага навучання | $$-$$$$ | Моцна валодае абмежаваннямі ў навучанні і разнастайнасці - налада можа быць... цалкам JCIM 2024 (мадэлі дыфузіі) Агляд дыфузіі PMC 2025 |
| Сумесныя прагназаванні ўласцівасцей (камбінацыя QSAR + GenAI) | DMPK, праектныя каманды | $$ | Добра для трыяжу і ранжыравання — дрэнна, калі ўспрымаць як нешта накшталт евангелля 😬 АЭСР (даменная вобласць прымянення) ADMETlab 2.0 |
| Планіроўшчыкі рэтрасінтэзу | Хімічны працэс, КМЦ | $$-$$$ | Паскарае распрацоўку маршрутаў — для забеспячэння рэальнасці і бяспекі ўсё яшчэ патрэбныя людзі. AiZynthFinder 2020 Coley 2018 (CASP) |
| Мультымадальныя лабараторныя копілоты (тэкст + дадзеныя аналізу) | Перакладчыцкія каманды | $$$ | Карысна для атрымання сігналаў паміж наборамі дадзеных — схільнасць да празмернай упэўненасці, калі дадзеныя неадназначныя Nature 2024 (пакетныя эфекты ў візуалізацыі клетак) npj Digital Medicine 2025 (мультымадальны аналіз у біятэхналогіях) |
| Памочнікі па літаратуры і гіпотэзах | Усе, на практыцы | $ | Значна скарачае час чытання, але галюцынацыі могуць быць слізкімі, як знікаючыя шкарпэткі. Заканамернасці 2025 (LLM у галіне распрацоўкі лекаў). Кіраўніцтва клініцыста (галюцынацыі). |
| Мадэлі падмуркаў, зробленыя па індывідуальнай замове | Буйныя фармацэўтычныя кампаніі, добра фінансаваныя біятэхналогіі | $$$$ | Найлепшы кантроль + інтэграцыя - таксама дарагі і павольны ў распрацоўцы (прабачце, гэта праўда) Агляд Frontiers in Drug Discovery 2024 |
Заўвагі: цэны моцна адрозніваюцца ў залежнасці ад маштабу, вылічальнай магутнасці, ліцэнзавання і ад таго, ці хоча ваша каманда «падключы і працуй» ці «давай пабудуем касмічны карабель»
Больш уважліва: генератыўны штучны інтэлект для пошуку хітоў і дызайну de novo 🧩
Гэта асноўны выпадак выкарыстання: стварэнне кандыдатных малекул з нуля (або з каркаса), якія адпавядаюць мэтаваму профілю. Nature Biotechnology 2019 (GENTRL) REINVENT 4
Як гэта звычайна працуе на практыцы:
-
Вызначыць абмежаванні
-
клас мішэні, форма кішэні звязвання, вядомыя ліганды
-
дыяпазоны ўласцівасцей (растваральнасць, logP, PSA і г.д.) Ліпінскі (кантэкст правіла 5)
-
абмежаванні навізны (пазбягайце вядомых IP-зон) 🧠 Vogt 2023 (ацэнка навізны)
-
-
Генерацыя кандыдатаў
-
скачкі па рыштаваннях
-
рост фрагментаў
-
прапановы «упрыгожыць гэтае ядро»
-
шматмэтавая генерацыя (звязванне + пранікальная + амаль нетаксічнасць) REINVENT 4 Агляд Elsevier 2024 (генератыўныя мадэлі)
-
-
Агрэсіўна фільтруйце
-
правілы медыцынскай хіміі
-
PAINS і рэактыўныя групавыя фільтры Baell & Holloway 2010 (PAINS)
-
праверкі сінтэзаванасці AiZynthFinder 2020
-
докінг / ацэнка (недасканала, але карысна) Nature 2023 (агляд адкрыцця лігандаў)
-
-
Выберыце невялікі набор для сінтэзу
-
людзі ўсё яшчэ выбіраюць, бо часам адчуваюць лухту
-
Няёмкая праўда: каштоўнасць заключаецца не толькі ў «новых малекулах». Гэта новыя малекулы, якія маюць сэнс для абмежаванняў вашай праграмы . Гэта апошняя частка — галоўнае. Nature 2023 (агляд адкрыцця лігандаў)
Акрамя таго, ёсць невялікае перабольшанне: калі ўсё зроблена добра, можа ўзнікнуць адчуванне, што вы нанялі каманду нястомных маладых хімікаў, якія ніколі не спяць і ніколі не скардзяцца. З іншага боку, яны таксама не разумеюць, чаму пэўная стратэгія абароны — гэта кашмар, таму… баланс 😅.
Больш падрабязны погляд: аптымізацыя лідаў з дапамогай генератыўнага штучнага інтэлекту (шматпараметрычная налада) 🎛️
Аптымізацыя лідаў — гэта тое, як мары ўскладняюцца.
Вы хочаце:
-
павышэнне патэнцыі
-
селектыўнасць уверх
-
павышэнне метабалічнай стабільнасці
-
растваральнасць уверх
-
сігналы бяспекі ўключаны
-
пранікальнасць «ідэальна»
-
І ўсё яшчэ быць сінтэзавальным
Гэта класічная шматмэтавая аптымізацыя. Генератыўны штучны інтэлект незвычайна добра спраўляецца з прапановай набору кампрамісных рашэнняў, а не з тым, каб рабіць выгляд, што існуе адно ідэальнае спалучэнне. REINVENT 4 Elsevier 2024 (генератыўныя мадэлі)
Практычныя спосабы выкарыстання камандамі:
-
Аналаг : «Зрабіць 30 варыянтаў, якія зніжаюць кліранс, але захоўваюць эфектыўнасць».
-
Замяшчальнае сканаванне : кіраванае даследаванне замест перабору метадам грубай сілы
-
Скафолд-скачкі : калі ядро ўдараецца аб сцяну (таксічнасць, інтэлектуальны патэнцыял або стабільнасць)
-
Прапановы з тлумачэннямі : «Гэтая палярная група можа палепшыць растваральнасць, але пагоршыць пранікальнасць» (не заўсёды правільна, але карысна).
Адно папярэджанне: прагназатары ўласцівасцей могуць быць далікатнымі. Калі вашы навучальныя дадзеныя не адпавядаюць вашаму хімічнаму шэрагу, мадэль можа быць упэўнена памылковай. Напрыклад, вельмі памылковай. І яна не будзе чырванець. Прынцыпы праверкі QSAR АЭСР (вобласць прымянення) Weaver 2008 (вобласць прымянення QSAR)
Больш уважліва: ADMET, таксічнасць і скрынінг «калі ласка, не забівайце праграму» 🧯
ADMET — гэта тое, дзе многія кандыдаты ціха церпяць няўдачу. Генератыўны штучны інтэлект не вырашае праблемы біялогіі, але можа паменшыць колькасць памылак, якіх можна пазбегнуць. ADMETlab 2.0 Waring 2015 (адток кандыдатаў)
Распаўсюджаныя ролі:
-
прагназаванне метабалічных адказнасцей (месцы метабалізму, тэндэнцыі клірансу)
-
пазначэнне верагодных матываў таксічнасці (папярэджанні, паказчыкі рэактыўных прамежкавых прадуктаў)
-
ацэнка дыяпазонаў растваральнасці і пранікальнасці
-
прапануюцца мадыфікацыі для зніжэння рызыкі hERG або паляпшэння стабільнасці 🧪 FDA (ICH E14/S7B Пытанні і адказы) EMA (агляд ICH E14/S7B)
Найбольш эфектыўная схема выглядае наступным чынам: выкарыстоўваць GenAI для прапановы варыянтаў, але выкарыстоўваць спецыялізаваныя мадэлі і эксперыменты для праверкі.
Генератыўны штучны інтэлект — гэта рухавік генерацыі ідэй. Валідацыя ўсё яшчэ існуе ў аналізах.
Больш уважліва: генератыўны штучны інтэлект для біялагічных прэпаратаў і бялковай інжынерыі 🧬✨
Распрацоўка лекаў — гэта не толькі малыя малекулы. Генератыўны штучны інтэлект таксама выкарыстоўваецца для:
-
генерацыя паслядоўнасці антыцелаў
-
прапановы па паспяванні блізкасці
-
паляпшэнне стабільнасці бялку
-
ферментная інжынерыя
-
Даследаванне пептыднай тэрапіі ProteinMPNN (Навука 2022) Rives 2021 (мадэлі мовы бялкоў)
Генерацыя бялкоў і паслядоўнасцей можа быць магутнай, таму што «мова» паслядоўнасцей дзіўна добра адпавядае метадам машыннага навучання. Але вось выпадковы вяртанне: усё добра адпавядае... пакуль не перастане. Таму што імунагеннасць, экспрэсія, патэрны гліказілявання і абмежаванні распрацоўкі могуць быць жорсткімі. AlphaFold (Nature 2021) ProteinGenerator (Nat Biotech 2024)
Такім чынам, найлепшыя налады ўключаюць:
-
фільтры распрацоўванасці
-
ацэнка рызыкі імунагеннасці
-
абмежаванні тэхналагічнасці
-
цыклы мокрай лабараторыі для хуткай ітэрацыі 🧫
Калі іх прапусціць, атрымаецца цудоўная паслядоўнасць, якая ў працэсе вытворчасці паводзіць сябе як сапраўдная дыва.
Больш падрабязны погляд: планаванне сінтэзу і прапановы па рэтрасінтэзе 🧰
Генератыўны штучны інтэлект таксама пранікае ў хімічныя аперацыі, а не толькі ў фарміраванне малекулярных ідэй.
Планіроўшчыкі рэтрасінтэзу могуць:
-
прапанаваць шляхі да мэтавага злучэння
-
прапанаваць камерцыйна даступныя зыходныя матэрыялы
-
ранжыраваць маршруты па колькасці крокаў або меркаванай мэтазгоднасці
-
дапамагчы хімікам хутка выключыць «мілыя, але немагчымыя» ідэі AiZynthFinder 2020 Coley 2018 (CASP)
Гэта можа зэканоміць рэальны час, асабліва калі вы даследуеце мноства кандыдатаў на структуры. Тым не менш, людзі тут маюць вялікае значэнне, таму што:
-
змены даступнасці рэагентаў
-
праблемы з бяспекай і маштабам рэальныя
-
некаторыя крокі выглядаюць добра на паперы, але пастаянна церпяць няўдачу
Не зусім ідэальная метафара, але я ўсё роўна яе выкарыстаю: рэтрасінтэзны штучны інтэлект падобны на GPS, які ў асноўным правільны, за выключэннем таго, што часам ён пракладае маршрут праз возера і настойвае на тым, што гэта кароткі шлях. 🚗🌊 Колі 2017 (камп'ютэрны рэтрасінтэз)
Дадзеныя, мультымадальныя мадэлі і суровая рэальнасць лабараторый 🧾🧪
Генератыўны штучны інтэлект любіць дадзеныя. Лабараторыі ствараюць дадзеныя. На паперы гэта гучыць проста.
Ха. Не.
Рэальныя лабараторныя дадзеныя:
-
няпоўны
-
шумны
-
поўны пакетных эфектаў Leek et al. 2010 (пакетныя эфекты) Nature 2024 (пакетныя эфекты ў візуалізацыі клетак)
-
раскіданыя па розных фарматах
-
надзелены «крэатыўнымі» правіламі наймення
Мультымадальныя генератыўныя сістэмы могуць спалучаць:
-
вынікі аналізу
-
хімічныя структуры
-
выявы (мікраскапія, гісталогія)
-
оміка (транскрыптоміка, пратэоміка)
-
тэкст (пратаколы, ELN, справаздачы) npj Лічбавая медыцына 2025 (мультымадальны ў біятэхналогіях) Медыцынскі аналіз малюнкаў 2025 (мультымадальны штучны інтэлект у медыцыне)
Калі гэта працуе, гэта цудоўна. Вы можаце выявіць невідавочныя заканамернасці і прапанаваць эксперыменты, якія адзін спецыяліст мог бы прапусціць.
Калі нешта не атрымліваецца, то не атрымліваецца ціха. Не зачыняе дзверы. Проста падштурхоўвае да ўпэўненай няправільнай высновы. Вось чаму кіраванне, праверка і праверка прадметнай вобласці не з'яўляюцца абавязковымі. Кіраўніцтва клініцыста (галюцынацыі) npj Digital Medicine 2025 (галюцынацыі + сістэма бяспекі)
Рызыкі, абмежаванні і раздзел «не падманвайцеся плаўным вывадам» ⚠️
Калі вы памятаеце толькі адну рэч, памятайце вось гэта: генератыўны штучны інтэлект пераканаўчы. Ён можа гучаць правільна, але ў той жа час памыляцца. Кіраўніцтва клініцыста (галюцынацыі)
Асноўныя рызыкі:
-
Галюцынацыйныя механізмы : праўдападобная біялогія, якая не з'яўляецца рэальнай. Кіраўніцтва клініцыста (галюцынацыі).
-
Уцечка дадзеных : стварэнне чагосьці занадта блізкага да вядомых злучэнняў USENIX 2021 (выманне навучальных дадзеных) Vogt 2023 (праблемы з навізной/унікальнасцю)
-
Звышаптымізацыя : пагоня за прагназаванымі вынікамі, якія не апраўдваюцца in vitro Nature 2023 (агляд адкрыццяў лігандаў)
-
Зрушэнне : навучальныя дадзеныя скажоныя ў бок пэўных хематыпаў або мішэняў Vogt 2023 (ацэнка мадэлі + зрушэнне/навізна)
-
Ілжывая навізна : «новыя» малекулы, якія насамрэч з'яўляюцца трывіяльнымі варыянтамі Фогт 2023
-
Прабелы ў тлумачальнасці : цяжка абгрунтаваць рашэнні для зацікаўленых бакоў Прынцыпы валідацыі QSAR АЭСР
-
Праблемы бяспекі і інтэлектуальнай уласнасці : канфідэнцыйная інфармацыя пра праграму ў падказках 😬 USENIX 2021 (выманне навучальных дадзеных)
Меры па змякчэнні наступстваў, якія дапамагаюць на практыцы:
-
трымаць людзей у працэсе прыняцця рашэнняў
-
падказкі і вынікі журналаў для адсочвання
-
праверка з дапамогай артаганальных метадаў (аналізы, альтэрнатыўныя мадэлі)
-
аўтаматычна ўжываць абмежаванні і фільтры
-
разглядаць вынікі як гіпотэзы, а не як планшэты праўды Кіраўніцтва АЭСР па QSAR
Генератыўны штучны інтэлект — гэта магутны інструмент. Электраінструменты не робяць з вас цесляра... яны проста робяць памылкі хутчэй, калі вы не ведаеце, што робіце.
Як каманды ўкараняюць генератыўны штучны інтэлект без хаосу 🧩🛠️
Каманды часта хочуць выкарыстоўваць гэта, не ператвараючы арганізацыю ў навуковы кірмаш. Практычны шлях укаранення выглядае наступным чынам:
-
Пачніце з аднаго вузкага месца (пашырэнне хітоў, генерацыя аналагаў, класіфікацыя літаратуры) Nature 2023 (агляд адкрыцця лігандаў)
-
Стварыце шчыльны цыкл ацэнкі (фільтры + стыкоўка + праверкі ўласцівасцей + праверка хімічных рэчываў) REINVENT 4 AiZynthFinder 2020
-
Вымярэнне вынікаў (эканомлены час, узровень поспеху, скарачэнне адтоку кадраў) Waring 2015 (адток кадраў)
-
Інтэграцыя з існуючымі інструментамі (ELN, рэестр злучэнняў, базы дадзеных аналізаў) Рэсурс ELN у Эдынбургу
-
Стварыць правілы выкарыстання (што можа быць запытана, што застаецца афлайн, крокі прагляду) USENIX 2021 (рызыка вымання дадзеных)
-
Навучайце людзей акуратна (сур'ёзна, большасць памылак з'яўляюцца вынікам няправільнага выкарыстання, а не мадэлі). Кіраўніцтва клініцыста (галюцынацыі)
Акрамя таго, не варта недаацэньваць культуру. Калі хімікі адчуваюць, што ім навязваюць штучны інтэлект, яны яго праігнаруюць. Калі гэта зэканоміць ім час і будзе паважаць іх вопыт, яны хутка гэта ўкараняць. Людзі такія смешныя 🙂.
Якая роля генератыўнага штучнага інтэлекту ў выяўленні лекаў пры аддаленні ад маштабу? 🔭
Калі паменшыць маштаб, роля не ў тым, каб «замяніць навукоўцаў». Гэта ў тым, каб «пашырыць навуковыя магчымасці». Nature 2023 (агляд адкрыццяў лігандаў)
Гэта дапамагае камандам:
-
даследаваць больш гіпотэз штотыдзень
-
прапанаваць больш кандыдатаў структур за цыкл
-
больш разумна расстаўляць прыярытэты эксперыментаў
-
сцісканне цыклаў ітэрацый паміж праектаваннем і тэставаннем
-
абмен ведамі паміж ізаляванымі сістэмамі Patterns 2025 (LLM у галіне распрацоўкі лекаў)
І, магчыма, самая недаацэненая частка: гэта дапамагае не марнаваць дарагі чалавечы творчы патэнцыял на паўтаральныя задачы. Людзі павінны думаць пра механізм, стратэгію і інтэрпрэтацыю, а не марнаваць дні на стварэнне спісаў варыянтаў уручную. Nature 2023 (агляд адкрыццяў лігандаў)
Так, роля генератыўнага штучнага інтэлекту ў распрацоўцы лекаў — гэта паскаральнік, генератар, фільтр, а часам і праблема. Але яна каштоўная.
Заключнае рэзюмэ 🧾✅
Генератыўны штучны інтэлект становіцца асноўнай магчымасцю ў сучасным распрацоўцы лекаў, таму што ён можа генераваць малекулы, гіпотэзы, паслядоўнасці і маршруты хутчэй, чым людзі, і можа дапамагчы камандам выбіраць лепшыя эксперыменты. Агляд Frontiers in Drug Discovery 2024 Nature 2023 (агляд раскрыцця лігандаў)
Кароткі змест:
-
Найлепш падыходзіць для ранняга выяўлення і цыклаў аптымізацыі лідаў REINVENT 4
-
Падтрымлівае малыя малекулы і біялагічныя прэпараты GENTRL (Nature Biotech 2019) ProteinMPNN (Science 2022)
-
Гэта павышае прадукцыйнасць, пашыраючы варонку ідэй Nature 2023 (агляд адкрыццяў лігандаў)
-
Патрэбныя абмежаванні, праверка і людзі, каб пазбегнуць упэўненай бязглуздзіцы. Прынцыпы QSAR АЭСР. Кіраўніцтва клініцыста (галюцынацыі).
-
Найбольшыя выйгрышы вынікаюць з інтэграцыі працоўных працэсаў , а не з маркетынгавай пены. Nature 2023 (агляд адкрыцця лігандаў).
Калі вы ставіцеся да яго як да супрацоўніка, а не як да аракула, то ён сапраўды можа рухаць праграмы наперад. А калі вы ставіцеся да яго як да аракула... ну, вы можаце зноў пайсці па гэтым GPS у возера. 🚗🌊
Часта задаваныя пытанні
Якая роля генератыўнага штучнага інтэлекту ў распрацоўцы лекаў?
Генератыўны штучны інтэлект у першую чаргу пашырае варонку ідэй на ранніх этапах выяўлення і аптымізацыі лідаў, прапаноўваючы кандыдатныя малекулы, бялковыя паслядоўнасці, шляхі сінтэзу і біялагічныя гіпотэзы. Каштоўнасць заключаецца не столькі ў «замене эксперыментаў», колькі ў «выбары лепшых эксперыментаў» шляхам генерацыі мноства варыянтаў, а затым стараннай фільтрацыі. Ён найлепш працуе як паскаральнік унутры дысцыплінаванага працоўнага працэсу, колькі як асобны сродак прыняцця рашэнняў.
Дзе генератыўны штучны інтэлект найлепш працуе ў працэсе распрацоўкі лекаў?
Звычайна ён дае найбольшую карысць там, дзе прастора для гіпотэз вялікая, а ітэрацыя дарагая, напрыклад, пры ідэнтыфікацыі хітоў, распрацоўцы de novo і аптымізацыі лідаў. Каманды таксама выкарыстоўваюць яго для трыяжу ADMET, прапаноў рэтрасінтэзу і падтрымкі літаратуры або гіпотэз. Найбольшыя выгады звычайна атрымліваюцца ад інтэграцыі генерацыі з фільтрамі, ацэнкай і праверкай чалавекам, а не ад чакання, што адна мадэль будзе «разумнай»
Як усталяваць абмежаванні, каб генератыўныя мадэлі не стваралі бескарысных малекул?
Практычны падыход заключаецца ў вызначэнні абмежаванняў перад генерацыяй: дыяпазоны ўласцівасцей (напрыклад, мішэні для растваральнасці або logP), правілы каркаса або падструктуры, асаблівасці сайтаў звязвання і межы навізны. Затым прымяняюцца фільтры медыцынскай хіміі (у тым ліку PAINS/рэактыўныя групы) і праверкі сінтэзаванасці. Генерацыя з выкарыстаннем абмежаванняў спачатку асабліва карысная пры малекулярным дызайне ў стылі дыфузіі і фрэймворках, такіх як REINVENT 4, дзе можна закадаваць шматмэтавыя мэты.
Як каманды павінны правяраць вынікі GenAI, каб пазбегнуць галюцынацый і празмернай самаўпэўненасці?
Разглядайце кожны вынік як гіпотэзу, а не выснову, і правярайце з дапамогай аналізаў і артаганальных мадэляў. Генерацыя пар з агрэсіўнай фільтрацыяй, стыкоўкай або ацэнкай, дзе гэта неабходна, і праверкай вобласці прыдатнасці для прадказальнікаў у стылі QSAR. Па магчымасці рабіце нявызначанасць бачнай, таму што мадэлі могуць быць упэўнена памылковымі ў хіміі па-за распаўсюджваннем або хісткіх біялагічных заявах. Праверка чалавекам у цыкле застаецца асноўнай функцыяй бяспекі.
Як можна прадухіліць уцечку дадзеных, рызыку для інтэлектуальнай уласнасці і «запамятаваныя» вынікі?
Выкарыстоўвайце сродкі кіравання і кантролю доступу, каб канфідэнцыйная інфармацыя пра праграму не трапляла выпадкова ў падказкі, і фіксуйце падказкі/вынікі для праверкі. Забяспечце праверкі на навізну і падабенства, каб згенераваныя кандыдаты не знаходзіліся занадта блізка да вядомых злучэнняў або абароненых абласцей. Захоўвайце выразныя правілы адносна таго, якія дадзеныя дазволеныя ў знешніх сістэмах, і аддавайце перавагу кантраляванаму асяроддзю для працы з высокай канфідэнцыйнасцю. Праверка чалавекам дапамагае выявіць «занадта знаёмыя» прапановы на ранняй стадыі.
Як генератыўны штучны інтэлект выкарыстоўваецца для аптымізацыі лідаў і шматпараметрычнай налады?
У аптымізацыі лідаў генератыўны штучны інтэлект каштоўны, таму што ён можа прапанаваць некалькі кампрамісных рашэнняў замест таго, каб гнацца за адным «ідэальным» злучэннем. Звычайныя працоўныя працэсы ўключаюць падказкі аналагаў, кіраванае сканаванне замяшчальнікаў і пераключэнне паміж сховішчамі, калі абмежаванні патэнцыі, таксічнасці або IP блакуюць прагрэс. Прадказальнікі ўласцівасцей могуць быць нетрывалымі, таму каманды звычайна ранжыруюць кандыдатаў з дапамогай некалькіх мадэляў, а затым эксперыментальна пацвярджаюць найлепшыя варыянты.
Ці можа генератыўны штучны інтэлект дапамагчы ў біялагічных прэпаратах і бялковай інжынерыі?
Так, каманды выкарыстоўваюць яго для генерацыі паслядоўнасцей антыцелаў, ідэй паспявання афіннасці, паляпшэння стабільнасці і даследавання ферментаў або пептыдаў. Генерацыя бялкоў/паслядоўнасцей можа выглядаць праўдападобнай, але не прыдатнай для распрацоўкі, таму важна ўжываць фільтры распрацоўкі, імунагеннасці і тэхналагічнасці. Структурныя інструменты, такія як AlphaFold, могуць падтрымліваць разважанні, але «праўдападобная структура» ўсё яшчэ не з'яўляецца доказам экспрэсіі, функцыі або бяспекі. Цыклы вільготнай лабараторыі застаюцца неабходнымі.
Як генератыўны штучны інтэлект падтрымлівае планаванне сінтэзу і рэтрасінтэз?
Планіроўшчыкі рэтрасінтэзу могуць прапанаваць маршруты, зыходныя матэрыялы і рэйтынгі маршрутаў, каб паскорыць генерацыю ідэй і хутка выключыць нежыццяздольныя шляхі. Такія інструменты і падыходы, як планаванне ў стылі AiZynthFinder, найбольш эфектыўныя ў спалучэнні з рэальнымі праверкамі магчымасці, якія праводзяць хімікі. Даступнасць, бяспека, абмежаванні маштабавання і «папяровыя рэакцыі», якія не дазваляюць працаваць на практыцы, усё яшчэ патрабуюць чалавечага меркавання. Такім чынам, гэта эканоміць час, не робячы выгляд, што хімія вырашана.
Спасылкі
-
Nature - Агляд адкрыццяў лігандаў (2023) - nature.com
-
Прырода Біятэхналогія - GENTRL (2019) - nature.com
-
Прырода - AlphaFold (2021) - nature.com
-
Прырода - RFдыфузія (2023) - nature.com
-
Nature Biotechnology - Генератар бялкоў (2024) - nature.com
-
Nature Communications - Пакетныя эфекты ў візуалізацыі клетак (2024) - nature.com
-
npj Лічбавая медыцына - Галюцынацыі + структура бяспекі (2025) - nature.com
-
npj Лічбавая медыцына - Мультымадальны падыход у біятэхналогіях (2025) - nature.com
-
Навука - ProteinMPNN (2022) - science.org
-
Cell Patterns - ступень магістра права ў галіне распрацоўкі лекаў (2025) - cell.com
-
ScienceDirect (Elsevier) - Генератыўныя мадэлі ў распрацоўцы лекаў de novo (2024) - sciencedirect.com
-
ScienceDirect (Elsevier) - Vogt (2023): праблемы навізны/ўнікальнасці - sciencedirect.com
-
Аналіз медыцынскіх малюнкаў (ScienceDirect) - Мультымадальны штучны інтэлект у медыцыне (2025) - sciencedirect.com
-
PubMed Central - Кіраўніцтва для клініцыстаў (рызыка галюцынацый) - nih.gov
-
Зводкі хімічных даследаванняў (публікацыі ACS) - Хімічная прастора (2015) - acs.org
-
PubMed Central - Ірвін і Шойчэт (2009): хімічная касмічная шкала - nih.gov
-
Frontiers in Drug Discovery (PubMed Central) - Агляд (2024) - nih.gov
-
Часопіс хімічнай інфармацыі і мадэлявання (публікацыі ACS) - Дыфузійныя мадэлі ў распрацоўцы лекаў de novo (2024) - acs.org
-
PubMed Central - REINVENT 4 (адкрыты фрэймворк) - nih.gov
-
PubMed Central - ADMETlab 2.0 (раннія пытанні ADMET) - nih.gov
-
АЭСР - Прынцыпы валідацыі мадэляў (Q)SAR для рэгулятыўных мэт - oecd.org
-
АЭСР - Кіраўніцтва па праверцы мадэляў (Q)SAR - oecd.org
-
Зводкі хімічных даследаванняў (публікацыі ACS) - Планаванне сінтэзу з дапамогай камп'ютэрызацыі / CASP (Колі, 2018) - acs.org
-
Цэнтральная навука ACS (публікацыі ACS) - камп'ютэрны рэтрасінтэз (Колі, 2017) - acs.org
-
PubMed Central - AiZynthFinder (2020) - nih.gov
-
PubMed - Ліпінскі: кантэкст правіла 5 - nih.gov
-
Часопіс медыцынскай хіміі (публікацыі ACS) - Baell & Holloway (2010): PAINS - acs.org
-
PubMed - Waring (2015): зніжэнне колькасці насельніцтва - nih.gov
-
PubMed - Rives (2021): мадэлі моў бялкоў - nih.gov
-
PubMed Central - Лік і інш. (2010): эфекты партый - nih.gov
-
PubMed Central - Агляд дыфузіі (2025) - nih.gov
-
FDA - E14 і S7B: клінічная і даклінічная ацэнка падаўжэння інтэрвалу QT/QTc і праарытмічнага патэнцыялу (Пытанні і адказы) - fda.gov
-
Еўрапейскае агенцтва па лекавых сродках - Агляд рэкамендацый ICH E14/S7B - europa.eu
-
USENIX - Карліні і інш. (2021): выманне навучальных дадзеных з моўных мадэляў - usenix.org
-
Эдынбургскі ўніверсітэт – Лічбавыя даследчыя паслугі – Рэсурс электроннага лабараторнага сшытка (ELN) – ed.ac.uk
-
ScienceDirect (Elsevier) - Weaver (2008): вобласць прымянення QSAR - sciencedirect.com