Што такое мадэлі штучнага інтэлекту? Паглыбленае агляданне.

Вы калі-небудзь гарталі старонку а другой гадзіне ночы і пыталіся, што такое мадэлі штучнага інтэлекту і чаму ўсе гавораць пра іх так, быццам гэта нейкія магічныя загаворы? Тое ж самае. Гэты артыкул — маё не занадта фармальнае, часам прадузятае кіраўніцтва, якое дапаможа вам перайсці ад стану «гм, паняцця не маю» да стану «небяспечна ўпэўненага чалавека на вячэры». Мы разгледзім: што гэта такое, што робіць іх сапраўды карыснымі (а не проста бліскучымі), як іх навучаюць, як выбіраць, не пагружаючыся ў нерашучасць, і некалькі пастак, пра якія вы даведваецеся толькі пасля таго, як вам стане балюча.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Што такое арбітраж штучнага інтэлекту: праўда, якая стаіць за модным словам
Тлумачыць, што такое арбітраж штучнага інтэлекту, яго ажыятаж і рэальныя магчымасці.

🔗 Што такое сімвалічны штучны інтэлект: усё, што вам трэба ведаць
Ахоплівае сімвалічны штучны інтэлект, яго метады і сучасныя прымяненні.

🔗 Патрабаванні да захоўвання дадзеных для штучнага інтэлекту: што вам трэба ведаць
Разбірае патрэбы штучнага інтэлекту ў захоўванні дадзеных і практычныя меркаванні.

Дык… што ж такое мадэлі штучнага інтэлекту насамрэч? 🧠

навучаная функцыя . Вы даяце ёй уваходныя дадзеныя, яна выдае вынікі. Загвоздка ў тым, што яна высвятляе, як гэта зрабіць, прапрацоўваючы мноства прыкладаў і падладжваючыся, каб кожны раз «менш памыляцца». Паўтарайце гэта дастаткова часта, і яна пачне выяўляць заканамернасці, пра існаванне якіх вы нават не здагадваліся.

Калі вы чулі такія назвы, як лінейная рэгрэсія, дрэвы рашэнняў, нейронныя сеткі, трансфарматары, дыфузійныя мадэлі ці нават k-бліжэйшых суседзяў — так, усе яны з'яўляюцца рыфамі на адну і тую ж тэму: дадзеныя паступаюць, мадэль вывучае адлюстраванне, вынік атрымліваецца. Розныя касцюмы, адно і тое ж шоу.

Чым адрозніваюцца цацкі ад сапраўдных інструментаў ✅

Шмат якія мадэлі выдатна выглядаюць у дэманстрацыі, але правальваюцца ў вытворчасці. Тыя, што застаюцца, звычайна маюць кароткі спіс агульных рысаў дарослага стану:

Абагульненне — апрацоўка раней невядомых дадзеных без іх разбурэння.
Надзейнасць — не паводзіць сябе як падкідванне манеты, калі ўваходныя дадзеныя становяцца дзіўнымі.
Бяспека і ахова — цяжэй падмануць ці злоўжываць.
Тлумачнасць — не заўсёды крышталёва зразумелая, але прынамсі адладжвальная.
Канфідэнцыяльнасць і справядлівасць — паважае межы дадзеных і не мае прадузятасці.
Эфектыўнасць — дастаткова даступная для маштабнай працы.

Гэта ў асноўным спіс рэчаў, якія рэгулятары і сістэмы кіравання рызыкамі таксама любяць: валіднасць, бяспека, падсправаздачнасць, празрыстасць, справядлівасць і ўсе найлепшыя якасці. Але, шчыра кажучы, гэта не тое, што прыемна мець; калі людзі залежаць ад вашай сістэмы, яны — стаўкі за сталом.

Хуткая праверка на надзейнасць: мадэлі супраць алгарытмаў супраць дадзеных 🤷

Вось трохчасткавы падзел:

Мадэль — гэта вывучаная «рэч», якая пераўтварае ўваходныя дадзеныя ў выхадныя.
Алгарытм — гэта рэцэпт, які навучае або запускае мадэль (напрыклад, градыентны спуск, пошук прамяня).
Дадзеныя — гэта неапрацаваныя прыклады, якія вучаць мадэль, як сябе паводзіць.

Трохі нязграбная метафара: даныя — гэта вашы інгрэдыенты, алгарытм — рэцэпт, а мадэль — торт. Часам ён смачны, а часам апускаецца ў сярэдзіне, таму што вы занадта рана падгледзелі.

Сямействы мадэляў штучнага інтэлекту, з якімі вы сапраўды сустрэнецеся 🧩

Існуе бясконцая колькасць катэгорый, але вось практычны склад:

Лінейныя і лагістычныя мадэлі — простыя, хуткія, інтэрпрэтуемыя. Усё яшчэ непераўзыдзеныя базавыя ўзроўні для таблічных дадзеных.
Дрэвы і ансамблі — дрэвы рашэнняў — гэта падзелы тыпу «калі-то»; аб'яднайце лес або павялічце іх, і яны будуць неверагодна моцнымі.
Згорткавыя нейронныя сеткі (ЗНС) — аснова распазнавання малюнкаў/відэа. Фільтры → краю → формы → аб'екты.
Мадэлі паслядоўнасцей: RNN і трансфарматары — для тэксту, маўлення, бялкоў, кода. Самаўвага трансфарматараў змяніла правілы гульні [3].
Дыфузійныя мадэлі — генератыўныя, крок за крокам ператвараюць выпадковы шум у кагерэнтныя выявы [4].
Графавыя нейронныя сеткі (ГНС) — створаны для сетак і адносін: малекулы, сацыяльныя графы, кольцы махлярства.
Навучанне з падмацаваннем (НП) — метад спроб і памылак, які аптымізуе ўзнагароду. Падумайце пра робататэхніку, гульні, паслядоўныя рашэнні.
Старыя надзейныя: kNN, Naive Bayes — хуткія базавыя лініі, асабліва для тэксту, калі вам патрэбныя адказы ўчора .

Заўвага: не варта занадта ўскладняць таблічныя дадзеныя. Лагістычная рэгрэсія або дрэвы з павышаным узроўнем часта перашкаджаюць глыбокім сеткам. Трансфарматары выдатныя, але не ўсюды.

Як выглядае трэніроўка пад капотам 🔧

Большасць сучасных мадэляў вучацца, мінімізуючы функцыю страт з дапамогай нейкай формы градыентнага спуску . Зваротнае распаўсюджванне адсоўвае карэкцыі назад, каб кожны параметр ведаў, як рухацца. Дадайце такія хітрасці, як ранняе прыпыненне, рэгулярызацыя або разумныя аптымізатары, каб не дапусціць хаосу.

Праверкі рэальнасці, якія варта павесіць над сталом:

Якасць дадзеных > выбар мадэлі. Сер'ёзна.
Заўсёды бярыце нешта простае для пачатку. Калі лінейная мадэль не спрацуе, то, верагодна, і ваш канвеер дадзеных таксама.
Сачыце за праверкай. Калі страты пры навучанні змяншаюцца, а страты пры валідацыі растуць — прывітанне, перанавучанне.

Ацэнка мадэляў: дакладнасць вырашае пытанне 📏

Дакладнасць гучыць нядрэнна, але гэта жахлівая адзінкавая лічба. У залежнасці ад вашай задачы:

Дакладнасць — калі вы кажаце станоўча, як часта вы маеце рацыю?
Успомніце — колькі з усіх сапраўды станоўчых бакоў вы знайшлі?
F1 - балансуе дакладнасць і запамінанне.
Крывыя PR , асабліва на незбалансаваных дадзеных, значна больш сумленныя, чым ROC [5].

Бонус: праверце каліброўку (ці маюць імавернасці нейкі сэнс?) і дрэйф (ці зрушваюцца вашы ўваходныя дадзеныя пад вашымі нагамі?). Нават «выдатная» мадэль састарэе.

Кіраванне, рызыка, правілы дарожнага руху 🧭

Як толькі ваша мадэль дакранецца да людзей, важна мець адпаведнасць патрабаванням. Два важныя якары:

Мадэль кіравання штучным інтэлектам (RMF) NIST — добраахвотная, але практычная, з этапамі жыццёвага цыклу (кіраванне, картаграфаванне, вымярэнне, кіраванне) і сегментамі надзейнасці [1].
Закон ЕС аб штучным інтэлекце — рэгуляванне на аснове рызык, якое ўжо дзейнічае ў ліпені 2024 года і ўстанаўлівае строгія абавязкі для сістэм высокай рызыкі і нават некаторых мадэляў агульнага прызначэння [2].

Прагматычны вынік: задакументуйце, што вы стварылі, як вы гэта пратэставалі і на якія рызыкі вы паставілі галачку. Гэта зэканоміць вам час на выклікі экстранай дапамогі ўначы.

Выбіраем мадэль, не губляючы розуму 🧭➡️

Паўтаральны працэс:

Вызначце рашэнне — што такое добрая памылка, а што дрэнная?
Дадзеныя аўдыту - памер, баланс, чысціня.
Усталюйце абмежаванні - тлумачальнасць, затрымка, бюджэт.
Выканайце базавыя планы — пачніце з лінейнай/лагістычнай або невялікага дрэва.
Разумна выконвайце ітэрацыі — дадавайце функцыі, наладжвайце, а потым мяняйце сямейства, калі дасягнеце плато.

Тут сумна, але сумна — гэта добра.

Параўнальны здымак 📋

Тып мадэлі	Аўдыторыя	Прыблізная цана	Чаму гэта працуе
Лінейныя і лагістычныя	аналітыкі, навукоўцы	нізкі–сярэдні	інтэрпрэтаваны, хуткі, магутны таблічны інструмент
Дрэвы рашэнняў	змешаныя каманды	нізкі	чытэльныя для чалавека падзелы, нелінейная апрацоўка
Выпадковы лес	каманды па прадуктах	сярэдні	ансамблі памяншаюць дысперсію, моцныя генералісты
Дрэвы з узмацненнем градыенту	спецыялісты па апрацоўцы дадзеных	сярэдні	SOTA на табліцы, моцная з неахайнымі функцыямі
CNN	людзі зроку	сярэдне-высокі	згортка → прасторавыя іерархіі
Трансформеры	НЛП + мультымадальны	высокі	самаўвага цудоўна маштабуецца [3]
Дыфузійныя мадэлі	творчыя каманды	высокі	шумапрыглушэнне дае генератыўную магію [4]
ГНН	графічныя батанікі	сярэдне-высокі	перадача паведамленняў кадуе адносіны
kNN / Наіўны Байес	хакеры спяшаюцца	вельмі нізкі	простыя базавыя схемы, імгненнае разгортванне
Навучанне з падмацаваннем	шмат даследаванняў	сярэдне-высокі	аптымізуе паслядоўныя дзеянні, але цяжэй кантраляваць

«Спецыяльнасці» на практыцы 🧪

Выявы → CNN пераўзыходзяць іншых тым, што аб'ядноўваюць лакальныя заканамернасці ў больш буйныя.
Мова → Трансфарматары, з улікам уласнай увагі, апрацоўваюць доўгі кантэкст [3].
Графікі → GNN ззяюць, калі сувязі маюць значэнне.
Генератыўныя асяроддзі → Дыфузійныя мадэлі, паэтапнае падаўленне шуму [4].

Data: ціхі MVP 🧰

Мадэлі не могуць захоўваць няправільныя дадзеныя. Асновы:

Правільна падзяліць наборы дадзеных (без уцечак, з улікам часу).
Апрацоўка дысбалансу (перавыбарка, вагі, парогі).
Старанна распрацоўвайце функцыі — нават глыбокія мадэлі атрымліваюць карысць.
Праверце на наяўнасць псіхічнага здароўя.

Вымярэнне поспеху без падману 🎯

Супастаўце паказчыкі з рэальнымі выдаткамі. Прыклад: сартаванне заявак у службу падтрымкі.

Адкліканне павялічвае паказчык выкрыцця тэрміновых заявак.
Дакладнасць не дазваляе агентам патануць у шуме.
F1 балансуе паміж імі.
Зрух і каліброўка адсочвання, каб сістэма не згнівала ціха.

Рызыка, справядлівасць, дакументы - зрабіце гэта загадзя 📝

Успрымайце дакументацыю не як бюракратыю, а як страхоўку. Праверкі на прадузятасць, тэсты на надзейнасць, крыніцы дадзеных — запісвайце ўсё. Такія фрэймворкі, як AI RMF [1], і законы, такія як Закон ЕС аб штучным інтэлекце [2], усё роўна становяцца важнымі.

Кароткі план для пачатку 🚀

Вызначыцеся з рашэннем і метрыкай.
Збярыце чысты набор даных.
Базавая лінія з лінейнай/дрэвападобнай графікай.
Перайдзіце да патрэбнай сям'і для выбару мадальнасці.
Ацаніце з дапамогай адпаведных метрык.
Задакументуйце рызыкі перад адпраўкай.

Часта задаваныя пытанні маланкі ⚡

Пачакайце, зноў жа — што такое мадэль штучнага інтэлекту?
Функцыя, навучаная на дадзеных для адлюстравання ўваходных дадзеных у выхадныя. Магія заключаецца ў абагульненні, а не ў запамінанні.
Ці заўсёды перамагаюць большыя мадэлі?
Не на таблічных дрэвах — усё роўна пераважаюць. На тэксце/малюнках — так, памер часта дапамагае [3][4].
Тлумачнасць супраць дакладнасці?
Часам гэта кампраміс. Выкарыстоўвайце гібрыдныя стратэгіі.
Даводка да ладу ці хуткая распрацоўка?
Залежыць ад бюджэту і аб'ёму задачы. Абодва варыянты маюць сваё месца.

Калі ласка, дадайце 🌯

Мадэлі штучнага інтэлекту = функцыі, якія вучацца на дадзеных. Іх карыснымі робяць не толькі дакладнасць, але і давер, кіраванне рызыкамі і прадуманае разгортванне. Пачніце з простага, вымерайце тое, што важна, дакументуйце непрыемныя дэталі, а потым (і толькі потым) бярыцеся за нешта больш вытанчанае.

Калі вы прытрымліваецеся толькі аднаго сказа: мадэлі штучнага інтэлекту — гэта вывучаныя функцыі, навучаныя з аптымізацыяй, ацэненыя з дапамогай кантэкстна-спецыфічных метрык і разгорнутыя з агароджамі. Вось і ўся справа.

Спасылкі

NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0)
NIST AI RMF 1.0 (PDF)
Закон ЕС аб штучным інтэлекце - Афіцыйны часопіс (2024/1689, 12 ліпеня 2024 г.)
EUR-Lex: Закон аб штучным інтэлекце (афіцыйны PDF)
Трансформеры / Увага да сябе - Васвані і інш., Увага - гэта ўсё, што вам трэба (2017).
arXiv:1706.03762 (PDF)
Дыфузійныя мадэлі - Хо, Джайн, Абель, Падаўленне шуму ў дыфузійных імавернасных мадэлях (2020).
arXiv:2006.11239 (PDF)
PR супраць ROC пры дысбалансе - Saito & Rehmsmeier, PLOS ONE (2015).
DOI: 10.1371/journal.pone.0118432

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога

Краіна/рэгіён