Штучны інтэлект можа здавацца магічным фокусам, на які ўсе ківаюць галовамі, ціха думаючы... пачакайце, а як гэта насамрэч працуе? Добрыя навіны. Мы развеем гэта без лішняй міфалогіі, застанемся практычнымі і дадамо некалькі недасканалых аналогій, якія ўсё роўна дапамогуць зразумець. Калі вы проста хочаце зразумець сутнасць, перайдзіце да адказу ніжэй, які займе ўсяго адну хвіліну; але, шчыра кажучы, менавіта ў дэталях усё ўспыхвае 💡.
Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Што азначае GPT
Кароткае тлумачэнне абрэвіятуры GPT і яе значэння.
🔗 Адкуль штучны інтэлект атрымлівае інфармацыю
Крыніцы, якія штучны інтэлект выкарыстоўвае для навучання, трэніровак і адказаў на пытанні.
🔗 Як укараніць штучны інтэлект у свой бізнес
Практычныя крокі, інструменты і працоўныя працэсы для эфектыўнай інтэграцыі штучнага інтэлекту.
🔗 Як пачаць кампанію па штучным інтэлекце
Ад ідэі да запуску: праверка, фінансаванне, каманда і рэалізацыя.
Як працуе штучны інтэлект? Аднахвілінны адказ ⏱️
Штучны інтэлект вывучае заканамернасці з дадзеных, каб рабіць прагнозы або генераваць кантэнт — не патрабуецца рукапісных правілаў. Сістэма прымае прыклады, вымярае ступень памылковасці з дапамогай функцыі страт і падладжвае свае ўнутраныя ручкі — параметры — каб кожны раз памыляцца крыху менш. Прамыйце, паўтарыце, палепшыце. Пры дастатковай колькасці цыклаў гэта становіцца карысным. Адна і тая ж гісторыя, незалежна ад таго, класіфікуеце вы электронныя лісты, выяўляеце пухліны, гуляеце ў настольныя гульні ці пішаце хайку. Для азнаямлення з «машынным навучаннем» агляд IBM даволі грунтоўны [1].
Большая частка сучаснага штучнага інтэлекту — гэта машыннае навучанне. Простая версія: увод дадзеных, вывучэнне адпаведнасці ўваходных дадзеных выхадным дадзеным, а затым абагульненне на новыя рэчы. Не магічная матэматыка, вылічэнні і, калі быць шчырымі, дробка мастацтва.
«Як працуе штучны інтэлект?» ✅
Калі людзі шукаюць у Google « Як працуе штучны інтэлект?» , яны звычайна хочуць:
-
шматразова выкарыстоўваная ментальная мадэль, якой яны могуць давяраць
-
карта асноўных тыпаў навучання, каб жаргон перастаў быць страшным
-
зазірнуць унутр нейронных сетак, не заблудзіўшыся
-
чаму трансформеры, здаецца, цяпер кіруюць светам
-
практычны канвеер ад дадзеных да разгортвання
-
хуткая параўнальная табліца, якую можна зрабіць скрыншот і захаваць
-
бар'еры этыкі, прадузятасці і надзейнасці, якія не з'яўляюцца некантралюемымі
Вось што вы тут атрымаеце. Калі я і блукаю, то раблю гэта наўмысна — нібыта іду па маляўнічым маршруце і неяк лепш запамінаю вуліцы ў наступны раз. 🗺️
Асноўныя інгрэдыенты большасці сістэм штучнага інтэлекту 🧪
Уявіце сабе сістэму штучнага інтэлекту як кухню. Чатыры інгрэдыенты з'яўляюцца зноў і зноў:
-
Дадзеныя — прыклады з пазнакамі або без іх.
-
Мадэль — матэматычная функцыя з наладжвальнымі параметрамі.
-
Мэта — функцыя страт, якая вымярае, наколькі дрэнныя здагадкі.
-
Аптымізацыя — алгарытм, які змяняе параметры, каб паменшыць страты.
У глыбокім навучанні гэты штуршок звычайна ажыццяўляецца па градыентным спуску з зваротным распаўсюджваннем — эфектыўны спосаб высветліць, якая ручка на гіганцкай дэцы рыпала, а затым крыху паменшыць яе гучнасць [2].
Міні-кейс: Мы замянілі нетрывалы спам-фільтр на аснове правілаў невялікай кантраляванай мадэллю. Пасля тыдня цыклаў пазнака → вымярэнне → абнаўленне колькасць ілжывых спрацоўванняў і заявак у службу падтрымкі зменшылася. Нічога асаблівага — толькі больш выразныя мэты (дакладнасць у «хамскіх» электронных лістах) і лепшая аптымізацыя.
Парадыгмы навучання з першага погляду 🎓
-
Навучанне з настаўнікам.
Вы прадастаўляеце пары ўваход-выхад (фотаздымкі з пазнакамі, электронныя лісты, пазначаныя як спам/не спам). Мадэль навучаецца ўваход → выхад. Аснова многіх практычных сістэм [1]. -
Навучанне без настаўніка.
Няма пазнак. Знайдзіце структурныя кластары, сціскі, схаваныя фактары. Выдатна падыходзіць для даследавання або папярэдняга навучання. -
Саманавучанне
Мадэль стварае свае ўласныя пазнакі (прадказвае наступнае слова, адсутны фрагмент выявы). Ператварае неапрацаваныя дадзеныя ў навучальны сігнал у вялікім маштабе; ляжыць у аснове сучасных мадэляў мовы і зроку. -
Навучанне з падмацаваннем
Агент дзейнічае, збірае ўзнагароды і засвойвае палітыку, якая максімізуе сукупную ўзнагароду. Калі «функцыі каштоўнасці», «палітыка» і «навучанне з выкарыстаннем часавых розніц» вам знаёмыя, то гэта іх дом [5].
Так, на практыцы катэгорыі размываюцца. Гібрыдныя метады — гэта нармальна. Рэальнае жыццё бязладнае, і добрая інжынерыя сустракае яго там, дзе ён ёсць.
Унутры нейроннай сеткі без галаўнога болю 🧠
Нейронная сетка аб'ядноўвае пласты малюсенькіх матэматычных адзінак (нейронаў). Кожны пласт пераўтварае ўваходныя дадзеныя з дапамогай вагаў, зрушэнняў і мяккай нелінейнасці, падобнай да ReLU або GELU. Раннія пласты вывучаюць простыя функцыі; больш глыбокія кадуюць абстракцыі. «Магія» — калі можна так сказаць — заключаецца ў кампазіцыях : злучайце невялікія функцыі, і вы можаце мадэляваць надзвычай складаныя з'явы.
Трэніровачны цыкл, толькі вібрацыі:
-
здагадка → вымярэнне памылкі → атрыбуцыя віны праз зваротную падтрымку → штуршкі вагі → паўтарэнне.
Рабіце гэта для некалькіх партый, і, як нязграбны танцор, які ўдасканальвае кожную песню, мадэль перастане наступаць вам на ногі. Для зручнага і строгага раздзела пра бэк-пропіў гл. [2].
Чаму трансформеры заваявалі папулярнасць — і што насамрэч азначае «увага» 🧲
Трансфарматары выкарыстоўваюць самаўвагу , каб адначасова ацаніць, якія часткі ўваходнага сігналу маюць значэнне адна для адной. Замест таго, каб чытаць сказ строга злева направа, як у старых мадэлях, трансфарматар можа глядзець паўсюль і дынамічна ацэньваць сувязі — гэтак жа, як сканаванне перапоўненага пакоя, каб убачыць, хто з кім размаўляе.
Архітэктура і вынікі апісаны ў артыкуле пад назвай « Увага — гэта ўсё, што вам трэба»
Самааналіз у адным радку: стварыць запыту , ключа і значэння для кожнага токена; вылічыць падабенства, каб атрымаць вагі ўвагі; адпаведна змяшаць значэнні. Вытанчана ў дэталях, элегантна па духу.
Увага: трансфарматары дамінуюць, а не манапалізуюць. CNN, RNN і дрэвападобныя ансамблі па-ранейшаму выйграюць па пэўных тыпах дадзеных і абмежаваннях затрымкі/кошту. Выбірайце архітэктуру для задачы, а не ажыятаж.
Як працуе штучны інтэлект? Практычны канвеер, які вы будзеце выкарыстоўваць 🛠️
-
Фарміраванне праблемы.
Што вы прагназуеце або ствараеце, і як будзе вымярацца поспех? -
дадзеныя
, пры неабходнасці маркіруйце, ачышчайце і раздзяляйце. Будзьце гатовыя да адсутнасці значэнняў і памежных выпадкаў. -
Мадэляванне
Пачніце з простага. Базавыя ўзроўні (лагістычная рэгрэсія, градыентнае ўзмацненне або невялікі трансфарматар) часта пераўзыходзяць гераічную складанасць. -
Навучанне
Выберыце мэту, аптымізатар, усталюйце гіперпараметры. Ітэруйце. -
Ацэнка.
Выкарыстоўвайце ўстрыманні, перакрыжаваную праверку і метрыкі, звязаныя з вашай рэальнай мэтай (дакладнасць, F1, AUROC, BLEU, збянтэжанасць, затрымка). -
Разгортванне.
Абслугоўванне за API або ўбудаванне ў праграму. Адсочванне затрымкі, кошту, прапускной здольнасці. -
Маніторынг і кіраванне.
Назірайце за зрухам, справядлівасцю, надзейнасцю і бяспекай. Структура кіравання рызыкамі ў галіне штучнага інтэлекту NIST (КІРУЙЦЕ, КАРТЫРУЙЦЕ, ВЫМЯРАЙЦЕ, КІРУЙЦЕ) — гэта практычны кантрольны спіс для надзейных сістэм ад пачатку да канца [4].
Міні-кейс: мадэль візуалізацыі выдатна спрацавала ў лабараторыі, а потым дала збой у полі пры змене асвятлення. Маніторынг пазначанага зруху на ўваходных гістаграмах; хуткае дапаўненне + тонкая налада аднавілі прадукцыйнасць. Сумна? Так. Эфектыўна? Таксама так.
Параўнальная табліца - падыходы, для каго яны, прыблізны кошт, чаму яны працуюць 📊
Недасканаласць наўмысна: крыху няроўная фармулёўка дапамагае адчуваць сябе чалавечым.
| Падыход | Ідэальная аўдыторыя | Прыблізная цана | Чаму гэта працуе / нататкі |
|---|---|---|---|
| Навучанне пад наглядам | Аналітыкі, прадуктовыя каманды | нізкі–сярэдні | Прамое адлюстраванне ўводу → метка. Выдатна, калі меткі існуюць; гэта аснова многіх разгорнутых сістэм [1]. |
| Без нагляду | Даследчыкі дадзеных, даследаванні і распрацоўкі | нізкі | Знаходзіць кластары/сцісканні/схаваныя фактары — добра падыходзіць для выяўлення і папярэдняга навучання. |
| Самастойна | Каманды платформы | сярэдні | Стварае ўласныя этыкеткі з неапрацаваных шкал дадзеных з дапамогай вылічэнняў і дадзеных. |
| Навучанне з падмацаваннем | Робататэхніка, аперацыйныя даследаванні | сярэдне-высокі | Вывучае палітыку з сігналаў узнагароджання; прачытайце Саттана і Барта для атрымання канону [5]. |
| Трансформеры | НЛП, бачанне, мультымадальны | сярэдне-высокі | Самаўвага фіксуе глыбіні на вялікія адлегласці і добра паралелізуецца; гл. арыгінальную працу [3]. |
| Класічнае машыннае навучанне (дрэвы) | Таблічныя бізнес-праграмы | нізкі | Танныя, хуткія, часта шакавальна моцныя базавыя лініі для структураваных дадзеных. |
| На аснове правілаў/сімвал | Адпаведнасць, дэтэрмінаваная | вельмі нізкі | Празрыстая логіка; карысная ў гібрыдах, калі вам патрэбна магчымасць аўдыту. |
| Ацэнка і рызыка | Усе | змяняецца | Выкарыстоўвайце метады NIST «КІРАВАННЕ-МАПАВАННЕ-ВЫМЯРЭННЕ-КІРАВАННЕ», каб забяспечыць бяспеку і карыснасць [4]. |
Прыкладна цана = маркіроўка дадзеных + вылічэнні + людзі + абслугоўванне.
Паглыбленае апусканне 1 - функцыі страт, градыенты і малюсенькія крокі, якія змяняюць усё 📉
Уявіце, што вы пракладаеце лінію для прагназавання цаны дома на падставе яго памеру. Вы выбіраеце параметры (w) і (b), прадказваеце (\hat{y} = wx + b) і вымяраеце памылку з дапамогай сярэднеквадратычнага значэння страт. Градыент паказвае, у якім кірунку рухацца (w) і (b), каб хутчэй паменшыць страты — як спуск у тумане, адчуваючы, у які бок нахіл зямлі. Абнаўляйце пасля кожнай партыі, і ваша лінія будзе бліжэй да рэальнасці.
У глыбокіх сетках гэта тая ж песня з большай паласой. Backprop эфектыўна вылічвае, як параметры кожнага пласта паўплывалі на канчатковую памылку, каб вы маглі падштурхнуць мільёны (ці мільярды) ручак у правільным кірунку [2].
Ключавыя інтуіцыі:
-
Страты фарміруюць ландшафт.
-
Градыенты — ваш компас.
-
Хуткасць навучання залежыць ад памеру кроку: занадта вялікі — і вы хістаецеся, занадта малы — і вы дрэмлеце.
-
Рэгулярызацыя не дазваляе вам запамінаць трэніровачны набор, як папугай, з ідэальным успамінаннем, але без разумення.
Глыбокае апусканне 2 - убудаванне, падказкі і пошук 🧭
Убудаванні адлюстроўваюць словы, выявы або элементы ў вектарныя прасторы, дзе падобныя рэчы размяшчаюцца побач адзін з адным. Гэта дазваляе вам:
-
знайсці семантычна падобныя ўрыўкі
-
пошук сілы, які разумее сэнс
-
падключыць генерацыю з дапоўненым пошукам (RAG) , каб моўная мадэль магла шукаць факты перад запісам
Падказкі — гэта тое, як вы кіруеце генератыўнымі мадэлямі: апісваеце задачу, прыводзіце прыклады, усталёўваеце абмежаванні. Уявіце сабе гэта як напісанне вельмі падрабязнай спецыфікацыі для вельмі хуткага стажора: імклівага, часам празмерна ўпэўненага ў сабе.
Практычная парада: калі ў вашай мадэлі галюцынацыі, дадайце прыгадванне, удакладніце падказку або ацэньвайце з дапамогай абгрунтаваных метрык замест «вібрацый».
Глыбокае апусканне 3 - ацэнка без ілюзій 🧪
Добрая ацэнка здаецца сумнай — у гэтым і ёсць сэнс.
-
Выкарыстоўвайце заблакаваны набор тэстаў.
-
Выберыце метрыку, якая адлюстроўвае боль карыстальніка.
-
Зрабіце абляцыю, каб ведаць, што насамрэч дапамагло.
-
Рэгіструйце памылкі з рэальнымі, неакуратнымі прыкладамі.
У вытворчасці маніторынг — гэта ацэнка, якая ніколі не спыняецца. Здараюцца адхіленні. З'яўляецца новы слэнг, датчыкі перакалібруюцца, і ўчорашняя мадэль трохі зрушваецца з месца. Структура NIST — гэта практычны даведнік для бягучага кіравання рызыкамі і кіравання, а не палітычны дакумент, які можна адкласці [4].
Заўвага пра этыку, прадузятасць і надзейнасць ⚖️
Сістэмы штучнага інтэлекту адлюстроўваюць свае дадзеныя і кантэкст разгортвання. Гэта нясе рызыкі: прадузятасць, нераўнамерныя памылкі паміж групамі, далікатнасць пры зруху размеркавання. Этычнае выкарыстанне не з'яўляецца абавязковым — гэта стаўкі на стол. NIST паказвае на канкрэтныя практыкі: дакументаванне рызык і наступстваў, вымярэнне шкодных прадузятасцяў, стварэнне рэзервовых варыянтаў і інфармаванне людзей, калі стаўкі высокія [4].
Канкрэтныя крокі, якія дапамагаюць:
-
збіраць разнастайныя, прадстаўнічыя дадзеныя
-
вымяраць прадукцыйнасць па розных падгрупах насельніцтва
-
картак мадэляў дакументаў і табліц дадзеных
-
дадаць кантроль чалавека там, дзе стаўкі высокія
-
распрацоўваць механізмы бяспекі, калі сістэма нявызначаная
Як працуе штучны інтэлект? У якасці ментальнай мадэлі вы можаце выкарыстоўваць яго паўторна 🧩
Кампактны кантрольны спіс, які можна прымяніць практычна да любой сістэмы штучнага інтэлекту:
-
Якая мэта? Прагназаванне, ранжыраванне, генерацыя, кантроль?
-
Адкуль бярэцца сігнал навучання? З этыкетак, заданняў пад самакантроль, узнагарод?
-
Якая архітэктура выкарыстоўваецца? Лінейная мадэль, дрэвападобны ансамбль, CNN, RNN, трансфарматар [3]?
-
Як гэта аптымізавана? Варыяцыі градыентнага спуску/зваротнае прасоўванне [2]?
-
Які рэжым дадзеных? Невялікі пазначаны набор, мора непазначанага тэксту, мадэляванае асяроддзе?
-
Якія рэжымы збояў і меры засцярогі? Зрушэнне, дрэйф, галюцынацыі, затрымка, карта выдаткаў у адпаведнасці з NIST GOVERN-MAP-MEASURE-MANAGE [4].
Калі вы можаце адказаць на гэтыя пытанні, вы ў асноўным разумееце сістэму — астатняе — гэта дэталі рэалізацыі і веды прадметнай вобласці.
Хуткія крыніцы, вартыя закладак 🔖
-
Уводзіны ў канцэпцыі машыннага навучання (IBM) простай мовай [1]
-
Зваротнае распаўсюджванне з дапамогай дыяграм і лёгкай матэматыкі [2]
-
Праца пра трансфарматара, якая змяніла мадэляванне паслядоўнасцей [3]
-
Структура кіравання рызыкамі штучнага інтэлекту NIST (практычнае кіраванне) [4]
-
Падручнік па кананічным навучанні з падмацаваннем (бясплатна) [5]
Часта задаваныя пытанні маланкі ⚡
Ці з'яўляецца штучны інтэлект проста статыстыкай?
Гэта статыстыка плюс аптымізацыя, вылічэнні, інжынерыя дадзеных і дызайн прадукту. Статыстыка — гэта шкілет, астатняе — мышцы.
Ці заўсёды перамагаюць больш буйныя мадэлі?
Маштабаванне дапамагае, але якасць дадзеных, ацэнка і абмежаванні на разгортванне часта маюць большае значэнне. Найменшая мадэль, якая дасягае вашай мэты, звычайна найлепшая для карыстальнікаў і кашалькоў.
Ці можа штучны інтэлект зразумець?
Дайце азначэнне « разумець» . Мадэлі фіксуюць структуру дадзеных і ўражліва абагульняюць, але ў іх ёсць сляпыя зоны, і яны могуць упэўнена памыляцца. Стаўцеся да іх як да магутных інструментаў, а не як да мудрацоў.
Ці вечная эпоха трансфарматараў?
Хутчэй за ўсё, не назаўжды. Зараз яна дамінуе, таму што ўвага добра распаралельваецца і маштабуецца, як паказана ў арыгінальнай працы [3]. Але даследаванні працягваюцца.
Як працуе штучны інтэлект? Занадта доўга, не чытаў 🧵
-
Штучны інтэлект вывучае заканамернасці з дадзеных, мінімізуе страты і абагульняе іх на новыя ўваходныя дадзеныя [1,2].
-
Асноўнымі метадамі навучання з'яўляюцца навучанне з кантролем, без кантроля, саманавучанне і навучанне з падмацаваннем; навучанне з кантролем вучыцца на ўзнагародах [5].
-
Нейронавыя сеткі выкарыстоўваюць зваротнае распаўсюджванне памылак і градыентны спуск для эфектыўнай карэкціроўкі мільёнаў параметраў [2].
-
Трансфарматары дамінуюць у многіх паслядоўных задачах, таму што ўвага да сябе паралельна фіксуе адносіны ў маштабе [3].
-
Штучны інтэлект у рэальным свеце — гэта канвеер — ад фармулявання праблемы да разгортвання і кіравання, — і структура NIST дазваляе вам сумленна ацэньваць рызыкі [4].
Калі хтосьці зноў спытае: « Як працуе штучны інтэлект?» , вы можаце ўсміхнуцца, выпіць кавы і сказаць: ён вучыцца на дадзеных, аптымізуе страты і выкарыстоўвае такія архітэктуры, як трансфарматары або дрэвападобныя ансамблі, у залежнасці ад праблемы. Затым падміргніце, бо гэта і проста, і хітра. 😉
Спасылкі
[1] IBM - Што такое машыннае навучанне?
чытаць далей
[2] Майкл Нільсен - Як працуе алгарытм зваротнага распаўсюджвання
чытаць далей
[3] Васвані і інш. - Увага — гэта ўсё, што вам трэба (arXiv)
чытаць далей
[4] NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0)
чытаць далей
[5] Сатан і Барта - Навучанне з падмацаваннем: Уводзіны (2-е выд.)
чытаць далей