Як працуе штучны інтэлект?

Штучны інтэлект можа здавацца магічным фокусам, на які ўсе ківаюць галовамі, ціха думаючы... пачакайце, а як гэта насамрэч працуе? Добрыя навіны. Мы развеем гэта без лішняй міфалогіі, застанемся практычнымі і дадамо некалькі недасканалых аналогій, якія ўсё роўна дапамогуць зразумець. Калі вы проста хочаце зразумець сутнасць, перайдзіце да адказу ніжэй, які займе ўсяго адну хвіліну; але, шчыра кажучы, менавіта ў дэталях усё ўспыхвае 💡.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Што азначае GPT
Кароткае тлумачэнне абрэвіятуры GPT і яе значэння.

🔗 Адкуль штучны інтэлект атрымлівае інфармацыю
Крыніцы, якія штучны інтэлект выкарыстоўвае для навучання, трэніровак і адказаў на пытанні.

🔗 Як укараніць штучны інтэлект у свой бізнес
Практычныя крокі, інструменты і працоўныя працэсы для эфектыўнай інтэграцыі штучнага інтэлекту.

🔗 Як пачаць кампанію па штучным інтэлекце
Ад ідэі да запуску: праверка, фінансаванне, каманда і рэалізацыя.

Як працуе штучны інтэлект? Аднахвілінны адказ ⏱️

Штучны інтэлект вывучае заканамернасці з дадзеных, каб рабіць прагнозы або генераваць кантэнт — не патрабуецца рукапісных правілаў. Сістэма прымае прыклады, вымярае ступень памылковасці з дапамогай функцыі страт і падладжвае свае ўнутраныя ручкі — параметры — каб кожны раз памыляцца крыху менш. Прамыйце, паўтарыце, палепшыце. Пры дастатковай колькасці цыклаў гэта становіцца карысным. Адна і тая ж гісторыя, незалежна ад таго, класіфікуеце вы электронныя лісты, выяўляеце пухліны, гуляеце ў настольныя гульні ці пішаце хайку. Для азнаямлення з «машынным навучаннем» агляд IBM даволі грунтоўны [1].

Большая частка сучаснага штучнага інтэлекту — гэта машыннае навучанне. Простая версія: увод дадзеных, вывучэнне адпаведнасці ўваходных дадзеных выхадным дадзеным, а затым абагульненне на новыя рэчы. Не магічная матэматыка, вылічэнні і, калі быць шчырымі, дробка мастацтва.

«Як працуе штучны інтэлект?» ✅

Калі людзі шукаюць у Google « Як працуе штучны інтэлект?» , яны звычайна хочуць:

шматразова выкарыстоўваная ментальная мадэль, якой яны могуць давяраць
карта асноўных тыпаў навучання, каб жаргон перастаў быць страшным
зазірнуць унутр нейронных сетак, не заблудзіўшыся
чаму трансформеры, здаецца, цяпер кіруюць светам
практычны канвеер ад дадзеных да разгортвання
хуткая параўнальная табліца, якую можна зрабіць скрыншот і захаваць
бар'еры этыкі, прадузятасці і надзейнасці, якія не з'яўляюцца некантралюемымі

Вось што вы тут атрымаеце. Калі я і блукаю, то раблю гэта наўмысна — нібыта іду па маляўнічым маршруце і неяк лепш запамінаю вуліцы ў наступны раз. 🗺️

Асноўныя інгрэдыенты большасці сістэм штучнага інтэлекту 🧪

Уявіце сабе сістэму штучнага інтэлекту як кухню. Чатыры інгрэдыенты з'яўляюцца зноў і зноў:

Дадзеныя — прыклады з пазнакамі або без іх.
Мадэль — матэматычная функцыя з наладжвальнымі параметрамі.
Мэта — функцыя страт, якая вымярае, наколькі дрэнныя здагадкі.
Аптымізацыя — алгарытм, які змяняе параметры, каб паменшыць страты.

У глыбокім навучанні гэты штуршок звычайна ажыццяўляецца па градыентным спуску з зваротным распаўсюджваннем — эфектыўны спосаб высветліць, якая ручка на гіганцкай дэцы рыпала, а затым крыху паменшыць яе гучнасць [2].

Міні-кейс: Мы замянілі нетрывалы спам-фільтр на аснове правілаў невялікай кантраляванай мадэллю. Пасля тыдня цыклаў пазнака → вымярэнне → абнаўленне колькасць ілжывых спрацоўванняў і заявак у службу падтрымкі зменшылася. Нічога асаблівага — толькі больш выразныя мэты (дакладнасць у «хамскіх» электронных лістах) і лепшая аптымізацыя.

Парадыгмы навучання з першага погляду 🎓

Навучанне з настаўнікам.
Вы прадастаўляеце пары ўваход-выхад (фотаздымкі з пазнакамі, электронныя лісты, пазначаныя як спам/не спам). Мадэль навучаецца ўваход → выхад. Аснова многіх практычных сістэм [1].
Навучанне без настаўніка.
Няма пазнак. Знайдзіце структурныя кластары, сціскі, схаваныя фактары. Выдатна падыходзіць для даследавання або папярэдняга навучання.
Саманавучанне
Мадэль стварае свае ўласныя пазнакі (прадказвае наступнае слова, адсутны фрагмент выявы). Ператварае неапрацаваныя дадзеныя ў навучальны сігнал у вялікім маштабе; ляжыць у аснове сучасных мадэляў мовы і зроку.
Навучанне з падмацаваннем
Агент дзейнічае, збірае ўзнагароды і засвойвае палітыку, якая максімізуе сукупную ўзнагароду. Калі «функцыі каштоўнасці», «палітыка» і «навучанне з выкарыстаннем часавых розніц» вам знаёмыя, то гэта іх дом [5].

Так, на практыцы катэгорыі размываюцца. Гібрыдныя метады — гэта нармальна. Рэальнае жыццё бязладнае, і добрая інжынерыя сустракае яго там, дзе ён ёсць.

Унутры нейроннай сеткі без галаўнога болю 🧠

Нейронная сетка аб'ядноўвае пласты малюсенькіх матэматычных адзінак (нейронаў). Кожны пласт пераўтварае ўваходныя дадзеныя з дапамогай вагаў, зрушэнняў і мяккай нелінейнасці, падобнай да ReLU або GELU. Раннія пласты вывучаюць простыя функцыі; больш глыбокія кадуюць абстракцыі. «Магія» — калі можна так сказаць — заключаецца ў кампазіцыях : злучайце невялікія функцыі, і вы можаце мадэляваць надзвычай складаныя з'явы.

Трэніровачны цыкл, толькі вібрацыі:

здагадка → вымярэнне памылкі → атрыбуцыя віны праз зваротную падтрымку → штуршкі вагі → паўтарэнне.

Рабіце гэта для некалькіх партый, і, як нязграбны танцор, які ўдасканальвае кожную песню, мадэль перастане наступаць вам на ногі. Для зручнага і строгага раздзела пра бэк-пропіў гл. [2].

Чаму трансформеры заваявалі папулярнасць — і што насамрэч азначае «увага» 🧲

Трансфарматары выкарыстоўваюць самаўвагу , каб адначасова ацаніць, якія часткі ўваходнага сігналу маюць значэнне адна для адной. Замест таго, каб чытаць сказ строга злева направа, як у старых мадэлях, трансфарматар можа глядзець паўсюль і дынамічна ацэньваць сувязі — гэтак жа, як сканаванне перапоўненага пакоя, каб убачыць, хто з кім размаўляе.

Архітэктура і вынікі апісаны ў артыкуле пад назвай « Увага — гэта ўсё, што вам трэба»

Самааналіз у адным радку: стварыць запыту , ключа і значэння для кожнага токена; вылічыць падабенства, каб атрымаць вагі ўвагі; адпаведна змяшаць значэнні. Вытанчана ў дэталях, элегантна па духу.

Увага: трансфарматары дамінуюць, а не манапалізуюць. CNN, RNN і дрэвападобныя ансамблі па-ранейшаму выйграюць па пэўных тыпах дадзеных і абмежаваннях затрымкі/кошту. Выбірайце архітэктуру для задачы, а не ажыятаж.

Як працуе штучны інтэлект? Практычны канвеер, які вы будзеце выкарыстоўваць 🛠️

Фарміраванне праблемы.
Што вы прагназуеце або ствараеце, і як будзе вымярацца поспех?
дадзеныя
, пры неабходнасці маркіруйце, ачышчайце і раздзяляйце. Будзьце гатовыя да адсутнасці значэнняў і памежных выпадкаў.
Мадэляванне
Пачніце з простага. Базавыя ўзроўні (лагістычная рэгрэсія, градыентнае ўзмацненне або невялікі трансфарматар) часта пераўзыходзяць гераічную складанасць.
Навучанне
Выберыце мэту, аптымізатар, усталюйце гіперпараметры. Ітэруйце.
Ацэнка.
Выкарыстоўвайце ўстрыманні, перакрыжаваную праверку і метрыкі, звязаныя з вашай рэальнай мэтай (дакладнасць, F1, AUROC, BLEU, збянтэжанасць, затрымка).
Разгортванне.
Абслугоўванне за API або ўбудаванне ў праграму. Адсочванне затрымкі, кошту, прапускной здольнасці.
Маніторынг і кіраванне.
Назірайце за зрухам, справядлівасцю, надзейнасцю і бяспекай. Структура кіравання рызыкамі ў галіне штучнага інтэлекту NIST (КІРУЙЦЕ, КАРТЫРУЙЦЕ, ВЫМЯРАЙЦЕ, КІРУЙЦЕ) — гэта практычны кантрольны спіс для надзейных сістэм ад пачатку да канца [4].

Міні-кейс: мадэль візуалізацыі выдатна спрацавала ў лабараторыі, а потым дала збой у полі пры змене асвятлення. Маніторынг пазначанага зруху на ўваходных гістаграмах; хуткае дапаўненне + тонкая налада аднавілі прадукцыйнасць. Сумна? Так. Эфектыўна? Таксама так.

Параўнальная табліца - падыходы, для каго яны, прыблізны кошт, чаму яны працуюць 📊

Недасканаласць наўмысна: крыху няроўная фармулёўка дапамагае адчуваць сябе чалавечым.

Падыход	Ідэальная аўдыторыя	Прыблізная цана	Чаму гэта працуе / нататкі
Навучанне пад наглядам	Аналітыкі, прадуктовыя каманды	нізкі–сярэдні	Прамое адлюстраванне ўводу → метка. Выдатна, калі меткі існуюць; гэта аснова многіх разгорнутых сістэм [1].
Без нагляду	Даследчыкі дадзеных, даследаванні і распрацоўкі	нізкі	Знаходзіць кластары/сцісканні/схаваныя фактары — добра падыходзіць для выяўлення і папярэдняга навучання.
Самастойна	Каманды платформы	сярэдні	Стварае ўласныя этыкеткі з неапрацаваных шкал дадзеных з дапамогай вылічэнняў і дадзеных.
Навучанне з падмацаваннем	Робататэхніка, аперацыйныя даследаванні	сярэдне-высокі	Вывучае палітыку з сігналаў узнагароджання; прачытайце Саттана і Барта для атрымання канону [5].
Трансформеры	НЛП, бачанне, мультымадальны	сярэдне-высокі	Самаўвага фіксуе глыбіні на вялікія адлегласці і добра паралелізуецца; гл. арыгінальную працу [3].
Класічнае машыннае навучанне (дрэвы)	Таблічныя бізнес-праграмы	нізкі	Танныя, хуткія, часта шакавальна моцныя базавыя лініі для структураваных дадзеных.
На аснове правілаў/сімвал	Адпаведнасць, дэтэрмінаваная	вельмі нізкі	Празрыстая логіка; карысная ў гібрыдах, калі вам патрэбна магчымасць аўдыту.
Ацэнка і рызыка	Усе	змяняецца	Выкарыстоўвайце метады NIST «КІРАВАННЕ-МАПАВАННЕ-ВЫМЯРЭННЕ-КІРАВАННЕ», каб забяспечыць бяспеку і карыснасць [4].

Прыкладна цана = маркіроўка дадзеных + вылічэнні + людзі + абслугоўванне.

Паглыбленае апусканне 1 - функцыі страт, градыенты і малюсенькія крокі, якія змяняюць усё 📉

Уявіце, што вы пракладаеце лінію для прагназавання цаны дома на падставе яго памеру. Вы выбіраеце параметры (w) і (b), прадказваеце (\hat{y} = wx + b) і вымяраеце памылку з дапамогай сярэднеквадратычнага значэння страт. Градыент паказвае, у якім кірунку рухацца (w) і (b), каб хутчэй паменшыць страты — як спуск у тумане, адчуваючы, у які бок нахіл зямлі. Абнаўляйце пасля кожнай партыі, і ваша лінія будзе бліжэй да рэальнасці.

У глыбокіх сетках гэта тая ж песня з большай паласой. Backprop эфектыўна вылічвае, як параметры кожнага пласта паўплывалі на канчатковую памылку, каб вы маглі падштурхнуць мільёны (ці мільярды) ручак у правільным кірунку [2].

Ключавыя інтуіцыі:

Страты фарміруюць ландшафт.
Градыенты — ваш компас.
Хуткасць навучання залежыць ад памеру кроку: занадта вялікі — і вы хістаецеся, занадта малы — і вы дрэмлеце.
Рэгулярызацыя не дазваляе вам запамінаць трэніровачны набор, як папугай, з ідэальным успамінаннем, але без разумення.

Глыбокае апусканне 2 - убудаванне, падказкі і пошук 🧭

Убудаванні адлюстроўваюць словы, выявы або элементы ў вектарныя прасторы, дзе падобныя рэчы размяшчаюцца побач адзін з адным. Гэта дазваляе вам:

знайсці семантычна падобныя ўрыўкі
пошук сілы, які разумее сэнс
падключыць генерацыю з дапоўненым пошукам (RAG) , каб моўная мадэль магла шукаць факты перад запісам

Падказкі — гэта тое, як вы кіруеце генератыўнымі мадэлямі: апісваеце задачу, прыводзіце прыклады, усталёўваеце абмежаванні. Уявіце сабе гэта як напісанне вельмі падрабязнай спецыфікацыі для вельмі хуткага стажора: імклівага, часам празмерна ўпэўненага ў сабе.

Практычная парада: калі ў вашай мадэлі галюцынацыі, дадайце прыгадванне, удакладніце падказку або ацэньвайце з дапамогай абгрунтаваных метрык замест «вібрацый».

Глыбокае апусканне 3 - ацэнка без ілюзій 🧪

Добрая ацэнка здаецца сумнай — у гэтым і ёсць сэнс.

Выкарыстоўвайце заблакаваны набор тэстаў.
Выберыце метрыку, якая адлюстроўвае боль карыстальніка.
Зрабіце абляцыю, каб ведаць, што насамрэч дапамагло.
Рэгіструйце памылкі з рэальнымі, неакуратнымі прыкладамі.

У вытворчасці маніторынг — гэта ацэнка, якая ніколі не спыняецца. Здараюцца адхіленні. З'яўляецца новы слэнг, датчыкі перакалібруюцца, і ўчорашняя мадэль трохі зрушваецца з месца. Структура NIST — гэта практычны даведнік для бягучага кіравання рызыкамі і кіравання, а не палітычны дакумент, які можна адкласці [4].

Заўвага пра этыку, прадузятасць і надзейнасць ⚖️

Сістэмы штучнага інтэлекту адлюстроўваюць свае дадзеныя і кантэкст разгортвання. Гэта нясе рызыкі: прадузятасць, нераўнамерныя памылкі паміж групамі, далікатнасць пры зруху размеркавання. Этычнае выкарыстанне не з'яўляецца абавязковым — гэта стаўкі на стол. NIST паказвае на канкрэтныя практыкі: дакументаванне рызык і наступстваў, вымярэнне шкодных прадузятасцяў, стварэнне рэзервовых варыянтаў і інфармаванне людзей, калі стаўкі высокія [4].

Канкрэтныя крокі, якія дапамагаюць:

збіраць разнастайныя, прадстаўнічыя дадзеныя
вымяраць прадукцыйнасць па розных падгрупах насельніцтва
картак мадэляў дакументаў і табліц дадзеных
дадаць кантроль чалавека там, дзе стаўкі высокія
распрацоўваць механізмы бяспекі, калі сістэма нявызначаная

Як працуе штучны інтэлект? У якасці ментальнай мадэлі вы можаце выкарыстоўваць яго паўторна 🧩

Кампактны кантрольны спіс, які можна прымяніць практычна да любой сістэмы штучнага інтэлекту:

Якая мэта? Прагназаванне, ранжыраванне, генерацыя, кантроль?
Адкуль бярэцца сігнал навучання? З этыкетак, заданняў пад самакантроль, узнагарод?
Якая архітэктура выкарыстоўваецца? Лінейная мадэль, дрэвападобны ансамбль, CNN, RNN, трансфарматар [3]?
Як гэта аптымізавана? Варыяцыі градыентнага спуску/зваротнае прасоўванне [2]?
Які рэжым дадзеных? Невялікі пазначаны набор, мора непазначанага тэксту, мадэляванае асяроддзе?
Якія рэжымы збояў і меры засцярогі? Зрушэнне, дрэйф, галюцынацыі, затрымка, карта выдаткаў у адпаведнасці з NIST GOVERN-MAP-MEASURE-MANAGE [4].

Калі вы можаце адказаць на гэтыя пытанні, вы ў асноўным разумееце сістэму — астатняе — гэта дэталі рэалізацыі і веды прадметнай вобласці.

Хуткія крыніцы, вартыя закладак 🔖

Уводзіны ў канцэпцыі машыннага навучання (IBM) простай мовай [1]
Зваротнае распаўсюджванне з дапамогай дыяграм і лёгкай матэматыкі [2]
Праца пра трансфарматара, якая змяніла мадэляванне паслядоўнасцей [3]
Структура кіравання рызыкамі штучнага інтэлекту NIST (практычнае кіраванне) [4]
Падручнік па кананічным навучанні з падмацаваннем (бясплатна) [5]

Часта задаваныя пытанні маланкі ⚡

Ці з'яўляецца штучны інтэлект проста статыстыкай?
Гэта статыстыка плюс аптымізацыя, вылічэнні, інжынерыя дадзеных і дызайн прадукту. Статыстыка — гэта шкілет, астатняе — мышцы.

Ці заўсёды перамагаюць больш буйныя мадэлі?
Маштабаванне дапамагае, але якасць дадзеных, ацэнка і абмежаванні на разгортванне часта маюць большае значэнне. Найменшая мадэль, якая дасягае вашай мэты, звычайна найлепшая для карыстальнікаў і кашалькоў.

Ці можа штучны інтэлект зразумець?
Дайце азначэнне « разумець» . Мадэлі фіксуюць структуру дадзеных і ўражліва абагульняюць, але ў іх ёсць сляпыя зоны, і яны могуць упэўнена памыляцца. Стаўцеся да іх як да магутных інструментаў, а не як да мудрацоў.

Ці вечная эпоха трансфарматараў?
Хутчэй за ўсё, не назаўжды. Зараз яна дамінуе, таму што ўвага добра распаралельваецца і маштабуецца, як паказана ў арыгінальнай працы [3]. Але даследаванні працягваюцца.

Як працуе штучны інтэлект? Занадта доўга, не чытаў 🧵

Штучны інтэлект вывучае заканамернасці з дадзеных, мінімізуе страты і абагульняе іх на новыя ўваходныя дадзеныя [1,2].
Асноўнымі метадамі навучання з'яўляюцца навучанне з кантролем, без кантроля, саманавучанне і навучанне з падмацаваннем; навучанне з кантролем вучыцца на ўзнагародах [5].
Нейронавыя сеткі выкарыстоўваюць зваротнае распаўсюджванне памылак і градыентны спуск для эфектыўнай карэкціроўкі мільёнаў параметраў [2].
Трансфарматары дамінуюць у многіх паслядоўных задачах, таму што ўвага да сябе паралельна фіксуе адносіны ў маштабе [3].
Штучны інтэлект у рэальным свеце — гэта канвеер — ад фармулявання праблемы да разгортвання і кіравання, — і структура NIST дазваляе вам сумленна ацэньваць рызыкі [4].

Калі хтосьці зноў спытае: « Як працуе штучны інтэлект?» , вы можаце ўсміхнуцца, выпіць кавы і сказаць: ён вучыцца на дадзеных, аптымізуе страты і выкарыстоўвае такія архітэктуры, як трансфарматары або дрэвападобныя ансамблі, у залежнасці ад праблемы. Затым падміргніце, бо гэта і проста, і хітра. 😉

Спасылкі

[1] IBM - Што такое машыннае навучанне?
чытаць далей

[2] Майкл Нільсен - Як працуе алгарытм зваротнага распаўсюджвання
чытаць далей

[3] Васвані і інш. - Увага — гэта ўсё, што вам трэба (arXiv)
чытаць далей

[4] NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0)
чытаць далей

[5] Сатан і Барта - Навучанне з падмацаваннем: Уводзіны (2-е выд.)
чытаць далей

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога

Краіна/рэгіён