як працуе штучны інтэлект?

Як працуе штучны інтэлект?

Штучны інтэлект можа здавацца магічным фокусам, на які ўсе ківаюць галовамі, ціха думаючы... пачакайце, а як гэта насамрэч працуе? Добрыя навіны. Мы развеем гэта без лішняй міфалогіі, застанемся практычнымі і дадамо некалькі недасканалых аналогій, якія ўсё роўна дапамогуць зразумець. Калі вы проста хочаце зразумець сутнасць, перайдзіце да адказу ніжэй, які займе ўсяго адну хвіліну; але, шчыра кажучы, менавіта ў дэталях усё ўспыхвае 💡.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Што азначае GPT
Кароткае тлумачэнне абрэвіятуры GPT і яе значэння.

🔗 Адкуль штучны інтэлект атрымлівае інфармацыю
Крыніцы, якія штучны інтэлект выкарыстоўвае для навучання, трэніровак і адказаў на пытанні.

🔗 Як укараніць штучны інтэлект у свой бізнес
Практычныя крокі, інструменты і працоўныя працэсы для эфектыўнай інтэграцыі штучнага інтэлекту.

🔗 Як пачаць кампанію па штучным інтэлекце
Ад ідэі да запуску: праверка, фінансаванне, каманда і рэалізацыя.


Як працуе штучны інтэлект? Аднахвілінны адказ ⏱️

Штучны інтэлект вывучае заканамернасці з дадзеных, каб рабіць прагнозы або генераваць кантэнт — не патрабуецца рукапісных правілаў. Сістэма прымае прыклады, вымярае ступень памылковасці з дапамогай функцыі страт і падладжвае свае ўнутраныя ручкі — параметры — каб кожны раз памыляцца крыху менш. Прамыйце, паўтарыце, палепшыце. Пры дастатковай колькасці цыклаў гэта становіцца карысным. Адна і тая ж гісторыя, незалежна ад таго, класіфікуеце вы электронныя лісты, выяўляеце пухліны, гуляеце ў настольныя гульні ці пішаце хайку. Для азнаямлення з «машынным навучаннем» агляд IBM даволі грунтоўны [1].

Большая частка сучаснага штучнага інтэлекту — гэта машыннае навучанне. Простая версія: увод дадзеных, вывучэнне адпаведнасці ўваходных дадзеных выхадным дадзеным, а затым абагульненне на новыя рэчы. Не магічная матэматыка, вылічэнні і, калі быць шчырымі, дробка мастацтва.


«Як працуе штучны інтэлект?» ✅

Калі людзі шукаюць у Google « Як працуе штучны інтэлект?» , яны звычайна хочуць:

  • шматразова выкарыстоўваная ментальная мадэль, якой яны могуць давяраць

  • карта асноўных тыпаў навучання, каб жаргон перастаў быць страшным

  • зазірнуць унутр нейронных сетак, не заблудзіўшыся

  • чаму трансформеры, здаецца, цяпер кіруюць светам

  • практычны канвеер ад дадзеных да разгортвання

  • хуткая параўнальная табліца, якую можна зрабіць скрыншот і захаваць

  • бар'еры этыкі, прадузятасці і надзейнасці, якія не з'яўляюцца некантралюемымі

Вось што вы тут атрымаеце. Калі я і блукаю, то раблю гэта наўмысна — нібыта іду па маляўнічым маршруце і неяк лепш запамінаю вуліцы ў наступны раз. 🗺️


Асноўныя інгрэдыенты большасці сістэм штучнага інтэлекту 🧪

Уявіце сабе сістэму штучнага інтэлекту як кухню. Чатыры інгрэдыенты з'яўляюцца зноў і зноў:

  1. Дадзеныя — прыклады з пазнакамі або без іх.

  2. Мадэль — матэматычная функцыя з наладжвальнымі параметрамі.

  3. Мэта — функцыя страт, якая вымярае, наколькі дрэнныя здагадкі.

  4. Аптымізацыя — алгарытм, які змяняе параметры, каб паменшыць страты.

У глыбокім навучанні гэты штуршок звычайна ажыццяўляецца па градыентным спуску з зваротным распаўсюджваннем — эфектыўны спосаб высветліць, якая ручка на гіганцкай дэцы рыпала, а затым крыху паменшыць яе гучнасць [2].

Міні-кейс: Мы замянілі нетрывалы спам-фільтр на аснове правілаў невялікай кантраляванай мадэллю. Пасля тыдня цыклаў пазнака → вымярэнне → абнаўленне колькасць ілжывых спрацоўванняў і заявак у службу падтрымкі зменшылася. Нічога асаблівага — толькі больш выразныя мэты (дакладнасць у «хамскіх» электронных лістах) і лепшая аптымізацыя.


Парадыгмы навучання з першага погляду 🎓

  • Навучанне з настаўнікам.
    Вы прадастаўляеце пары ўваход-выхад (фотаздымкі з пазнакамі, электронныя лісты, пазначаныя як спам/не спам). Мадэль навучаецца ўваход → выхад. Аснова многіх практычных сістэм [1].

  • Навучанне без настаўніка.
    Няма пазнак. Знайдзіце структурныя кластары, сціскі, схаваныя фактары. Выдатна падыходзіць для даследавання або папярэдняга навучання.

  • Саманавучанне
    Мадэль стварае свае ўласныя пазнакі (прадказвае наступнае слова, адсутны фрагмент выявы). Ператварае неапрацаваныя дадзеныя ў навучальны сігнал у вялікім маштабе; ляжыць у аснове сучасных мадэляў мовы і зроку.

  • Навучанне з падмацаваннем
    Агент дзейнічае, збірае ўзнагароды і засвойвае палітыку, якая максімізуе сукупную ўзнагароду. Калі «функцыі каштоўнасці», «палітыка» і «навучанне з выкарыстаннем часавых розніц» вам знаёмыя, то гэта іх дом [5].

Так, на практыцы катэгорыі размываюцца. Гібрыдныя метады — гэта нармальна. Рэальнае жыццё бязладнае, і добрая інжынерыя сустракае яго там, дзе ён ёсць.


Унутры нейроннай сеткі без галаўнога болю 🧠

Нейронная сетка аб'ядноўвае пласты малюсенькіх матэматычных адзінак (нейронаў). Кожны пласт пераўтварае ўваходныя дадзеныя з дапамогай вагаў, зрушэнняў і мяккай нелінейнасці, падобнай да ReLU або GELU. Раннія пласты вывучаюць простыя функцыі; больш глыбокія кадуюць абстракцыі. «Магія» — калі можна так сказаць — заключаецца ў кампазіцыях : злучайце невялікія функцыі, і вы можаце мадэляваць надзвычай складаныя з'явы.

Трэніровачны цыкл, толькі вібрацыі:

  • здагадка → вымярэнне памылкі → атрыбуцыя віны праз зваротную падтрымку → штуршкі вагі → паўтарэнне.

Рабіце гэта для некалькіх партый, і, як нязграбны танцор, які ўдасканальвае кожную песню, мадэль перастане наступаць вам на ногі. Для зручнага і строгага раздзела пра бэк-пропіў гл. [2].


Чаму трансформеры заваявалі папулярнасць — і што насамрэч азначае «увага» 🧲

Трансфарматары выкарыстоўваюць самаўвагу , каб адначасова ацаніць, якія часткі ўваходнага сігналу маюць значэнне адна для адной. Замест таго, каб чытаць сказ строга злева направа, як у старых мадэлях, трансфарматар можа глядзець паўсюль і дынамічна ацэньваць сувязі — гэтак жа, як сканаванне перапоўненага пакоя, каб убачыць, хто з кім размаўляе.

Архітэктура і вынікі апісаны ў артыкуле пад назвай « Увага — гэта ўсё, што вам трэба»

Самааналіз у адным радку: стварыць запыту , ключа і значэння для кожнага токена; вылічыць падабенства, каб атрымаць вагі ўвагі; адпаведна змяшаць значэнні. Вытанчана ў дэталях, элегантна па духу.

Увага: трансфарматары дамінуюць, а не манапалізуюць. CNN, RNN і дрэвападобныя ансамблі па-ранейшаму выйграюць па пэўных тыпах дадзеных і абмежаваннях затрымкі/кошту. Выбірайце архітэктуру для задачы, а не ажыятаж.


Як працуе штучны інтэлект? Практычны канвеер, які вы будзеце выкарыстоўваць 🛠️

  1. Фарміраванне праблемы.
    Што вы прагназуеце або ствараеце, і як будзе вымярацца поспех?

  2. дадзеныя
    , пры неабходнасці маркіруйце, ачышчайце і раздзяляйце. Будзьце гатовыя да адсутнасці значэнняў і памежных выпадкаў.

  3. Мадэляванне
    Пачніце з простага. Базавыя ўзроўні (лагістычная рэгрэсія, градыентнае ўзмацненне або невялікі трансфарматар) часта пераўзыходзяць гераічную складанасць.

  4. Навучанне
    Выберыце мэту, аптымізатар, усталюйце гіперпараметры. Ітэруйце.

  5. Ацэнка.
    Выкарыстоўвайце ўстрыманні, перакрыжаваную праверку і метрыкі, звязаныя з вашай рэальнай мэтай (дакладнасць, F1, AUROC, BLEU, збянтэжанасць, затрымка).

  6. Разгортванне.
    Абслугоўванне за API або ўбудаванне ў праграму. Адсочванне затрымкі, кошту, прапускной здольнасці.

  7. Маніторынг і кіраванне.
    Назірайце за зрухам, справядлівасцю, надзейнасцю і бяспекай. Структура кіравання рызыкамі ў галіне штучнага інтэлекту NIST (КІРУЙЦЕ, КАРТЫРУЙЦЕ, ВЫМЯРАЙЦЕ, КІРУЙЦЕ) — гэта практычны кантрольны спіс для надзейных сістэм ад пачатку да канца [4].

Міні-кейс: мадэль візуалізацыі выдатна спрацавала ў лабараторыі, а потым дала збой у полі пры змене асвятлення. Маніторынг пазначанага зруху на ўваходных гістаграмах; хуткае дапаўненне + тонкая налада аднавілі прадукцыйнасць. Сумна? Так. Эфектыўна? Таксама так.


Параўнальная табліца - падыходы, для каго яны, прыблізны кошт, чаму яны працуюць 📊

Недасканаласць наўмысна: крыху няроўная фармулёўка дапамагае адчуваць сябе чалавечым.

Падыход Ідэальная аўдыторыя Прыблізная цана Чаму гэта працуе / нататкі
Навучанне пад наглядам Аналітыкі, прадуктовыя каманды нізкі–сярэдні Прамое адлюстраванне ўводу → метка. Выдатна, калі меткі існуюць; гэта аснова многіх разгорнутых сістэм [1].
Без нагляду Даследчыкі дадзеных, даследаванні і распрацоўкі нізкі Знаходзіць кластары/сцісканні/схаваныя фактары — добра падыходзіць для выяўлення і папярэдняга навучання.
Самастойна Каманды платформы сярэдні Стварае ўласныя этыкеткі з неапрацаваных шкал дадзеных з дапамогай вылічэнняў і дадзеных.
Навучанне з падмацаваннем Робататэхніка, аперацыйныя даследаванні сярэдне-высокі Вывучае палітыку з сігналаў узнагароджання; прачытайце Саттана і Барта для атрымання канону [5].
Трансформеры НЛП, бачанне, мультымадальны сярэдне-высокі Самаўвага фіксуе глыбіні на вялікія адлегласці і добра паралелізуецца; гл. арыгінальную працу [3].
Класічнае машыннае навучанне (дрэвы) Таблічныя бізнес-праграмы нізкі Танныя, хуткія, часта шакавальна моцныя базавыя лініі для структураваных дадзеных.
На аснове правілаў/сімвал Адпаведнасць, дэтэрмінаваная вельмі нізкі Празрыстая логіка; карысная ў гібрыдах, калі вам патрэбна магчымасць аўдыту.
Ацэнка і рызыка Усе змяняецца Выкарыстоўвайце метады NIST «КІРАВАННЕ-МАПАВАННЕ-ВЫМЯРЭННЕ-КІРАВАННЕ», каб забяспечыць бяспеку і карыснасць [4].

Прыкладна цана = маркіроўка дадзеных + вылічэнні + людзі + абслугоўванне.


Паглыбленае апусканне 1 - функцыі страт, градыенты і малюсенькія крокі, якія змяняюць усё 📉

Уявіце, што вы пракладаеце лінію для прагназавання цаны дома на падставе яго памеру. Вы выбіраеце параметры (w) і (b), прадказваеце (\hat{y} = wx + b) і вымяраеце памылку з дапамогай сярэднеквадратычнага значэння страт. Градыент паказвае, у якім кірунку рухацца (w) і (b), каб хутчэй паменшыць страты — як спуск у тумане, адчуваючы, у які бок нахіл зямлі. Абнаўляйце пасля кожнай партыі, і ваша лінія будзе бліжэй да рэальнасці.

У глыбокіх сетках гэта тая ж песня з большай паласой. Backprop эфектыўна вылічвае, як параметры кожнага пласта паўплывалі на канчатковую памылку, каб вы маглі падштурхнуць мільёны (ці мільярды) ручак у правільным кірунку [2].

Ключавыя інтуіцыі:

  • Страты фарміруюць ландшафт.

  • Градыенты — ваш компас.

  • Хуткасць навучання залежыць ад памеру кроку: занадта вялікі — і вы хістаецеся, занадта малы — і вы дрэмлеце.

  • Рэгулярызацыя не дазваляе вам запамінаць трэніровачны набор, як папугай, з ідэальным успамінаннем, але без разумення.


Глыбокае апусканне 2 - убудаванне, падказкі і пошук 🧭

Убудаванні адлюстроўваюць словы, выявы або элементы ў вектарныя прасторы, дзе падобныя рэчы размяшчаюцца побач адзін з адным. Гэта дазваляе вам:

  • знайсці семантычна падобныя ўрыўкі

  • пошук сілы, які разумее сэнс

  • падключыць генерацыю з дапоўненым пошукам (RAG) , каб моўная мадэль магла шукаць факты перад запісам

Падказкі — гэта тое, як вы кіруеце генератыўнымі мадэлямі: апісваеце задачу, прыводзіце прыклады, усталёўваеце абмежаванні. Уявіце сабе гэта як напісанне вельмі падрабязнай спецыфікацыі для вельмі хуткага стажора: імклівага, часам празмерна ўпэўненага ў сабе.

Практычная парада: калі ў вашай мадэлі галюцынацыі, дадайце прыгадванне, удакладніце падказку або ацэньвайце з дапамогай абгрунтаваных метрык замест «вібрацый».


Глыбокае апусканне 3 - ацэнка без ілюзій 🧪

Добрая ацэнка здаецца сумнай — у гэтым і ёсць сэнс.

  • Выкарыстоўвайце заблакаваны набор тэстаў.

  • Выберыце метрыку, якая адлюстроўвае боль карыстальніка.

  • Зрабіце абляцыю, каб ведаць, што насамрэч дапамагло.

  • Рэгіструйце памылкі з рэальнымі, неакуратнымі прыкладамі.

У вытворчасці маніторынг — гэта ацэнка, якая ніколі не спыняецца. Здараюцца адхіленні. З'яўляецца новы слэнг, датчыкі перакалібруюцца, і ўчорашняя мадэль трохі зрушваецца з месца. Структура NIST — гэта практычны даведнік для бягучага кіравання рызыкамі і кіравання, а не палітычны дакумент, які можна адкласці [4].


Заўвага пра этыку, прадузятасць і надзейнасць ⚖️

Сістэмы штучнага інтэлекту адлюстроўваюць свае дадзеныя і кантэкст разгортвання. Гэта нясе рызыкі: прадузятасць, нераўнамерныя памылкі паміж групамі, далікатнасць пры зруху размеркавання. Этычнае выкарыстанне не з'яўляецца абавязковым — гэта стаўкі на стол. NIST паказвае на канкрэтныя практыкі: дакументаванне рызык і наступстваў, вымярэнне шкодных прадузятасцяў, стварэнне рэзервовых варыянтаў і інфармаванне людзей, калі стаўкі высокія [4].

Канкрэтныя крокі, якія дапамагаюць:

  • збіраць разнастайныя, прадстаўнічыя дадзеныя

  • вымяраць прадукцыйнасць па розных падгрупах насельніцтва

  • картак мадэляў дакументаў і табліц дадзеных

  • дадаць кантроль чалавека там, дзе стаўкі высокія

  • распрацоўваць механізмы бяспекі, калі сістэма нявызначаная


Як працуе штучны інтэлект? У якасці ментальнай мадэлі вы можаце выкарыстоўваць яго паўторна 🧩

Кампактны кантрольны спіс, які можна прымяніць практычна да любой сістэмы штучнага інтэлекту:

  • Якая мэта? Прагназаванне, ранжыраванне, генерацыя, кантроль?

  • Адкуль бярэцца сігнал навучання? З этыкетак, заданняў пад самакантроль, узнагарод?

  • Якая архітэктура выкарыстоўваецца? Лінейная мадэль, дрэвападобны ансамбль, CNN, RNN, трансфарматар [3]?

  • Як гэта аптымізавана? Варыяцыі градыентнага спуску/зваротнае прасоўванне [2]?

  • Які рэжым дадзеных? Невялікі пазначаны набор, мора непазначанага тэксту, мадэляванае асяроддзе?

  • Якія рэжымы збояў і меры засцярогі? Зрушэнне, дрэйф, галюцынацыі, затрымка, карта выдаткаў у адпаведнасці з NIST GOVERN-MAP-MEASURE-MANAGE [4].

Калі вы можаце адказаць на гэтыя пытанні, вы ў асноўным разумееце сістэму — астатняе — гэта дэталі рэалізацыі і веды прадметнай вобласці.


Хуткія крыніцы, вартыя закладак 🔖

  • Уводзіны ў канцэпцыі машыннага навучання (IBM) простай мовай [1]

  • Зваротнае распаўсюджванне з дапамогай дыяграм і лёгкай матэматыкі [2]

  • Праца пра трансфарматара, якая змяніла мадэляванне паслядоўнасцей [3]

  • Структура кіравання рызыкамі штучнага інтэлекту NIST (практычнае кіраванне) [4]

  • Падручнік па кананічным навучанні з падмацаваннем (бясплатна) [5]


Часта задаваныя пытанні маланкі ⚡

Ці з'яўляецца штучны інтэлект проста статыстыкай?
Гэта статыстыка плюс аптымізацыя, вылічэнні, інжынерыя дадзеных і дызайн прадукту. Статыстыка — гэта шкілет, астатняе — мышцы.

Ці заўсёды перамагаюць больш буйныя мадэлі?
Маштабаванне дапамагае, але якасць дадзеных, ацэнка і абмежаванні на разгортванне часта маюць большае значэнне. Найменшая мадэль, якая дасягае вашай мэты, звычайна найлепшая для карыстальнікаў і кашалькоў.

Ці можа штучны інтэлект зразумець?
Дайце азначэнне « разумець» . Мадэлі фіксуюць структуру дадзеных і ўражліва абагульняюць, але ў іх ёсць сляпыя зоны, і яны могуць упэўнена памыляцца. Стаўцеся да іх як да магутных інструментаў, а не як да мудрацоў.

Ці вечная эпоха трансфарматараў?
Хутчэй за ўсё, не назаўжды. Зараз яна дамінуе, таму што ўвага добра распаралельваецца і маштабуецца, як паказана ў арыгінальнай працы [3]. Але даследаванні працягваюцца.


Як працуе штучны інтэлект? Занадта доўга, не чытаў 🧵

  • Штучны інтэлект вывучае заканамернасці з дадзеных, мінімізуе страты і абагульняе іх на новыя ўваходныя дадзеныя [1,2].

  • Асноўнымі метадамі навучання з'яўляюцца навучанне з кантролем, без кантроля, саманавучанне і навучанне з падмацаваннем; навучанне з кантролем вучыцца на ўзнагародах [5].

  • Нейронавыя сеткі выкарыстоўваюць зваротнае распаўсюджванне памылак і градыентны спуск для эфектыўнай карэкціроўкі мільёнаў параметраў [2].

  • Трансфарматары дамінуюць у многіх паслядоўных задачах, таму што ўвага да сябе паралельна фіксуе адносіны ў маштабе [3].

  • Штучны інтэлект у рэальным свеце — гэта канвеер — ад фармулявання праблемы да разгортвання і кіравання, — і структура NIST дазваляе вам сумленна ацэньваць рызыкі [4].

Калі хтосьці зноў спытае: « Як працуе штучны інтэлект?» , вы можаце ўсміхнуцца, выпіць кавы і сказаць: ён вучыцца на дадзеных, аптымізуе страты і выкарыстоўвае такія архітэктуры, як трансфарматары або дрэвападобныя ансамблі, у залежнасці ад праблемы. Затым падміргніце, бо гэта і проста, і хітра. 😉


Спасылкі

[1] IBM - Што такое машыннае навучанне?
чытаць далей

[2] Майкл Нільсен - Як працуе алгарытм зваротнага распаўсюджвання
чытаць далей

[3] Васвані і інш. - Увага — гэта ўсё, што вам трэба (arXiv)
чытаць далей

[4] NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0)
чытаць далей

[5] Сатан і Барта - Навучанне з падмацаваннем: Уводзіны (2-е выд.)
чытаць далей

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога