Што такое алгарытм штучнага інтэлекту?

Што такое алгарытм штучнага інтэлекту?

Алгарытм штучнага інтэлекту — гэта, па сутнасці, метад (рэцэпт, схема дзеянняў, набор правілаў), які дапамагае машыне вывучаць заканамернасці і прымаць рашэнні на аснове дадзеных. Гэта не магія, не чытанне думак, не маленькі чалавек у вашым ноўтбуку, які цягне за рычагі. Але таксама… не проста логіка «калі гэта, то гэта». Ён знаходзіцца недзе пасярэдзіне, як вельмі літаральны стажор, які становіцца лепшым пасля таго, як вы паказваеце яму шмат прыкладаў. 😅

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Што такое этыка штучнага інтэлекту
Прынцыпы адказнага штучнага інтэлекту: справядлівасць, празрыстасць, падсправаздачнасць і бяспека.

🔗 Што такое прадузятасць штучнага інтэлекту
Як прадузятыя дадзеныя скажаюць вынікі штучнага інтэлекту і як гэта выправіць.

🔗 Што такое маштабаванасць штучнага інтэлекту
Спосабы маштабавання сістэм штучнага інтэлекту: дадзеныя, вылічэнні, разгортванне і аперацыі.

🔗 Што такое вытлумачальны штучны інтэлект
Чаму інтэрпрэтавальныя мадэлі важныя для даверу, адладкі і адпаведнасці патрабаванням.


Што такое алгарытм штучнага інтэлекту на самой справе? 🧠

Алгарытм штучнага інтэлекту — гэта працэдура, якую камп'ютар выкарыстоўвае для:

  • Вучыцеся на дадзеных (або зваротнай сувязі)

  • Распазнаваць заканамернасці

  • Рабіць прагнозы або рашэнні

  • Паляпшэнне прадукцыйнасці з вопытам [1]

Класічныя алгарытмы выглядаюць так: «Сартуйце гэтыя лікі ў парадку ўзрастання». Зразумелыя крокі, адзін і той жа вынік кожны раз.

Алгарытмы, падобныя на штучны інтэлект, больш падобныя на: «Вось мільён прыкладаў. Калі ласка, высветліце, што такое «кот»». Затым ён выпрацоўвае ўнутраны шаблон, які звычайна працуе. Звычайна. Часам ён бачыць пухнатую падушку і крычыць «КОТ!» з поўнай упэўненасцю. 🐈⬛

 

Што такое інфаграфіка алгарытму штучнага інтэлекту

Алгарытм штучнага інтэлекту супраць мадэлі штучнага інтэлекту: розніца, якую людзі замоўчваюць 😬

Гэта хутка вырашае шмат непаразуменняў:

  • Алгарытм штучнага інтэлекту = метад навучання / падыход да навучання
    («Вось як мы абнаўляем сябе з дадзеных»).

  • Мадэль штучнага інтэлекту = навучаны артэфакт, які вы запускаеце на новых уваходных дадзеных
    («Гэта рэч, якая цяпер робіць прагнозы.») [1]

Такім чынам, алгарытм падобны да працэсу гатавання, а мадэль — гатовая страва 🍝. Магчыма, трохі хісткая метафара, але яна мае сэнс.

Акрамя таго, адзін і той жа алгарытм можа ствараць зусім розныя мадэлі ў залежнасці ад:

  • дадзеныя, якія вы яму падаеце

  • выбраныя вамі налады

  • як доўга вы трэніруецеся

  • наколькі неахайны ваш набор дадзеных (спойлер: ён амаль заўсёды неахайны)


Чаму алгарытм штучнага інтэлекту важны (нават калі вы не «тэхнічны спецыяліст») 📌

Нават калі вы ніколі не напішаце ніводнага радка кода, алгарытмы штучнага інтэлекту ўсё роўна ўплываюць на вас. Вельмі моцна.

Падумайце: фільтры спаму, праверкі на махлярства, рэкамендацыі, пераклад, падтрымка медыцынскай візуалізацыі, аптымізацыя маршрутаў і ацэнка рызык. (Не таму, што штучны інтэлект «жывы», а таму, што распазнаванне вобразаў у вялікіх маштабах каштоўнае ў мільёне ціха жыццёва важных месцаў.)

І калі вы будуеце бізнес, кіруеце камандай або спрабуеце не паддавацца на жаргон, разуменне таго, што алгарытм штучнага інтэлекту, дапаможа вам задаваць лепшыя пытанні:

  • Вызначце, з якіх дадзеных сістэма атрымала інфармацыю.

  • Праверце, як вымяраецца і змяншаецца прадузятасць.

  • Вызначце, што адбываецца, калі сістэма не працуе належным чынам.

Таму што часам гэта будзе памылкова. Гэта не песімізм. Гэта рэальнасць.


Як «навучаецца» алгарытм штучнага інтэлекту (навучанне супраць высновы) 🎓➡️🔮

Большасць сістэм машыннага навучання маюць дзве асноўныя фазы:

1) Навучанне (час навучання)

Падчас навучання алгарытм:

  • глядзіць прыклады (дадзеныя)

  • робіць прагнозы

  • вымярае, наколькі гэта памылкова

  • карэктуе ўнутраныя параметры для памяншэння памылкі [1]

2) Выснова (з выкарыстаннем часу)

Выснова адбываецца, калі навучаная мадэль выкарыстоўваецца на новых уваходных дадзеных:

  • класіфікаваць новы ліст як спам ці не

  • прагназуйце попыт на наступны тыдзень

  • пазначыць выяву

  • стварыць адказ [1]

Навучанне — гэта «вучоба». Высновы — гэта «экзамен». Аднак экзамен ніколі не сканчаецца, і людзі пастаянна мяняюць правілы па ходзе справы. 😵


Вялікія сямействы стыляў алгарытмаў штучнага інтэлекту (з інтуіцыяй на простай англійскай мове) 🧠🔧

Навучанне пад наглядам 🎯

Вы прыводзіце пазначаныя прыклады, такія як:

  • «Гэта спам» / «Гэта не спам»

  • «Гэты кліент пакінуў кампанію» / «Гэты кліент застаўся»

Алгарытм вывучае адлюстраванне з уваходных дадзеных → выхадных дадзеных. Вельмі распаўсюджана. [1]

Навучанне без нагляду 🧊

Няма пазнак. Сістэма шукае структуру:

  • кластары падобных кліентаў

  • незвычайныя ўзоры

  • тэмы ў дакументах [1]

Навучанне з падмацаваннем 🕹️

Сістэма вучыцца метадам спроб і памылак, кіруючыся ўзнагародамі. (Выдатна, калі ўзнагароды відавочныя. Бурліва, калі іх няма.) [1]

Глыбокае навучанне (нейронныя сеткі) 🧠⚡

Гэта хутчэй сямейства тэхнік, чым адзін алгарытм. Ён выкарыстоўвае шматслаёвыя прадстаўленні і можа вывучаць вельмі складаныя заканамернасці, асабліва ў зроку, маўленні і мове. [1]


Параўнальная табліца: кароткі агляд папулярных сямействаў алгарытмаў штучнага інтэлекту 🧩

Не «лепшы спіс» — хутчэй карта, каб перастаць адчуваць, што ўсё — адзін вялікі суп са штучным інтэлектам.

Сямейства алгарытмаў Аўдыторыя «Кошт» у рэальным жыцці Чаму гэта працуе
Лінейная рэгрэсія Пачаткоўцы, аналітыкі Нізкі Простая, інтэрпрэтавальная базавая інфармацыя
Лагістычная рэгрэсія Пачаткоўцы, прадуктовыя каманды Нізкі Цвёрдая для класіфікацыі, калі сігналы чыстыя
Дрэвы рашэнняў Пачаткоўцы → сярэдні ўзровень Нізкі Лёгка растлумачыць, можна перастарацца
Выпадковы лес Сярэдні ўзровень Сярэдні Больш устойлівыя, чым асобныя дрэвы
Градыентнае ўзмацненне (у стылі XGBoost) Сярэдні → прасунуты Сярэдне-высокі Часта выдатна працуе з таблічнымі дадзенымі; налада можа быць складанай задачай 🕳️
Машыны апорных вектараў Сярэдні ўзровень Сярэдні Моцна спраўляецца з некаторымі праблемамі сярэдняга маштабу; патрабавальна ставіцца да маштабавання
Нейронныя сеткі / Глыбокае навучанне Прасунутыя каманды, якія працуюць з вялікай колькасцю дадзеных Высокі Магутны для неструктураваных дадзеных; абсталяванне + выдаткі на ітэрацыі
Кластэрызацыя K-сярэдніх Пачаткоўцы Нізкі Хуткае групаванне, але мяркуе «круглую» форму кластараў
Навучанне з падмацаваннем Прасунутыя, даследчыя людзі Высокі Навучаецца метадам спроб і памылак, калі сігналы ўзнагароджання зразумелыя

Што робіць версію алгарытму штучнага інтэлекту добрай? ✅🤔

«Добры» алгарытм штучнага інтэлекту не абавязкова з'яўляецца самым вытанчаным. На практыцы добрая сістэма, як правіла, гэта:

  • Дастаткова дакладна для дасягнення рэальнай мэты (не ідэальна - каштоўна)

  • Надзейны (не разбураецца пры невялікім зрушванні дадзеных)

  • Дастаткова тлумачальна (не абавязкова празрыста, але і не цалкам чорная дзірка)

  • Справядлівыя і правераныя на прадузятасць (скажоныя дадзеныя → скажоныя вынікі)

  • Эфектыўны (для простай задачы няма суперкамп'ютара)

  • Падтрымліваемы (кантралюемы, абнаўляльны, паляпшаемы)

Хуткі практычны міні-кейс (бо менавіта тут усё становіцца адчувальным)

Уявіце сабе мадэль адтоку кліентаў, якая «цудоўная» ў тэставанні... таму што яна выпадкова вывучыла заменнік для «кліент ужо звязаўся з камандай утрымання». Гэта не прагнастычная магія. Гэта ўцечка. Яна будзе выглядаць гераічна, пакуль вы яе не разгорнеце, а потым адразу ж не вернецеся ў твар. 😭


Як мы ацэньваем, ці з'яўляецца алгарытм штучнага інтэлекту «добрым» 📏✅

Нельга проста паглядзець на гэта на вока (некаторыя людзі так робяць, а потым пачынаецца хаос).

Звычайныя метады ацэнкі ўключаюць:

  • Дакладнасць

  • Дакладнасць / запамінальнасць

  • Ацэнка F1 (баланс паміж дакладнасцю і поўнасцю) [2]

  • AUC-ROC (якасць ранжыравання для бінарнай класіфікацыі) [3]

  • Каліброўка (ці адпавядае ўпэўненасць рэальнасці)

А потым ёсць тэст у рэальным свеце:

  • Ці дапамагае гэта карыстальнікам?

  • Ці змяншае гэта выдаткі ці рызыкі?

  • Ці стварае гэта новыя праблемы (ілжывыя трывогі, несправядлівыя адмовы, заблытаныя працоўныя працэсы)?

Часам «крыху горшая» мадэль на паперы лепшая ў практыцы, бо яна стабільная, зразумелая і лягчэйшая для кантролю.


Распаўсюджаныя памылкі (г.зн. як праекты штучнага інтэлекту ціха правальваюцца) ⚠️😵💫

Нават моцныя каманды дасягаюць гэтых вынікаў:

  • Перанавучанне (выдатна падыходзіць для трэніровачных дадзеных, горш для новых дадзеных) [1]

  • Уцечка дадзеных (навучанне праводзіцца з выкарыстаннем інфармацыі, якой у вас не будзе на момант прагназавання)

  • Праблемы прадузятасці і справядлівасці (гістарычныя дадзеныя ўтрымліваюць гістарычную несправядлівасць)

  • Зрух канцэпцыі (свет змяняецца; мадэль не)

  • Няправільныя паказчыкі (вы аптымізуеце дакладнасць; карыстальнікаў хвалюе нешта іншае)

  • Паніка чорнай скрыні (ніхто не можа растлумачыць рашэнне, калі яно раптам мае значэнне)

Яшчэ адна тонкая праблема: прадузятасць аўтаматызацыі — людзі занадта давяраюць сістэме, бо яна выдае ўпэўненыя рэкамендацыі, што можа знізіць пільнасць і незалежную праверку. Гэта было задакументавана ў даследаваннях падтрымкі прыняцця рашэнняў, у тым ліку ў сферы аховы здароўя. [4]


«Надзейны штучны інтэлект» — гэта не проста вайб, а кантрольны спіс 🧾🔍

Калі сістэма штучнага інтэлекту ўплывае на рэальных людзей, вам патрэбна нешта большае, чым «яна дакладная па нашых крытэрыях»

Надзейнай асновай з'яўляецца кіраванне рызыкамі жыццёвага цыклу: планаванне → зборка → тэставанне → разгортванне → маніторынг → абнаўленне. Структура кіравання рызыкамі штучнага інтэлекту NIST вызначае характарыстыкі «надзейнага» штучнага інтэлекту, такія як дзейсны і надзейны , бяспечны , абаронены і ўстойлівы , падсправаздачны і празрысты , тлумачальны і інтэрпрэтаваны , з павышанай канфідэнцыяльнасцю і справядлівы (кіраванне шкоднымі прадузятымі ўмовамі) [5].

Пераклад: вы пытаецеся, ці працуе гэта.
Вы таксама пытаецеся, ці бяспечна яно выходзіць з ладу, і ці можаце вы гэта прадэманстраваць.


Асноўныя высновы 🧾✅

Калі з гэтага больш нічога не вынесці:

  • Алгарытм штучнага інтэлекту = падыход да навучання, рэцэпт навучання

  • Мадэль штучнага інтэлекту = навучаны вынік, які вы разгортваеце

  • Добры штучны інтэлект не проста «разумны» — ён надзейны, кантралюемы, правераны на прадузятасць і падыходзіць для працы.

  • Якасць дадзеных мае большае значэнне, чым большасць людзей хоча прызнаць

  • Найлепшы алгарытм звычайна той, які вырашае праблему, не ствараючы трох новых праблем 😅


Спасылкі

  1. Распрацоўшчыкі Google - Гласарый машыннага навучання

  2. scikit-learn - дакладнасць, поўнасць, F-мера

  3. scikit-learn - бал AUC ROC

  4. Годард і інш. - Сістэматычны агляд зрушэння аўтаматызацыі (поўны тэкст PMC)

  5. NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0) PDF

 

Часта задаваныя пытанні

Што такое алгарытм штучнага інтэлекту простымі словамі?

Алгарытм штучнага інтэлекту — гэта метад, які камп'ютар выкарыстоўвае для вывучэння заканамернасцей з дадзеных і прыняцця рашэнняў. Замест таго, каб абапірацца на фіксаваныя правілы «калі-то», ён падладжваецца пасля прагляду мноства прыкладаў або атрымання зваротнай сувязі. Мэта складаецца ў тым, каб з цягам часу ўдасканальваць прагназаванне або класіфікацыю новых уваходных дадзеных. Ён магутны, але ўсё яшчэ можа рабіць упэўненыя памылкі.

У чым розніца паміж алгарытмам штучнага інтэлекту і мадэллю штучнага інтэлекту?

Алгарытм штучнага інтэлекту — гэта працэс навучання або рэцэпт навучання — тое, як сістэма абнаўляе сябе на аснове дадзеных. Мадэль штучнага інтэлекту — гэта навучаны вынік, які вы запускаеце, каб рабіць прагнозы на аснове новых уваходных дадзеных. Адзін і той жа алгарытм штучнага інтэлекту можа ствараць вельмі розныя мадэлі ў залежнасці ад дадзеных, працягласці навучання і налад. Уявіце сабе «працэс прыгатавання» супраць «гатовай стравы»

Як алгарытм штучнага інтэлекту вучыцца падчас навучання ў параўнанні з высновамі?

Навучанне — гэта калі алгарытм вывучае: ён бачыць прыклады, робіць прагнозы, вымярае памылкі і карэктуе ўнутраныя параметры, каб паменшыць гэтыя памылкі. Выснова — гэта калі навучаная мадэль выкарыстоўваецца на новых уваходных дадзеных, такіх як класіфікацыя спаму або маркіроўка выявы. Навучанне — гэта фаза навучання; выснова — гэта фаза выкарыстання. Многія праблемы выяўляюцца толькі падчас высновы, таму што новыя дадзеныя паводзяць сябе інакш, чым тое, на чым сістэма навучылася.

Якія асноўныя тыпы алгарытмаў штучнага інтэлекту (з настаўнікам, без настаўніка, з падмацаваннем)?

Навучанне з настаўнікам выкарыстоўвае пазначаныя прыклады для вывучэння адпаведнасці ўваходных дадзеных выхадным дадзеным, напрыклад, спам супраць не спаму. Навучанне без настаўніка не мае пазнак і шукае структуру, такую ​​як кластары або незвычайныя заканамернасці. Навучанне з падмацаваннем вучыцца метадам спроб і памылак з выкарыстаннем узнагарод. Глыбокае навучанне — гэта больш шырокае сямейства метадаў нейронных сетак, якія могуць фіксаваць складаныя заканамернасці, асабліва для задач зроку і мовы.

Як даведацца, ці з'яўляецца алгарытм штучнага інтэлекту «добрым» у рэальным жыцці?

Добры алгарытм штучнага інтэлекту не з'яўляецца аўтаматычна самым складаным — гэта той, які надзейна дасягае мэты. Каманды ўлічваюць такія паказчыкі, як дакладнасць, дакладнасць/паўнавартаснасць, F1, AUC-ROC і каліброўка, а затым тэстуюць прадукцыйнасць і ўплыў на далейшае разгортванне. Стабільнасць, тлумачальнасць, эфектыўнасць і зручнасць абслугоўвання маюць вялікае значэнне ў прадукцыйнасці. Часам крыху слабейшая мадэль на паперы перамагае, таму што яе лягчэй кантраляваць і ёй давяраць.

Што такое ўцечка дадзеных і чаму яна парушае праекты штучнага інтэлекту?

Уцечка дадзеных адбываецца, калі мадэль вучыцца на аснове інфармацыі, якая не будзе даступная на момант прагназавання. Гэта можа прывесці да таго, што вынікі тэставання будуць выглядаць цудоўна, але пасля разгортвання яны могуць праваліцца. Класічным прыкладам з'яўляецца выпадковае выкарыстанне сігналаў, якія адлюстроўваюць дзеянні, прадпрынятыя пасля атрымання выніку, напрыклад, кантакт з камандай утрымання ў мадэлі адтоку. Уцечка стварае «ілжывую прадукцыйнасць», якая знікае ў рэальным працоўным працэсе.

Чаму алгарытмы штучнага інтэлекту з часам пагаршаюцца, нават калі яны былі дакладнымі пры запуску?

З часам дадзеныя змяняюцца — кліенты паводзяць сябе інакш, палітыка змяняецца, прадукты развіваюцца, што прыводзіць да зрушэння канцэпцыі. Мадэль застаецца ранейшай, калі вы не кантралюеце прадукцыйнасць і не абнаўляеце яе. Нават невялікія змены могуць знізіць дакладнасць або павялічыць колькасць ілжывых трывог, асабліва калі мадэль была нетрывалай. Пастаянная ацэнка, перанавучанне і дбайныя практыкі разгортвання з'яўляюцца часткай падтрымання спраўнасці сістэмы штучнага інтэлекту.

Якія найбольш распаўсюджаныя памылкі пры разгортванні алгарытму штучнага інтэлекту?

Перанавучанне — гэта сур'ёзная праблема: мадэль выдатна працуе на навучальных дадзеных, але дрэнна на новых. Праблемы з прадузятасцю і справядлівасцю могуць узнікнуць, таму што гістарычныя дадзеныя часта ўтрымліваюць гістарычную несправядлівасць. Няправільныя паказчыкі таксама могуць звесці на нішто праекты — аптымізацыя дакладнасці, калі карыстальнікаў хвалюе нешта іншае. Яшчэ адна тонкая рызыка — гэта прадузятасць аўтаматызацыі, калі людзі занадта давяраюць упэўненым вынікам мадэлі і перастаюць правяраць падвойныя дадзеныя.

Што азначае на практыцы «надзейны штучны інтэлект»?

Надзейны штучны інтэлект — гэта не проста «высокая дакладнасць», гэта падыход, які ахоплівае ўвесь жыццёвы цыкл: планаванне, стварэнне, тэставанне, разгортванне, маніторынг і абнаўленне. На практыцы вы шукаеце сістэмы, якія з'яўляюцца дзейснымі і надзейнымі, бяспечнымі, надзейнымі, падсправаздачнымі, тлумачальнымі, улічваюць канфідэнцыяльнасць і правераныя на прадузятасць. Вам таксама патрэбныя рэжымы збояў, якія зразумелыя і якія можна выправіць. Ключавая ідэя — мець магчымасць прадэманстраваць, што ён працуе і выходзіць з ладу бяспечна, а не проста спадзявацца, што гэта так.

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога