Прагназуючы штучны інтэлект гучыць мудрагеліста, але ідэя простая: выкарыстоўваць мінулыя дадзеныя, каб здагадацца, што, верагодна, адбудзецца далей. Ад таго, які кліент можа сысці, да таго, калі машыне спатрэбіцца абслугоўванне, гаворка ідзе пра пераўтварэнне гістарычных заканамернасцей у сігналы, якія арыентуюцца на будучыню. Гэта не магія — гэта матэматыка, якая сустракаецца з бязладнай рэальнасцю, з доляй здаровага скептыцызму і вялікай колькасцю ітэрацый.
Ніжэй прыведзены практычны і зразумелы тлумачальны матэрыял. Калі вы зайшлі сюды з пытаннем, што такое прагназуемы штучны інтэлект і ці карысны ён для вашай каманды, гэты артыкул дапаможа вам адразу перайсці ад добрага да добрага.☕️
Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Як укараніць штучны інтэлект у свой бізнес
Практычныя крокі па інтэграцыі інструментаў штучнага інтэлекту для больш разумнага росту бізнесу.
🔗 Як выкарыстоўваць штучны інтэлект для павышэння прадукцыйнасці
Адкрыйце для сябе эфектыўныя працоўныя працэсы са штучным інтэлектам, якія эканомяць час і павышаюць эфектыўнасць.
🔗 Што такое навыкі штучнага інтэлекту
Вывучыце ключавыя кампетэнцыі ў галіне штучнага інтэлекту, неабходныя для спецыялістаў, гатовых да будучыні.
Што такое прагназуючы штучны інтэлект? Вызначэнне 🤖
Прагназуючы штучны інтэлект выкарыстоўвае статыстычны аналіз і машыннае навучанне, каб знаходзіць заканамернасці ў гістарычных дадзеных і прагназаваць верагодныя вынікі — хто купляе, што церпіць няўдачу, калі попыт рэзка ўзрастае. Калі казаць крыху больш дакладна, ён спалучае класічную статыстыку з алгарытмамі машыннага навучання для ацэнкі верагоднасцей або значэнняў адносна бліжэйшай будучыні. Той жа дух, што і прагнастычная аналітыка; іншая назва, тая ж ідэя прагназавання таго, што будзе далей [5].
Калі вам падабаюцца афіцыйныя спасылкі, стандартызацыйныя органы і тэхнічныя даведнікі апісваюць прагназаванне як выманне сігналаў (тэндэнцыі, сезоннасці, аўтакарэляцыі) з упарадкаваных па часе дадзеных для прагназавання будучых значэнняў [2].
Што робіць прагназуючы штучны інтэлект карысным ✅
Кароткі адказ: менавіта яна ўплывае на прыняцце рашэнняў, а не толькі на панэлі кіравання. Перавага паходзіць з чатырох рыс:
-
Дзейнасць — вынікі адпавядаюць наступным крокам: зацвярджэнне, маршрутызацыя, паведамленне, праверка.
-
Імавернасны — вы атрымліваеце адкалібраваныя верагоднасці, а не толькі вібрацыі [3].
-
Паўтаральнасць — пасля разгортвання мадэлі працуюць пастаянна, як ціхі калега, які ніколі не спіць.
-
Вымерныя — узлётная рыса, дакладнасць, RMSE — што заўгодна — поспех можна вымераць колькасна.
Будзем шчырымі: калі прагназуючы штучны інтэлект добра працуе, гэта амаль сумна. Прыходзяць абвесткі, кампаніі самі сабе нацэльваюцца, планавальнікі заказваюць запасы раней. Сумна — гэта прыгожа.
Кароткі анекдот: мы бачылі, як каманды сярэдняга бізнесу выпускалі невялікую мадэль з градыентным павышэннем, якая проста ацэньвала «рызыку дэфіцыту тавараў на працягу наступных 7 дзён», выкарыстоўваючы затрымкі і функцыі календара. Ніякіх глыбокіх сетак, толькі чыстыя дадзеныя і выразныя парогі. Перамога была не імгненнай — гэта была меншая колькасць выклікаў для экстранай дапамогі ў аперацыях.
Прагназуючы штучны інтэлект супраць генератыўнага штучнага інтэлекту - хуткі падзел ⚖️
-
Генератыўны штучны інтэлект стварае новы кантэнт — тэкст, выявы, код — шляхам мадэлявання размеркаванняў дадзеных і выбаркі з іх [4].
-
Прагназуючы штучны інтэлект прагназуе вынікі — рызыку адтоку, попыт на наступным тыдні, верагоднасць дэфолту — шляхам ацэнкі ўмоўных верагоднасцей або значэнняў з гістарычных заканамернасцей [5].
Уявіце сабе генератыўны дызайн як творчую студыю, а прагнастычны — як метэаралагічны сэрвіс. Той самы набор інструментаў (ML), розныя мэты.
Дык… што такое прагназуючы штучны інтэлект на практыцы? 🔧
-
Збярыце пазначаныя гістарычныя дадзеныя — вынікі, якія вас цікавяць, і ўваходныя дадзеныя, якія могуць іх растлумачыць.
-
Інжынерныя функцыі - пераўтвараюць неапрацаваныя дадзеныя ў карысныя сігналы (лагі, слізгальная статыстыка, убудаванне тэксту, катэгарыяльныя кадаванні).
-
Навучаць алгарытмы, якія адпавядаюць мадэлі і вывучаюць сувязі паміж уваходнымі дадзенымі і вынікамі.
-
Ацэньваць - правяраць дадзеныя аб затрымцы з дапамогай метрык, якія адлюстроўваюць каштоўнасць для бізнесу.
-
Разгортванне і адпраўка прагнозаў у ваша прыкладанне, працоўны працэс або сістэму абвестак.
-
Маніторынг - адсочванне прадукцыйнасці, сачэнне за дадзеных / канцэпцый і падтрыманне перападрыхтоўкі/перакаліброўкі. Вядучыя структуры выразна называюць зрушэнне, прадузятасць і якасць дадзеных пастаяннымі рызыкамі, якія патрабуюць кіравання і маніторынгу [1].
Алгарытмы вар'іруюцца ад лінейных мадэляў да ансамбляў дрэў і нейронных сетак. Аўтарытэтная дакументацыя каталагізуе звычайныя падазраваныя - лагістычная рэгрэсія, выпадковыя лясы, градыентнае ўзмацненне і іншае - з тлумачэннем кампрамісаў і варыянтамі каліброўкі верагоднасці, калі вам патрэбныя надзейныя вынікі [3].
Будаўнічыя блокі - дадзеныя, пазнакі і мадэлі 🧱
-
Дадзеныя — падзеі, транзакцыі, тэлеметрыя, клікі, паказанні датчыкаў. Структураваныя табліцы з'яўляюцца распаўсюджанымі, але тэкст і выявы можна пераўтварыць у лікавыя функцыі.
-
Пазнакі — тое, што вы прагназуеце: куплена ці не, колькасць дзён да няўдачы, попыт у доларах.
-
Алгарытмы
-
Класіфікацыя, калі вынік з'яўляецца катэгарычным або не з'яўляецца адтокам.
-
Рэгрэсія , калі вынік лікавы — колькасць прададзеных адзінак.
-
Часовыя шэрагі, дзе парадак мае значэнне — прагназаванне значэнняў у часе, дзе тэндэнцыя і сезоннасць патрабуюць відавочнай апрацоўкі [2].
-
Прагназаванне часовых шэрагаў дадае сезоннасць і тэндэнцыю ў змешаныя метады, такія як экспанентнае згладжванне або мадэлі сямейства ARIMA, з'яўляюцца класічнымі інструментамі, якія дагэтуль застаюцца базавымі нароўні з сучасным машынным навучаннем [2].
Распаўсюджаныя выпадкі выкарыстання, якія сапраўды дастаўляюцца 📦
-
Даход і рост
-
Ацэнка лідаў, павышэнне канверсіі, персаналізаваныя рэкамендацыі.
-
-
Рызыка і адпаведнасць
-
Выяўленне махлярства, крэдытная рызыка, сцяжкі AML, выяўленне анамалій.
-
-
Пастаўка і эксплуатацыя
-
Прагназаванне попыту, планаванне працоўнай сілы, аптымізацыя запасаў.
-
-
Надзейнасць і абслугоўванне
-
Прагназуемае тэхнічнае абслугоўванне абсталявання — дзейнічайце да выхаду з ладу.
-
-
Ахова здароўя і грамадскае здароўе
-
Прагназаваць паўторныя шпіталізацыі, тэрміновасць трыяжу або мадэлі рызыкі захворвання (з дбайнай праверкай і кіраваннем)
-
Калі вы калі-небудзь атрымлівалі SMS-паведамленне «гэтая транзакцыя выглядае падазронай», вы ўжо сутыкаліся з прагназуючым штучным інтэлектам у рэальным жыцці.
Параўнальная табліца - інструменты для прагнастычнага штучнага інтэлекту 🧰
Заўвага: цэны прыведзены ў агульных рысах — адкрыты зыходны код бясплатны, воблачнае плацяжы залежаць ад карыстання, карпаратыўнасць адрозніваецца. Для рэалізму пакінута адна-дзве невялічкія асаблівасці…
| Інструмент / Платформа | Лепш за ўсё падыходзіць для | Прайс-стадыён | Чаму гэта працуе - кароткі змест |
|---|---|---|---|
| scikit-learn | Практыкуючыя спецыялісты, якія жадаюць кантролю | бясплатны/адкрыты зыходны код | Надзейныя алгарытмы, узгодненыя API, велізарная супольнасць… дапамагаюць вам заставацца сумленнымі [3]. |
| XGBoost / LightGBM | Дасведчаныя карыстальнікі таблічных дадзеных | бясплатны/адкрыты зыходны код | Градыентнае ўзмацненне выдатна падыходзіць для структураваных дадзеных, выдатныя базавыя лініі. |
| TensorFlow / PyTorch | Сцэнарыі глыбокага навучання | бясплатны/адкрыты зыходны код | Гнуткасць для карыстальніцкіх архітэктур — часам празмерная, часам ідэальная. |
| Прарок або САРЫМАКС | Часовыя шэрагі бізнесу | бясплатны/адкрыты зыходны код | Дастаткова добра спраўляецца з тэндэнцыяй і сезоннасцю з мінімальнымі намаганнямі [2]. |
| Воблачнае AutoML | Каманды, якія жадаюць хуткасці | на аснове выкарыстання | Аўтаматызаваная распрацоўка функцый + выбар мадэлі — хуткія выйгрышы (сачыце за коштам). |
| Карпаратыўныя платформы | Арганізацыі з пераважным кіраваннем | на аснове ліцэнзіі | Працоўны працэс, маніторынг, кантроль доступу — менш самастойнай працы, большая адказнасць за маштабаванне. |
Чым прагназуемы штучны інтэлект параўноўваецца з прадпісвальнай аналітыкай 🧭
дае адказы на пытанні аб тым, што, верагодна, адбудзецца . Рэскрыптыўнае што нам рабіць , выбіраючы дзеянні, якія аптымізуюць вынікі пры абмежаваннях. Прафесійныя супольнасці вызначаюць рэскрыптыўную аналітыку як выкарыстанне мадэляў для рэкамендацыі аптымальных дзеянняў, а не толькі прагнозаў [5]. На практыцы прагназаванне падсілкоўвае рэцэпты.
Ацэнка мадэляў - важныя паказчыкі 📊
Выберыце паказчыкі, якія адпавядаюць рашэнню:
-
Класіфікацыя
-
Дакладнасць , каб пазбегнуць ілжывых спрацоўванняў, калі абвесткі дарагія.
-
Памятайце , каб злавіць больш сапраўдных падзей, калі прамахі дорага каштуюць.
-
AUC-ROC для параўнання якасці рангу па розных парогах.
-
-
Рэгрэсія
-
СКА/МАЕ для агульнай велічыні памылкі.
-
MAPE, калі адносныя памылкі маюць значэнне.
-
-
Прагназаванне
-
MASE, sMAPE для параўнання часовых шэрагаў.
-
Пакрыццё прагназуемых інтэрвалаў - ці сапраўды вашы паласы нявызначанасці ўтрымліваюць праўду?
-
Мне падабаецца эмпірычнае правіла: аптымізуйце паказчык, які адпавядае вашаму бюджэту, каб пазбегнуць памылак.
Рэальнасць разгортвання - дрэйф, прадузятасць і маніторынг 🌦️
Мадэлі дэградуюць. Змены ў дадзеных. Змены ў паводзінах. Гэта не правал — гэта рух свету. Вядучыя фрэймворкі заклікаюць да пастаяннага маніторынгу зрушэння дадзеных і канцэпцый , вылучаюць рызыкі прадузятасці і якасці дадзеных, а таксама рэкамендуюць дакументацыю, кантроль доступу і кіраванне жыццёвым цыклам [1].
-
Зрух канцэпцыі — сувязі паміж уваходнымі дадзенымі і мэтай змяняюцца, таму ўчорашнія мадэлі больш не вельмі добра прадказваюць заўтрашнія вынікі.
-
Зрух мадэлі або дадзеных — зрушэнне размеркавання ўваходных дадзеных, змяненне датчыкаў, змяненне паводзін карыстальнікаў, зніжэнне прадукцыйнасці. Выяўляйце і дзейнічайце.
Практычны дапаможнік: маніторынг паказчыкаў у прадукцыйным рэжыме, правядзенне тэстаў на дрэйф, падтрыманне частаты перападрыхтоўкі і запіс прагнозаў у параўнанні з вынікамі для бэк-тэсціравання. Простая стратэгія адсочвання пераўзыходзіць складаную, якую вы ніколі не выкарыстоўваеце.
Просты пачатковы працоўны працэс, які вы можаце скапіяваць 📝
-
Вызначце рашэнне — што вы будзеце рабіць з прагнозам пры розных парогах?
-
Збірайце дадзеныя — збірайце гістарычныя прыклады з выразнымі вынікамі.
-
Падзел - навучанне, праверка і сапраўдны тэст на трываласць.
-
Базавыя паказчыкі — пачніце з лагістычнай рэгрэсіі або невялікага дрэвападобнага ансамбля. Базавыя паказчыкі кажуць нязручныя праўды [3].
-
Паляпшэнне - распрацоўка функцый, перакрыжаваная праверка, старанная рэгулярызацыя.
-
Ship — канчатковая кропка API або пакетнае заданне, якое запісвае прагнозы ў вашу сістэму.
-
Сачыце за панэлямі кіравання якасцю, сігналізацыямі аб дрэйфе, трыгерамі перанавучання [1].
Калі гэта гучыць як шмат, то так і ёсць, але вы можаце зрабіць гэта паэтапна. Малы выйграе складана.
Тыпы дадзеных і шаблоны мадэлявання - кароткія звесткі 🧩
-
Таблічныя запісы — хатняя пляцоўка для мадэляў градыентнага ўзмацнення і лінейных мадэляў [3].
-
Часовыя шэрагі — часта атрымліваюць выгаду ад раскладання на трэнд/сезоннасць/рэшткі перад машынным навучаннем. Класічныя метады, такія як экспанентнае згладжванне, застаюцца моцнымі базавымі [2].
-
Тэкст, выявы - убудоўваць у лікавыя вектары, а затым прадказваць як таблічны.
-
Графы — сеткі кліентаў, сувязі паміж прыладамі — часам дапамагае графавая мадэль, часам гэта празмерная інжынерыя. Вы ведаеце, як гэта бывае.
Рызыкі і агароджы — бо рэальнае жыццё бруднае 🛑
-
Зрушэнне і рэпрэзентатыўнасць — недастаткова прадстаўленыя кантэксты прыводзяць да нераўнамернай памылкі. Дакументуйце і кантралюйце [1].
-
Уцечка — функцыі, якія выпадкова ўключаюць праверку на наяўнасць атруты ў будучыні.
-
Ілжывыя карэляцыі — мадэлі зачапляюцца за хуткія шляхі.
-
Перанавучанне — выдатна на трэніроўках, сумна на вытворчасці.
-
Кіраванне — адсочванне радаводу, узгадненняў і кантролю доступу — сумна, але вельмі важна [1].
Калі вы не спадзяецеся на дадзеныя, каб пасадзіць самалёт, не спадзявайцеся на іх, каб адмовіць у пазыцы. Невялікае перабольшанне, але вы разумееце сутнасць.
Паглыбленае апусканне: прагназаванне таго, што рухаецца ⏱️
Пры прагназаванні попыту, энергетычнай нагрузкі або вэб-трафіку часовыя шэрагі . Значэнні ўпарадкаваны, таму вы паважаеце часавую структуру. Пачніце з дэкампазіцыі сезонных тэндэнцый, паспрабуйце экспанентнае згладжванне або базавыя лініі сямейства ARIMA, параўнайце з узмоцненымі дрэвамі, якія ўключаюць адкладзеныя прыкметы і каляндарныя эфекты. Нават невялікая, добра настроеная базавая лінія можа пераўзысці яркую мадэль, калі дадзеныя разрэджаныя або зашумленыя. Інжынерныя даведнікі выразна тлумачаць гэтыя асновы [2].
Міні-глосарый у стылі FAQ 💬
-
Што такое прагнастычны штучны інтэлект? Машыннае навучанне плюс статыстыка, якая прадказвае верагодныя вынікі на аснове гістарычных заканамернасцей. Той жа прынцып, што і прагнастычная аналітыка, ужываецца ў працоўных працэсах праграмнага забеспячэння [5].
-
Чым ён адрозніваецца ад генератыўнага штучнага інтэлекту? Стварэнне супраць прагназавання. Генератыўны стварае новы кантэнт; прагназуючы ацэньвае верагоднасці або значэнні [4].
-
Ці патрэбна мне глыбокае навучанне? Не заўсёды. Шмат якія выпадкі выкарыстання з высокай рэнтабельнасцю інвестыцый працуюць на дрэвах або лінейных мадэлях. Пачніце з простага, а потым павялічвайце [3].
-
А як наконт правілаў або структур? Выкарыстоўвайце надзейныя структуры для кіравання рызыкамі і кіравання — яны робяць акцэнт на прадузятасці, адхіленні і дакументацыі [1].
Занадта доўга. Не чытаў! 🎯
Прагназуемы штучны інтэлект не з'яўляецца загадкай. Гэта дысцыплінаваная практыка навучання на ўчорашнім вопыце, каб дзейнічаць разумней сёння. Калі вы ацэньваеце інструменты, пачніце са свайго рашэння, а не з алгарытму. Усталюйце надзейную базавую лінію, разгортвайце яе там, дзе яна змяняе паводзіны, і няўмольна вымярайце. І памятайце — мадэлі старэюць, як малако, а не віно, — таму плануйце маніторынг і перанавучанне. Трохі сціпласці мае вялікае значэнне.
Спасылкі
-
NIST - Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0). Спасылка
-
NIST ITL - Даведнік па інжынернай статыстыцы: Уводзіны ў аналіз часовых шэрагаў. Спасылка
-
scikit-learn - Кіраўніцтва карыстальніка па кіраваным навучанні. Спасылка
-
NIST - Структура кіравання рызыкамі штучнага інтэлекту: генератыўны профіль штучнага інтэлекту. Спасылка
-
INFORMS - Даследаванні і аналітыка аперацый (агляд відаў аналітыкі). Спасылка