Штучны інтэлект з'яўляецца ўсюды — на вашым тэлефоне, у вашай паштовай скрыні, падштурхоўваючы карты, складаючы электронныя лісты, якія вы напалову хацелі напісаць. Але што такое ШІ ? Карацей кажучы: гэта набор метадаў, якія дазваляюць камп'ютарам выконваць задачы, якія мы асацыюем з чалавечым інтэлектам, такія як распазнаванне заканамернасцей, рабіць прагнозы і генераваць мову або выявы. Гэта не маркетынг, заснаваны на матэматыцы, дадзеных і вялікай колькасці спроб і памылак. Аўтарытэтныя спасылкі прадстаўляюць ШІ як сістэмы, якія могуць вучыцца, разважаць і дзейнічаць у мэтах такім чынам, які мы лічым інтэлектуальным. [1]
Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Што такое штучны інтэлект з адкрытым зыходным кодам?
Разуменне штучнага інтэлекту з адкрытым зыходным кодам, яго пераваг, мадэляў ліцэнзавання і супрацоўніцтва з супольнасцю.
🔗 Што такое нейронная сетка ў штучным інтэлекце?
Вывучыце асновы нейронных сетак, тыпы архітэктуры, навучанне і распаўсюджаныя спосабы выкарыстання.
🔗 Што такое камп'ютэрны зрок у штучным інтэлекце?
Паглядзіце, як машыны інтэрпрэтуюць выявы, ключавыя задачы, наборы дадзеных і праграмы.
🔗 Што такое сімвалічны штучны інтэлект?
Даследуйце сімвалічнае мысленне, графы ведаў, правілы і гібрыдныя нейрасімвалічныя сістэмы.
Што такое штучны інтэлект: хуткая версія 🧠➡️💻
Штучны інтэлект — гэта набор метадаў, якія дазваляюць праграмнаму забеспячэнню прыблізна ацэньваць інтэлектуальныя паводзіны. Замест таго, каб кадаваць кожнае правіла, мы часта навучаем мадэлі на прыкладах, каб яны маглі абагульняць іх на новыя сітуацыі — распазнаванне малюнкаў, пераўтварэнне маўлення ў тэкст, планаванне маршруту, памочнікі па коду, прагназаванне структуры бялку і гэтак далей. Калі вам падабаецца акуратнае вызначэнне для вашых нататак: уявіце сабе камп'ютэрныя сістэмы, якія выконваюць задачы, звязаныя з інтэлектуальнымі працэсамі чалавека, такімі як разважанне, пошук сэнсу і навучанне з дадзеных. [1]
Карысная ментальная мадэль з гэтай галіны заключаецца ў тым, каб разглядаць штучны інтэлект як мэтанакіраваныя сістэмы , якія ўспрымаюць сваё асяроддзе і выбіраюць дзеянні — гэта карысна, калі вы пачынаеце думаць пра цыклы ацэнкі і кіравання. [1]
Што робіць штучны інтэлект сапраўды карысным✅
Чаму замест традыцыйных правілаў варта выкарыстоўваць штучны інтэлект?
-
Сіла шаблонаў — мадэлі выяўляюць тонкія карэляцыі паміж велізарнымі наборамі дадзеных, якія людзі прапусцілі б да абеду.
-
Адаптацыя — пры наяўнасці большай колькасці дадзеных прадукцыйнасць можа палепшыцца без перапісвання ўсяго кода.
-
Хуткасць у маштабе — пасля навучання мадэлі працуюць хутка і стабільна, нават пры стрэсавых аб'ёмах.
-
Генератыўнасць — сучасныя сістэмы могуць ствараць тэкст, выявы, код і нават малекулы-кандыдаты, а не толькі класіфікаваць рэчы.
-
Імавернаснае мысленне — яны спраўляюцца з нявызначанасцю больш вытанчана, чым далікатныя лясы калі-інакш.
-
Інструменты з выкарыстаннем інструментаў — вы можаце падключыць мадэлі да калькулятараў, баз дадзеных або пошуку, каб павысіць надзейнасць.
-
Калі гэта дрэнна — прадузятасць, галюцынацыі, састарэлыя навучальныя дадзеныя, рызыкі для прыватнасці. Мы да гэтага дойдзем.
Будзем шчырымі: часам штучны інтэлект адчуваецца як ровар для розуму, а часам — як аднаколавы ровар па жвіры. Абодва варыянты могуць быць праўдай.
Як працуе штучны інтэлект з хуткасцю чалавека 🔧
Большасць сучасных сістэм штучнага інтэлекту спалучаюць у сабе:
-
Дадзеныя — прыклады мовы, выявы, клікі, паказанні датчыкаў.
-
Мэты — функцыя страт, якая паказвае, як выглядае «добра».
-
Алгарытмы — гэта працэдура навучання, якая падштурхоўвае мадэль да мінімізацыі гэтых страт.
-
Ацэнка - наборы тэстаў, метрыкі, праверкі на надзейнасць.
-
Разгортванне — абслугоўванне мадэлі з маніторынгам, бяспекай і агароджамі.
Дзве шырокія традыцыі:
-
Сімвалічны або лагічны штучны інтэлект — відавочныя правілы, графы ведаў, пошук. Выдатна падыходзіць для фармальных разважанняў і абмежаванняў.
-
Статыстычны або навучальны штучны інтэлект — мадэлі, якія вучацца на дадзеных. Менавіта тут жыве глыбокае навучанне і адкуль бярэцца большая частка нядаўняга ажыятажу; шырока цытаваны агляд адлюстроўвае тэрыторыю ад шматслаёвых прадстаўленняў да аптымізацыі і абагульнення. [2]
У штучным інтэлекце, заснаванам на навучанні, важныя некалькі слупоў:
-
Навучанне пад наглядам — вучыцеся на пазначаных прыкладах.
-
Ненаглядныя і саманаглядныя - вывучайце структуру з немаркаваных дадзеных.
-
Навучанне з падмацаваннем — вучыцеся праз спробы і зваротную сувязь.
-
Генератыўнае мадэляванне — навучыцеся ствараць новыя ўзоры, якія выглядаюць рэальна.
Дзве генератыўныя сем'і, пра якія вы будзеце чуць штодня:
-
Трансфарматары — архітэктура, якая ляжыць у аснове большасці мадэляў вялікіх моў. Яна выкарыстоўвае ўвагу для сувязі кожнага токена з іншымі, што дазваляе паралельнае навучанне і дзіўна плаўныя вынікі. Калі вы чулі пра «самаўвагу», то гэта асноўны трук. [3]
-
Дыфузійныя мадэлі — яны вучацца адварочваць працэс шумавіння, вяртаючыся ад выпадковага шуму да выразнага малюнка або гуку. Гэта як перамешванне калоды, павольна і асцярожна, але з выкарыстаннем вылічэнняў; фундаментальная праца паказала, як эфектыўна навучаць і сэмпліраваць. [5]
Калі метафары здаюцца занадта расцягнутымі, гэта справядліва — штучны інтэлект — гэта рухомая мішэнь. Мы ўсе вучымся танцаваць, пакуль музыка змяняецца падчас выканання.
Дзе вы ўжо сустракаеце штучны інтэлект кожны дзень 📱🗺️📧
-
Пошук і рэкамендацыі - вынікі рэйтынгу, стужкі, відэа.
-
Электронная пошта і дакументы - аўтазапаўненне, рэзюмэ, праверка якасці.
-
Камера і аўдыё - падаўленне шуму, HDR, транскрыпцыя.
-
Навігацыя - прагназаванне руху, планаванне маршруту.
-
Падтрымка і абслугоўванне — агенты ў чаце, якія праводзяць сартаванне і рыхтуюць адказы.
-
Кадаванне - прапановы, рэфактарынг, тэсты.
-
Ахова здароўя і навука — трыяж, падтрымка візуалізацыі, прагназаванне структуры. (Разглядаць клінічныя кантэксты як крытычна важныя для бяспекі; выкарыстоўваць кантроль чалавека і дакументальна задакументаваныя абмежаванні.) [2]
Міні-гісторыя: каманда распрацоўшчыкаў прадукту можа правесці A/B-тэставанне этапу пошуку перад моўнай мадэллю; узровень памылак часта зніжаецца, таму што мадэль разважае над больш свежым, спецыфічным для задачы кантэкстам, а не робіць здагадкі. (Метад: загадзя вызначыць метрыкі, зрабіць рэзервовы набор і параўнаць падобныя запыты.)
Моцныя бакі, абмежаванні і лёгкі хаос паміж імі ⚖️
Моцныя бакі
-
З лёгкасцю апрацоўвае вялікія, хаатычныя наборы дадзеных.
-
Маштабуецца для розных задач з выкарыстаннем аднаго і таго ж асноўнага абсталявання.
-
Вывучае латэнтную структуру, якую мы не стварылі ўручную. [2]
Абмежаванні
-
Галюцынацыі — мадэлі могуць даваць праўдападобныя, але няправільныя вынікі.
-
Зрушэнне — навучальныя дадзеныя могуць кадзіраваць сацыяльныя прадузятасці, якія сістэмы затым прайграваюць.
-
Надзейнасць — памежныя выпадкі, варожыя ўклады і зрух размеркавання могуць парушыць працу.
-
Канфідэнцыяльнасць і бяспека — канфідэнцыйныя дадзеныя могуць уцекнуць, калі вы не будзеце асцярожныя.
-
Тлумачнасць — чаму так было сказана? Часам незразумела, што перашкаджае правядзенню аўдытаў.
Кіраванне рызыкамі існуе для таго, каб не ствараць хаос: структура кіравання рызыкамі ў галіне штучнага інтэлекту NIST прапануе практычныя, добраахвотныя рэкамендацыі па павышэнні надзейнасці на працягу ўсяго працэсу праектавання, распрацоўкі і разгортвання — падумайце пра картаграфаванне рызык, іх вымярэнне і кіраванне выкарыстаннем ад пачатку да канца. [4]
Правілы дарожнага руху: бяспека, кіраванне і адказнасць 🛡️
Рэгуляванне і рэкамендацыі адпавядаюць практыцы:
-
Падыходы, заснаваныя на ацэнцы рызыкі — да больш рызыкоўных выпадкаў прымянення патрабуюцца больш строгія патрабаванні; важная дакументацыя, кіраванне дадзенымі і апрацоўка інцыдэнтаў. Публічныя структуры падкрэсліваюць празрыстасць, кантроль з боку чалавека і пастаянны маніторынг. [4]
-
Нюансы ў сектары — крытычна важныя для бяспекі сферы (напрыклад, ахова здароўя) патрабуюць удзелу чалавека і стараннай ацэнкі; інструменты агульнага прызначэння ўсё яшчэ маюць выгаду ад выразнай дакументацыі па прызначэнні і абмежаваннях. [2]
Гаворка ідзе не пра стрымліванне інавацый; гаворка ідзе пра тое, каб не ператвараць свой прадукт у машыну для папкорну ў бібліятэцы... што гучыць весела, пакуль не перастане здавацца такім.
Тыпы штучнага інтэлекту на практыцы з прыкладамі 🧰
-
Успрыманне - зрок, маўленне, зліццё сэнсараў.
-
Мова - чат, пераклад, рэзюмэ, здабыванне.
-
Прагназаванне - прагназаванне попыту, ацэнка рызык, выяўленне анамалій.
-
Планаванне і кантроль - робататэхніка, лагістыка.
-
Генерацыя - выявы, аўдыё, відэа, код, структураваныя дадзеныя.
Пад капотам матэматыка абапіраецца на лінейную алгебру, тэорыю імавернасцей, аптымізацыю і вылічальныя стэкі, якія забяспечваюць бесперабойную працу ўсяго працэсу. Больш падрабязны агляд асноў глыбокага навучання можна знайсці ў кананічным аглядзе. [2]
Параўнальная табліца: папулярныя інструменты штучнага інтэлекту з першага погляду 🧪
(Злёгку недасканалыя наўмысна. Цэны зменяцца. Ваш прабег будзе адрознівацца.)
| Інструмент | Лепш за ўсё падыходзіць для | Кошт | Чаму гэта працуе даволі добра |
|---|---|---|---|
| Магістр права ў стылі чата | Пісьмо, пытанні і адказы, фарміраванне ідэй | Бясплатна + платна | Моцнае мадэляванне мовы; інструментальныя перахопнікі |
| Генератары малюнкаў | Дызайн, мудборды | Бясплатна + платна | Дыфузійныя мадэлі выдатна падыходзяць для візуальнага эфекту |
| Кодэкс другіх пілотаў | Распрацоўшчыкі | Платныя пробныя версіі | Навучаўся працаваць з корпусамі кода; хутка рэдагуе |
| Пошук па вектарнай базе дадзеных | Каманды па развіцці прадуктаў, падтрымка | Змяняецца | Атрымлівае факты, каб паменшыць зрушэнне |
| Інструменты для маўлення | Сустрэчы, стваральнікі | Бясплатна + платна | ASR + TTS, што неверагодна выразна |
| Аналітычны штучны інтэлект | Аперацыі, фінансы | Прадпрыемства | Прагназаванне без 200 электронных табліц |
| Інструменты бяспекі | Адпаведнасць, кіраванне | Прадпрыемства | Картаграфаванне рызык, вядзенне рэгістрацыі, фарміраванне камандных дзеянняў |
| Маленькі на прыладзе | Мабільныя прылады, людзі з прыватнасцю | Вольна | Нізкая затрымка; даныя захоўваюцца лакальна |
Як ацаніць сістэму штучнага інтэлекту як прафесіянал 🧪🔍
-
Вызначце працу — аднаскладовая фармулёўка задання.
-
Выберыце паказчыкі — дакладнасць, затрымку, кошт, трыгеры бяспекі.
-
Стварыце тэставы набор — прадстаўнічы, разнастайны, працяглы.
-
Праверце рэжымы збояў — уваходныя дадзеныя, якія сістэма павінна адхіляць або павышаць.
-
Праверка на прадузятасць — дэмаграфічныя зрэзы і адчувальныя атрыбуты, дзе гэта дастасавальна.
-
Чалавек у курсе — укажыце, калі чалавек павінен праводзіць агляд.
-
Журнал і маніторынг - выяўленне зрушэння, рэагаванне на інцыдэнты, адкаты.
-
Дакумент — крыніцы дадзеных, абмежаванні, меркаванае выкарыстанне, сігналы трывогі. NIST AI RMF прапануе вам агульную мову і працэсы для гэтага. [4]
Распаўсюджаныя памылковыя ўяўленні, якія я чую пастаянна 🙃
-
«Гэта проста капіраванне». Навучанне засвойвае статыстычную структуру; генерацыя складае новыя вынікі, якія адпавядаюць гэтай структуры. Гэта можа быць вынаходлівым — або няправільным — але гэта не капіраванне і ўстаўка. [2]
-
«Штучны інтэлект разумее як чалавек». Ён мадэлюе заканамернасці. Часам гэта выглядае як разуменне; часам гэта ўпэўненае размыццё. [2]
-
«Чым больш, тым лепш». Маштаб дапамагае, але якасць дадзеных, іх адпаведнасць і пошук часта маюць большае значэнне. [2][3]
-
«Адзін штучны інтэлект, які кіруе ўсімі». Сапраўдныя стэкі шматмадэльныя: пошук фактаў, генератыўны пошук тэксту, невялікія хуткія мадэлі на прыладзе і класічны пошук.
Крыху больш падрабязны погляд: Трансформеры і дыфузія, за адну хвіліну ⏱️
-
Трансфарматары вылічваюць балы ўвагі паміж токенамі, каб вырашыць, на чым засяродзіцца. Накладанне слаёў фіксуе доўгатэрміновыя залежнасці без відавочнага паўтарэння, што забяспечвае высокі паралелізм і высокую прадукцыйнасць у моўных задачах. Гэтая архітэктура ляжыць у аснове большасці сучасных моўных сістэм. [3]
-
Дыфузійныя мадэлі вучацца паступова ліквідаваць шум, як паліраваць затуманенае люстэрка, пакуль не з'явіцца твар. Асноўныя ідэі навучання і выбаркі адкрылі бум генерацыі малюнкаў і цяпер распаўсюджваюцца на аўдыё і відэа. [5]
Мікраглосарый, які вы можаце захаваць 📚
-
Мадэль — параметраваная функцыя, якую мы навучаем для адлюстравання ўваходных дадзеных у выхадныя.
-
Навучанне - аптымізацыя параметраў для мінімізацыі страт на прыкладах.
-
Перанавучанне — выдатна спраўляецца з навучальнымі дадзенымі, а ў іншых — не вельмі.
-
Галюцынацыя — плаўны, але фактычна няправільны вывад.
-
RAG - пакаленне з пашыраным пошукам, якое звяртаецца да новых крыніц.
-
Выраўноўванне — фарміраванне паводзін для выканання інструкцый і нормаў.
-
Бяспека — прадухіленне шкодных наступстваў і кіраванне рызыкамі на працягу ўсяго жыццёвага цыклу.
-
Выснова - выкарыстанне навучанай мадэлі для прадказанняў.
-
Затрымка — час ад уводу да адказу.
-
Абароны — палітыкі, фільтры і элементы кіравання вакол мадэлі.
Занадта доўга, не чытаў - Заключныя заўвагі 🌯
Што такое штучны інтэлект? Сукупнасць метадаў, якія дазваляюць камп'ютарам вучыцца на дадзеных і разумна дзейнічаць для дасягнення мэтаў. Сучасная хваля грунтуецца на глыбокім навучанні, асабліва на трансфарматарах для мовы і распаўсюджванні для медыя. Пры ўважлівым выкарыстанні штучны інтэлект маштабуе распазнаванне вобразаў, паскарае творчую і аналітычную працу і адкрывае новыя навуковыя дзверы. Пры нядбайным выкарыстанні ён можа ўвесці ў зман, выключыць або падарваць давер. Шчаслівы шлях спалучае моцную інжынерыю з кіраваннем, вымярэннем і ноткай пакоры. Гэты баланс не проста магчымы — ён навучальны, тэстуемы і падтрымліваемы з правільнымі структурамі і правіламі. [2][3][4][5]
Спасылкі
[1] Энцыклапедыя Брытаніка - Штучны інтэлект (ШІ) : чытаць далей
[2] Прырода - «Глыбокае навучанне» (ЛеКун, Бенджыа, Хінтан) : чытаць далей
[3] arXiv - «Увага - гэта ўсё, што вам трэба» (Васані і інш.) : чытаць далей
[4] NIST - Структура кіравання рызыкамі, звязанымі са штучным інтэлектам : чытаць далей
[5] arXiv - «Падаўленне шуму ў дыфузійных імавернасных мадэлях» (Хо і інш.) : чытаць далей