Робаты выкарыстоўваюць штучны інтэлект падобна да таго, як людзі выкарыстоўваюць свой мозг, каб перамяшчацца па пакоі, не ўпіраючыся тварам у крэсла. Яны абапіраюцца на датчыкі, праграмнае забеспячэнне і алгарытмы, каб высветліць, што адбываецца, вырашыць, што важна, і прыняць меры — часта ў абмежаваных па часе умовах і з блытанымі рэальнымі дадзенымі.
Ніжэй прыведзены агляд таго, як штучны інтэлект працуе ўнутры робатаў, каб забяспечыць іх эфектыўнае функцыянаванне.
Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Калі робаты Ілана Маска пагражаюць працоўным месцам
Што могуць рабіць робаты Tesla і якія ролі могуць змяніцца.
🔗 Што такое штучны інтэлект гуманоіднага робата
Даведайцеся, як гуманоідныя робаты ўспрымаюць, рухаюцца і выконваюць інструкцыі.
🔗 Якія прафесіі заменіць штучны інтэлект
Пасады, найбольш схільныя да аўтаматызацыі, і навыкі, якія застаюцца каштоўнымі.
🔗 Праца ў сферы штучнага інтэлекту і будучыя кар'еры
Сённяшнія кар'ерныя шляхі ў сферы штучнага інтэлекту і як штучны інтэлект змяняе тэндэнцыі занятасці.
Як робаты выкарыстоўваюць штучны інтэлект? Хуткая ментальная мадэль
Большасць робатаў з падтрымкай штучнага інтэлекту прытрымліваюцца наступнага цыкла:
-
Пачуццё 👀: камеры, мікрафоны, лідар, датчыкі сілы, датчыкі колаў і г.д.
-
Разуменне 🧠: Выяўленне аб'ектаў, ацэнка месцазнаходжання, распазнаванне сітуацый, прагназаванне руху.
-
Плануйце 🗺️: Выбірайце мэты, пралічвайце бяспечныя шляхі, плануйце задачы.
-
Дзеянне 🦾: Генерацыя рухальных каманд, захоп, пераварот, балансаванне, пазбяганне перашкод.
-
Вучыцеся 🔁: Паляпшайце ўспрыманне або паводзіны з дапамогай дадзеных (часам анлайн, часцей афлайн).
Шмат якія рабатызаваныя «штучныя інтэлекты» насамрэч уяўляюць сабой набор разам працуючых элементаў — успрымання , ацэнкі стану , планавання і кіравання , — якія разам забяспечваюць аўтаномію.
Адна практычная «палявая» рэальнасць: складаная частка звычайна не ў тым, каб прымусіць робата зрабіць нешта адзін раз у чыстай дэманстрацыі, а ў тым, каб ён надзейна , калі асвятленне змяняецца, колы слізгаюць, падлога блішчыць, паліцы рухаюцца, а людзі ходзяць, як непрадказальныя NPC.

Што робіць мозг робата добрым для штучнага інтэлекту
Надзейная сістэма штучнага інтэлекту робата павінна быць не проста разумнай — яна павінна быць надзейнай у непрадказальных рэальных умовах.
Важныя характарыстыкі ўключаюць:
-
Прадукцыйнасць у рэжыме рэальнага часу ⏱️ (своечасовасць мае значэнне для прыняцця рашэнняў)
-
Устойлівасць да неакуратных дадзеных (блікі, шум, беспарадак, размытасць руху)
-
Вытанчаныя рэжымы адмовы 🧯 (знізь хуткасць, спыніся бяспечна, папрасі дапамогі)
-
Добрыя папярэднія даследаванні + добрае навучанне (фізіка + абмежаванні + машыннае навучанне — не проста «вібрацыі»)
-
Вымерная якасць успрымання 📏 (веданне таго, калі датчыкі/мадэлі пагаршаюць сваю працу)
Найлепшыя робаты часта не тыя, хто можа адзін раз зрабіць яркі трук, а тыя, хто можа добра выконваць сумную працу дзень за днём.
Параўнальная табліца распаўсюджаных будаўнічых блокаў штучнага інтэлекту для робатаў
| Прадмет/інструмент штучнага інтэлекту | Для каго гэта | Прыблізная цана | Чаму гэта працуе |
|---|---|---|---|
| Камп'ютарны зрок (выяўленне аб'ектаў, сегментацыя) 👁️ | Мабільныя робаты, рукі, беспілотнікі | Сярэдні | Пераўтварае візуальны ўваход у карысныя дадзеныя, такія як ідэнтыфікацыя аб'екта |
| SLAM (мапіраванне + лакалізацыя) 🗺️ | Робаты, якія перамяшчаюцца | Сярэдне-высокі | Адсочвае месцазнаходжанне робата, стварае карту, што вельмі важна для навігацыі [1] |
| Планаванне шляху + пазбяганне перашкод 🚧 | Боты дастаўкі, складскія AMR | Сярэдні | Разлічвае бяспечныя маршруты і адаптуецца да перашкод у рэжыме рэальнага часу |
| Класічнае кіраванне (ПІД, кіраванне на аснове мадэлі) 🎛️ | Усё, што з рухавікамі | Нізкі | Забяспечвае стабільны і прадказальны рух |
| Навучанне з падмацаваннем (НП) 🎮 | Складаныя навыкі, маніпуляцыі, перамяшчэнне | Высокі | Навучаецца праз палітыку спроб і памылак, заснаванай на ўзнагароджанні [3] |
| Маўленне + мова (ASR, намер, LLM) 🗣️ | Памочнікі, сэрвісныя робаты | Сярэдне-высокі | Дазваляе ўзаемадзейнічаць з людзьмі праз натуральную мову |
| Выяўленне анамалій + маніторынг 🚨 | Заводы, ахова здароўя, крытычна важныя для бяспекі | Сярэдні | Выяўляе незвычайныя заканамернасці, перш чым яны стануць дарагімі або небяспечнымі |
| Зліццё датчыкаў (фільтры Калмана, навучанае зліццё) 🧩 | Навігацыя, дроны, стэкі аўтаноміі | Сярэдні | Аб'ядноўвае крыніцы дадзеных з шумам для больш дакладных ацэнак [1] |
Успрыманне: як робаты ператвараюць неапрацаваныя дадзеныя датчыкаў у сэнс
Успрыманне — гэта калі робаты ператвараюць патокі датчыкаў у нешта, што яны могуць рэальна выкарыстоўваць:
-
Камеры → распазнаванне аб'ектаў, ацэнка позы, разуменне сцэны
-
Лідар → адлегласць + геаметрыя перашкоды
-
Глыбінявыя камеры → 3D-структура і вольная прастора
-
Мікрафоны → маўленчыя і гукавыя сігналы
-
Датчыкі сілы/крутоўнага моманту → больш бяспечны захоп і сумесная праца
-
Тактыльныя датчыкі → выяўленне слізгацення, кантактныя падзеі
Робаты спадзяюцца на штучны інтэлект, каб адказаць на такія пытанні, як:
-
«Якія прадметы перада мной?»
-
«Гэта чалавек ці манекен?»
-
«Дзе ручка?»
-
«Штосьці рухаецца ў мой бок?»
Тонкая, але важная дэталь: сістэмы ўспрымання ў ідэале павінны выдаваць нявызначанасць (ці паказчык упэўненасці), а не проста адказ «так/не», бо ад таго, наколькі ўпэўнены робат, залежыць далейшае планаванне і рашэнні па бяспецы.
Лакалізацыя і картаграфаванне: ведайце, дзе вы знаходзіцеся, без панікі
Каб робат правільна функцыянаваў, яму трэба ведаць, дзе ён знаходзіцца. Часта гэта вырашаецца з дапамогай SLAM (адначасовая лакалізацыя і картаграфаванне) : стварэнне карты з адначасовай ацэнкай пазіцыі робата. У класічных фармулёўках SLAM разглядаецца як задача імавернаснай ацэнкі, з распаўсюджанымі сямействамі, якія ўключаюць падыходы на аснове EKF і на аснове часціц-фільтраў. [1]
Робат звычайна спалучае ў сабе:
-
Адометрыя колаў (базавае адсочванне)
-
Супастаўленне лідарнага сканавання або візуальных арыентыраў
-
ІМУ (кручэнне/паскарэнне)
-
GPS (на вуліцы, з абмежаваннямі)
Робатаў не заўсёды можна ідэальна лакалізаваць, таму добрыя стэкі паводзяць сябе як дарослыя: адсочваюць нявызначанасць, выяўляюць дрэйф і вяртаюцца да больш бяспечнай паводзін, калі ўпэўненасць падае.
Планаванне і прыняцце рашэнняў: выбар далейшых дзеянняў
Пасля таго, як робат мае працаздольную карціну свету, яму трэба вырашыць, што рабіць. Планаванне часта праяўляецца ў двух аспектах:
-
Лакальнае планаванне (хуткія рэфлексы) ⚡
Пазбягайце перашкод, запавольвайцеся каля людзей, трымайцеся паласы руху/калідораў. -
Глабальнае планаванне (больш шырокая карціна) 🧭
Выбірайце пункты прызначэння, аб'язджайце заблакаваныя зоны, плануйце задачы.
На практыцы менавіта тут робат пераўтварае фразу «Мне здаецца, я бачу вольны шлях» у канкрэтныя каманды руху, якія не зачапяцца за кут паліцы і не занясуць асабістую прастору чалавека.
Кантроль: ператварэнне планаў у плыўны рух
Сістэмы кіравання пераўтвараюць запланаваныя дзеянні ў рэальны рух, адначасова спраўляючыся з рэальнымі непрыемнасцямі, такімі як:
-
Трэнне
-
Змены карыснай нагрузкі
-
Гравітацыя
-
Затрымкі і люфты рухавіка
Да распаўсюджаных інструментаў адносяцца ПІД , кіраванне на аснове мадэлі , прагназуемае кіраванне на аснове мадэлі і адваротная кінематыка для рук, г.зн. матэматыка, якая пераўтварае «пастаўце захоп туды » ў рухі суставаў. [2]
Карысны спосаб разважаць пра гэта:
планаванне выбірае шлях.
Кіраванне прымушае робата сапраўды ісці па ім, не хістаючыся, не пераскокваючы межы маршруту і не вібруючы, як кошык для пакупак з кафеінам.
Навучанне: як робаты ўдасканальваюцца замест таго, каб іх перапраграмоўвалі назаўжды
Робаты могуць удасканальвацца, вучачыся на дадзеных, а не пераналаджваючыся ўручную пасля кожнай змены асяроддзя.
Асноўныя падыходы да навучання ўключаюць:
-
Навучанне пад наглядам 📚: Вучыцеся на пазначаных прыкладах (напрыклад, «гэта паддон»).
-
Саманавучанне 🔍: Вывучайце структуру з неапрацаваных дадзеных (напрыклад, прагназуйце будучыя кадры).
-
Навучанне з падмацаваннем 🎯: Навучайцеся дзеянням, максімізуючы сігналы ўзнагароджання з цягам часу (часта ў залежнасці ад агентаў, асяроддзя і прыбытку). [3]
Дзе RL ззяе: вывучэнне складаных паводзін, дзе ручное праектаванне кантролера з'яўляецца балючым.
Дзе RL становіцца пікантным: эфектыўнасць дадзеных, бяспека падчас даследавання і прабелы паміж сімуляцыяй і рэальным.
Узаемадзеянне чалавека і робата: штучны інтэлект, які дапамагае робатам працаваць з людзьмі
Для робатаў у дамах або на працоўных месцах узаемадзеянне мае значэнне. Штучны інтэлект дазваляе:
-
Распазнаванне маўлення (гук → словы)
-
Выяўленне намеру (словы → сэнс)
-
Разуменне жэстаў (паказанні, мова цела)
Гэта гучыць проста, пакуль не зразумееш: людзі непаслядоўныя, акцэнты розныя, пакоі шумныя, а «там» не з'яўляецца сістэмай каардынат.
Давер, бяспека і «не будзь жудасным»: менш вясёлая, але важная частка
Робаты — гэта сістэмы штучнага інтэлекту з фізічнымі наступствамі , таму пра давер і практыкі бяспекі нельга забываць.
Практычныя бяспечныя рыштаванні часта ўключаюць у сябе:
-
Маніторынг упэўненасці/нявызначанасці
-
Кансерватыўныя паводзіны пры пагаршэнні ўспрымання
-
Дзеянні рэгістрацыі для адладкі і аўдыту
-
Выразныя межы таго, што можа рабіць робат
Карысным спосабам фармулявання гэтага з'яўляецца кіраванне рызыкамі: кіраванне, картаграфаванне рызык, іх вымярэнне і кіраванне імі на працягу ўсяго жыццёвага цыклу — у адпаведнасці з тым, як NIST структуруе кіраванне рызыкамі штучнага інтэлекту ў больш шырокім сэнсе. [4]
Трэнд «вялікіх мадэляў»: робаты, якія выкарыстоўваюць асноўныя мадэлі
Базавыя мадэлі імкнуцца да больш універсальнай паводзін робатаў, асабліва калі мова, зрок і дзеянні мадэлююцца разам.
Адным з прыкладаў напрамкаў з'яўляюцца бачання-мовы-дзеяння (VLA) , дзе сістэма навучаецца звязваць тое, што яна бачыць + тое, што ёй кажуць рабіць + якія дзеянні яна павінна выканаць. RT-2 — шырока цытуемы прыклад такога падыходу. [5]
Захапляльная частка: больш гнуткае, больш высокаўзроўневае разуменне.
Праверка рэальнасці: надзейнасць фізічнага свету ўсё яшчэ патрабуе ахоўных парогаў — класічная ацэнка, абмежаванні бяспекі і кансерватыўны кантроль не знікаюць толькі таму, што робат можа «разумна гаварыць».
Заключныя заўвагі
Дык як робаты выкарыстоўваюць штучны інтэлект? Робаты выкарыстоўваюць штучны інтэлект для ўспрымання , ацэнкі стану (дзе я знаходжуся?) , планавання і кіравання , а часам і для навучання на аснове дадзеных для ўдасканалення. Штучны інтэлект дазваляе робатам спраўляцца са складанымі дынамічнымі асяроддзямі, але поспех залежыць ад надзейных, вымерных сістэм з паводзінамі, арыентаванымі на бяспеку.
Спасылкі
[1] Durrant-Whyte & Bailey -
Адначасовая лакалізацыя і картаграфаванне (SLAM): частка I Асноўныя алгарытмы (PDF) [2] Lynch & Park -
Сучасная робататэхніка: механіка, планаванне і кіраванне (PDF-прэпрынт) [3] Sutton & Barto -
Навучанне з падмацаваннем: уводзіны (2-е выданне, чарнавік PDF) [4] NIST -
Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0) (PDF) [5] Brohan і інш. - RT-2: Мадэлі зроку-мовы-дзеяння пераносяць вэб-веды ў кіраванне робатамі (arXiv)