Як робаты выкарыстоўваюць штучны інтэлект?

Робаты выкарыстоўваюць штучны інтэлект падобна да таго, як людзі выкарыстоўваюць свой мозг, каб перамяшчацца па пакоі, не ўпіраючыся тварам у крэсла. Яны абапіраюцца на датчыкі, праграмнае забеспячэнне і алгарытмы, каб высветліць, што адбываецца, вырашыць, што важна, і прыняць меры — часта ў абмежаваных па часе умовах і з блытанымі рэальнымі дадзенымі.

Ніжэй прыведзены агляд таго, як штучны інтэлект працуе ўнутры робатаў, каб забяспечыць іх эфектыўнае функцыянаванне.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Калі робаты Ілана Маска пагражаюць працоўным месцам
Што могуць рабіць робаты Tesla і якія ролі могуць змяніцца.

🔗 Што такое штучны інтэлект гуманоіднага робата
Даведайцеся, як гуманоідныя робаты ўспрымаюць, рухаюцца і выконваюць інструкцыі.

🔗 Якія прафесіі заменіць штучны інтэлект
Пасады, найбольш схільныя да аўтаматызацыі, і навыкі, якія застаюцца каштоўнымі.

🔗 Праца ў сферы штучнага інтэлекту і будучыя кар'еры
Сённяшнія кар'ерныя шляхі ў сферы штучнага інтэлекту і як штучны інтэлект змяняе тэндэнцыі занятасці.

Як робаты выкарыстоўваюць штучны інтэлект? Хуткая ментальная мадэль

Большасць робатаў з падтрымкай штучнага інтэлекту прытрымліваюцца наступнага цыкла:

Пачуццё 👀: камеры, мікрафоны, лідар, датчыкі сілы, датчыкі колаў і г.д.
Разуменне 🧠: Выяўленне аб'ектаў, ацэнка месцазнаходжання, распазнаванне сітуацый, прагназаванне руху.
Плануйце 🗺️: Выбірайце мэты, пралічвайце бяспечныя шляхі, плануйце задачы.
Дзеянне 🦾: Генерацыя рухальных каманд, захоп, пераварот, балансаванне, пазбяганне перашкод.
Вучыцеся 🔁: Паляпшайце ўспрыманне або паводзіны з дапамогай дадзеных (часам анлайн, часцей афлайн).

Шмат якія рабатызаваныя «штучныя інтэлекты» насамрэч уяўляюць сабой набор разам працуючых элементаў — успрымання , ацэнкі стану , планавання і кіравання , — якія разам забяспечваюць аўтаномію.

Адна практычная «палявая» рэальнасць: складаная частка звычайна не ў тым, каб прымусіць робата зрабіць нешта адзін раз у чыстай дэманстрацыі, а ў тым, каб ён надзейна , калі асвятленне змяняецца, колы слізгаюць, падлога блішчыць, паліцы рухаюцца, а людзі ходзяць, як непрадказальныя NPC.

Што робіць мозг робата добрым для штучнага інтэлекту

Надзейная сістэма штучнага інтэлекту робата павінна быць не проста разумнай — яна павінна быць надзейнай у непрадказальных рэальных умовах.

Важныя характарыстыкі ўключаюць:

Прадукцыйнасць у рэжыме рэальнага часу ⏱️ (своечасовасць мае значэнне для прыняцця рашэнняў)
Устойлівасць да неакуратных дадзеных (блікі, шум, беспарадак, размытасць руху)
Вытанчаныя рэжымы адмовы 🧯 (знізь хуткасць, спыніся бяспечна, папрасі дапамогі)
Добрыя папярэднія даследаванні + добрае навучанне (фізіка + абмежаванні + машыннае навучанне — не проста «вібрацыі»)
Вымерная якасць успрымання 📏 (веданне таго, калі датчыкі/мадэлі пагаршаюць сваю працу)

Найлепшыя робаты часта не тыя, хто можа адзін раз зрабіць яркі трук, а тыя, хто можа добра выконваць сумную працу дзень за днём.

Параўнальная табліца распаўсюджаных будаўнічых блокаў штучнага інтэлекту для робатаў

Прадмет/інструмент штучнага інтэлекту	Для каго гэта	Прыблізная цана	Чаму гэта працуе
Камп'ютарны зрок (выяўленне аб'ектаў, сегментацыя) 👁️	Мабільныя робаты, рукі, беспілотнікі	Сярэдні	Пераўтварае візуальны ўваход у карысныя дадзеныя, такія як ідэнтыфікацыя аб'екта
SLAM (мапіраванне + лакалізацыя) 🗺️	Робаты, якія перамяшчаюцца	Сярэдне-высокі	Адсочвае месцазнаходжанне робата, стварае карту, што вельмі важна для навігацыі [1]
Планаванне шляху + пазбяганне перашкод 🚧	Боты дастаўкі, складскія AMR	Сярэдні	Разлічвае бяспечныя маршруты і адаптуецца да перашкод у рэжыме рэальнага часу
Класічнае кіраванне (ПІД, кіраванне на аснове мадэлі) 🎛️	Усё, што з рухавікамі	Нізкі	Забяспечвае стабільны і прадказальны рух
Навучанне з падмацаваннем (НП) 🎮	Складаныя навыкі, маніпуляцыі, перамяшчэнне	Высокі	Навучаецца праз палітыку спроб і памылак, заснаванай на ўзнагароджанні [3]
Маўленне + мова (ASR, намер, LLM) 🗣️	Памочнікі, сэрвісныя робаты	Сярэдне-высокі	Дазваляе ўзаемадзейнічаць з людзьмі праз натуральную мову
Выяўленне анамалій + маніторынг 🚨	Заводы, ахова здароўя, крытычна важныя для бяспекі	Сярэдні	Выяўляе незвычайныя заканамернасці, перш чым яны стануць дарагімі або небяспечнымі
Зліццё датчыкаў (фільтры Калмана, навучанае зліццё) 🧩	Навігацыя, дроны, стэкі аўтаноміі	Сярэдні	Аб'ядноўвае крыніцы дадзеных з шумам для больш дакладных ацэнак [1]

Успрыманне: як робаты ператвараюць неапрацаваныя дадзеныя датчыкаў у сэнс

Успрыманне — гэта калі робаты ператвараюць патокі датчыкаў у нешта, што яны могуць рэальна выкарыстоўваць:

Камеры → распазнаванне аб'ектаў, ацэнка позы, разуменне сцэны
Лідар → адлегласць + геаметрыя перашкоды
Глыбінявыя камеры → 3D-структура і вольная прастора
Мікрафоны → маўленчыя і гукавыя сігналы
Датчыкі сілы/крутоўнага моманту → больш бяспечны захоп і сумесная праца
Тактыльныя датчыкі → выяўленне слізгацення, кантактныя падзеі

Робаты спадзяюцца на штучны інтэлект, каб адказаць на такія пытанні, як:

«Якія прадметы перада мной?»
«Гэта чалавек ці манекен?»
«Дзе ручка?»
«Штосьці рухаецца ў мой бок?»

Тонкая, але важная дэталь: сістэмы ўспрымання ў ідэале павінны выдаваць нявызначанасць (ці паказчык упэўненасці), а не проста адказ «так/не», бо ад таго, наколькі ўпэўнены робат, залежыць далейшае планаванне і рашэнні па бяспецы.

Лакалізацыя і картаграфаванне: ведайце, дзе вы знаходзіцеся, без панікі

Каб робат правільна функцыянаваў, яму трэба ведаць, дзе ён знаходзіцца. Часта гэта вырашаецца з дапамогай SLAM (адначасовая лакалізацыя і картаграфаванне) : стварэнне карты з адначасовай ацэнкай пазіцыі робата. У класічных фармулёўках SLAM разглядаецца як задача імавернаснай ацэнкі, з распаўсюджанымі сямействамі, якія ўключаюць падыходы на аснове EKF і на аснове часціц-фільтраў. [1]

Робат звычайна спалучае ў сабе:

Адометрыя колаў (базавае адсочванне)
Супастаўленне лідарнага сканавання або візуальных арыентыраў
ІМУ (кручэнне/паскарэнне)
GPS (на вуліцы, з абмежаваннямі)

Робатаў не заўсёды можна ідэальна лакалізаваць, таму добрыя стэкі паводзяць сябе як дарослыя: адсочваюць нявызначанасць, выяўляюць дрэйф і вяртаюцца да больш бяспечнай паводзін, калі ўпэўненасць падае.

Планаванне і прыняцце рашэнняў: выбар далейшых дзеянняў

Пасля таго, як робат мае працаздольную карціну свету, яму трэба вырашыць, што рабіць. Планаванне часта праяўляецца ў двух аспектах:

Лакальнае планаванне (хуткія рэфлексы) ⚡
Пазбягайце перашкод, запавольвайцеся каля людзей, трымайцеся паласы руху/калідораў.
Глабальнае планаванне (больш шырокая карціна) 🧭
Выбірайце пункты прызначэння, аб'язджайце заблакаваныя зоны, плануйце задачы.

На практыцы менавіта тут робат пераўтварае фразу «Мне здаецца, я бачу вольны шлях» у канкрэтныя каманды руху, якія не зачапяцца за кут паліцы і не занясуць асабістую прастору чалавека.

Кантроль: ператварэнне планаў у плыўны рух

Сістэмы кіравання пераўтвараюць запланаваныя дзеянні ў рэальны рух, адначасова спраўляючыся з рэальнымі непрыемнасцямі, такімі як:

Трэнне
Змены карыснай нагрузкі
Гравітацыя
Затрымкі і люфты рухавіка

Да распаўсюджаных інструментаў адносяцца ПІД , кіраванне на аснове мадэлі , прагназуемае кіраванне на аснове мадэлі і адваротная кінематыка для рук, г.зн. матэматыка, якая пераўтварае «пастаўце захоп туды » ў рухі суставаў. [2]

Карысны спосаб разважаць пра гэта:
планаванне выбірае шлях.
Кіраванне прымушае робата сапраўды ісці па ім, не хістаючыся, не пераскокваючы межы маршруту і не вібруючы, як кошык для пакупак з кафеінам.

Навучанне: як робаты ўдасканальваюцца замест таго, каб іх перапраграмоўвалі назаўжды

Робаты могуць удасканальвацца, вучачыся на дадзеных, а не пераналаджваючыся ўручную пасля кожнай змены асяроддзя.

Асноўныя падыходы да навучання ўключаюць:

Навучанне пад наглядам 📚: Вучыцеся на пазначаных прыкладах (напрыклад, «гэта паддон»).
Саманавучанне 🔍: Вывучайце структуру з неапрацаваных дадзеных (напрыклад, прагназуйце будучыя кадры).
Навучанне з падмацаваннем 🎯: Навучайцеся дзеянням, максімізуючы сігналы ўзнагароджання з цягам часу (часта ў залежнасці ад агентаў, асяроддзя і прыбытку). [3]

Дзе RL ззяе: вывучэнне складаных паводзін, дзе ручное праектаванне кантролера з'яўляецца балючым.
Дзе RL становіцца пікантным: эфектыўнасць дадзеных, бяспека падчас даследавання і прабелы паміж сімуляцыяй і рэальным.

Узаемадзеянне чалавека і робата: штучны інтэлект, які дапамагае робатам працаваць з людзьмі

Для робатаў у дамах або на працоўных месцах узаемадзеянне мае значэнне. Штучны інтэлект дазваляе:

Распазнаванне маўлення (гук → словы)
Выяўленне намеру (словы → сэнс)
Разуменне жэстаў (паказанні, мова цела)

Гэта гучыць проста, пакуль не зразумееш: людзі непаслядоўныя, акцэнты розныя, пакоі шумныя, а «там» не з'яўляецца сістэмай каардынат.

Давер, бяспека і «не будзь жудасным»: менш вясёлая, але важная частка

Робаты — гэта сістэмы штучнага інтэлекту з фізічнымі наступствамі , таму пра давер і практыкі бяспекі нельга забываць.

Практычныя бяспечныя рыштаванні часта ўключаюць у сябе:

Маніторынг упэўненасці/нявызначанасці
Кансерватыўныя паводзіны пры пагаршэнні ўспрымання
Дзеянні рэгістрацыі для адладкі і аўдыту
Выразныя межы таго, што можа рабіць робат

Карысным спосабам фармулявання гэтага з'яўляецца кіраванне рызыкамі: кіраванне, картаграфаванне рызык, іх вымярэнне і кіраванне імі на працягу ўсяго жыццёвага цыклу — у адпаведнасці з тым, як NIST структуруе кіраванне рызыкамі штучнага інтэлекту ў больш шырокім сэнсе. [4]

Трэнд «вялікіх мадэляў»: робаты, якія выкарыстоўваюць асноўныя мадэлі

Базавыя мадэлі імкнуцца да больш універсальнай паводзін робатаў, асабліва калі мова, зрок і дзеянні мадэлююцца разам.

Адным з прыкладаў напрамкаў з'яўляюцца бачання-мовы-дзеяння (VLA) , дзе сістэма навучаецца звязваць тое, што яна бачыць + тое, што ёй кажуць рабіць + якія дзеянні яна павінна выканаць. RT-2 — шырока цытуемы прыклад такога падыходу. [5]

Захапляльная частка: больш гнуткае, больш высокаўзроўневае разуменне.
Праверка рэальнасці: надзейнасць фізічнага свету ўсё яшчэ патрабуе ахоўных парогаў — класічная ацэнка, абмежаванні бяспекі і кансерватыўны кантроль не знікаюць толькі таму, што робат можа «разумна гаварыць».

Заключныя заўвагі

Дык як робаты выкарыстоўваюць штучны інтэлект? Робаты выкарыстоўваюць штучны інтэлект для ўспрымання , ацэнкі стану (дзе я знаходжуся?) , планавання і кіравання , а часам і для навучання на аснове дадзеных для ўдасканалення. Штучны інтэлект дазваляе робатам спраўляцца са складанымі дынамічнымі асяроддзямі, але поспех залежыць ад надзейных, вымерных сістэм з паводзінамі, арыентаванымі на бяспеку.

Спасылкі

[1] Durrant-Whyte & Bailey -
Адначасовая лакалізацыя і картаграфаванне (SLAM): частка I Асноўныя алгарытмы (PDF) [2] Lynch & Park -
Сучасная робататэхніка: механіка, планаванне і кіраванне (PDF-прэпрынт) [3] Sutton & Barto -
Навучанне з падмацаваннем: уводзіны (2-е выданне, чарнавік PDF) [4] NIST -
Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0) (PDF) [5] Brohan і інш. - RT-2: Мадэлі зроку-мовы-дзеяння пераносяць вэб-веды ў кіраванне робатамі (arXiv)

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога

Краіна/рэгіён