Як робаты выкарыстоўваюць штучны інтэлект?

Як робаты выкарыстоўваюць штучны інтэлект?

Кароткі адказ: робаты выкарыстоўваюць штучны інтэлект для запуску бесперапыннага цыкла адчуванняў, разумення, планавання, дзеянняў і навучання, каб яны маглі бяспечна рухацца і працаваць у захламленым, зменлівым асяроддзі. Калі датчыкі шумяць або ўпэўненасць у сабе падае, добра распрацаваныя сістэмы запавольваюцца, бяспечна спыняюцца або просяць дапамогі, замест таго, каб здагадвацца.

Асноўныя высновы:

Цыкл аўтаноміі : будуйце сістэмы вакол прынцыпу «адчуць — зразумець — планаваць — дзейнічаць — вучыцца», а не на аснове адной мадэлі.

Трываласць : дызайн, які абараняе ад блікаў, беспарадкаў, слізгацення і непрадказальных рухаў людзей.

Нявызначанасць : праяўляйце ўпэўненасць і выкарыстоўвайце яе для стымулявання больш бяспечных і кансерватыўных паводзін.

Журналы бяспекі : запісвайце дзеянні і кантэкст, каб збоі можна было правяраць і выпраўляць.

Гібрыдны стэк : спалучае машыннае навучанне з фізічнымі абмежаваннямі і класічным кіраваннем для надзейнасці.

Ніжэй прыведзены агляд таго, як штучны інтэлект працуе ўнутры робатаў, каб забяспечыць іх эфектыўнае функцыянаванне.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Калі робаты Ілана Маска пагражаюць працоўным месцам
Што могуць рабіць робаты Tesla і якія ролі могуць змяніцца.

🔗 Што такое штучны інтэлект гуманоіднага робата
Даведайцеся, як гуманоідныя робаты ўспрымаюць, рухаюцца і выконваюць інструкцыі.

🔗 Якія прафесіі заменіць штучны інтэлект
Пасады, найбольш схільныя да аўтаматызацыі, і навыкі, якія застаюцца каштоўнымі.

🔗 Праца ў сферы штучнага інтэлекту і будучыя кар'еры
Сённяшнія кар'ерныя шляхі ў сферы штучнага інтэлекту і як штучны інтэлект змяняе тэндэнцыі занятасці.


Як робаты выкарыстоўваюць штучны інтэлект? Хуткая ментальная мадэль

Большасць робатаў з падтрымкай штучнага інтэлекту прытрымліваюцца наступнага цыкла:

  • Пачуццё 👀: камеры, мікрафоны, лідар, датчыкі сілы, датчыкі колаў і г.д.

  • Разуменне 🧠: Выяўленне аб'ектаў, ацэнка месцазнаходжання, распазнаванне сітуацый, прагназаванне руху.

  • Плануйце 🗺️: Выбірайце мэты, пралічвайце бяспечныя шляхі, плануйце задачы.

  • Дзеянне 🦾: Генерацыя рухальных каманд, захоп, пераварот, балансаванне, пазбяганне перашкод.

  • Вучыцеся 🔁: Паляпшайце ўспрыманне або паводзіны з дапамогай дадзеных (часам анлайн, часцей афлайн).

Шмат якія рабатызаваныя «штучныя інтэлекты» насамрэч уяўляюць сабой набор разам працуючых элементаў — успрымання , ацэнкі стану , планавання і кіравання , — якія разам забяспечваюць аўтаномію.

Адна практычная «палявая» рэальнасць: складаная частка звычайна не ў тым, каб прымусіць робата зрабіць нешта адзін раз у чыстай дэманстрацыі, а ў тым, каб ён надзейна , калі асвятленне змяняецца, колы слізгаюць, падлога блішчыць, паліцы рухаюцца, а людзі ходзяць, як непрадказальныя NPC.

Робат са штучным інтэлектам

Што робіць мозг робата добрым для штучнага інтэлекту

Надзейная сістэма штучнага інтэлекту робата павінна быць не проста разумнай — яна павінна быць надзейнай у непрадказальных рэальных умовах.

Важныя характарыстыкі ўключаюць:

  • Прадукцыйнасць у рэжыме рэальнага часу ⏱️ (своечасовасць мае значэнне для прыняцця рашэнняў)

  • Устойлівасць да неакуратных дадзеных (блікі, шум, беспарадак, размытасць руху)

  • Вытанчаныя рэжымы адмовы 🧯 (знізь хуткасць, спыніся бяспечна, папрасі дапамогі)

  • Добрыя папярэднія даследаванні + добрае навучанне (фізіка + абмежаванні + машыннае навучанне — не проста «вібрацыі»)

  • Вымерная якасць успрымання 📏 (веданне таго, калі датчыкі/мадэлі пагаршаюць сваю працу)

Найлепшыя робаты часта не тыя, хто можа адзін раз зрабіць яркі трук, а тыя, хто можа добра выконваць сумную працу дзень за днём.


Параўнальная табліца распаўсюджаных будаўнічых блокаў штучнага інтэлекту для робатаў

Прадмет/інструмент штучнага інтэлекту Для каго гэта Прыблізная цана Чаму гэта працуе
Камп'ютарны зрок (выяўленне аб'ектаў, сегментацыя) 👁️ Мабільныя робаты, рукі, беспілотнікі Сярэдні Пераўтварае візуальны ўваход у карысныя дадзеныя, такія як ідэнтыфікацыя аб'екта
SLAM (мапіраванне + лакалізацыя) 🗺️ Робаты, якія перамяшчаюцца Сярэдне-высокі Адсочвае месцазнаходжанне робата, стварае карту, што вельмі важна для навігацыі [1]
Планаванне шляху + пазбяганне перашкод 🚧 Боты дастаўкі, складскія AMR Сярэдні Разлічвае бяспечныя маршруты і адаптуецца да перашкод у рэжыме рэальнага часу
Класічнае кіраванне (ПІД, кіраванне на аснове мадэлі) 🎛️ Усё, што з рухавікамі Нізкі Забяспечвае стабільны і прадказальны рух
Навучанне з падмацаваннем (НП) 🎮 Складаныя навыкі, маніпуляцыі, перамяшчэнне Высокі Навучаецца праз палітыку спроб і памылак, заснаванай на ўзнагароджанні [3]
Маўленне + мова (ASR, намер, LLM) 🗣️ Памочнікі, сэрвісныя робаты Сярэдне-высокі Дазваляе ўзаемадзейнічаць з людзьмі праз натуральную мову
Выяўленне анамалій + маніторынг 🚨 Заводы, ахова здароўя, крытычна важныя для бяспекі Сярэдні Выяўляе незвычайныя заканамернасці, перш чым яны стануць дарагімі або небяспечнымі
Зліццё датчыкаў (фільтры Калмана, навучанае зліццё) 🧩 Навігацыя, дроны, стэкі аўтаноміі Сярэдні Аб'ядноўвае крыніцы дадзеных з шумам для больш дакладных ацэнак [1]

Успрыманне: як робаты ператвараюць неапрацаваныя дадзеныя датчыкаў у сэнс

Успрыманне — гэта калі робаты ператвараюць патокі датчыкаў у нешта, што яны могуць рэальна выкарыстоўваць:

  • Камеры → распазнаванне аб'ектаў, ацэнка позы, разуменне сцэны

  • Лідар → адлегласць + геаметрыя перашкоды

  • Глыбінявыя камеры → 3D-структура і вольная прастора

  • Мікрафоны → маўленчыя і гукавыя сігналы

  • Датчыкі сілы/крутоўнага моманту → больш бяспечны захоп і сумесная праца

  • Тактыльныя датчыкі → выяўленне слізгацення, кантактныя падзеі

Робаты спадзяюцца на штучны інтэлект, каб адказаць на такія пытанні, як:

  • «Якія прадметы перада мной?»

  • «Гэта чалавек ці манекен?»

  • «Дзе ручка?»

  • «Штосьці рухаецца ў мой бок?»

Тонкая, але важная дэталь: сістэмы ўспрымання ў ідэале павінны выдаваць нявызначанасць (ці паказчык упэўненасці), а не проста адказ «так/не», бо ад таго, наколькі ўпэўнены робат, залежыць далейшае планаванне і рашэнні па бяспецы.


Лакалізацыя і картаграфаванне: ведайце, дзе вы знаходзіцеся, без панікі

Каб робат правільна функцыянаваў, яму трэба ведаць, дзе ён знаходзіцца. Часта гэта вырашаецца з дапамогай SLAM (адначасовая лакалізацыя і картаграфаванне) : стварэнне карты з адначасовай ацэнкай пазіцыі робата. У класічных фармулёўках SLAM разглядаецца як задача імавернаснай ацэнкі, з распаўсюджанымі сямействамі, якія ўключаюць падыходы на аснове EKF і на аснове часціц-фільтраў. [1]

Робат звычайна спалучае ў сабе:

  • Адометрыя колаў (базавае адсочванне)

  • Супастаўленне лідарнага сканавання або візуальных арыентыраў

  • ІМУ (кручэнне/паскарэнне)

  • GPS (на вуліцы, з абмежаваннямі)

Робатаў не заўсёды можна ідэальна лакалізаваць, таму добрыя стэкі паводзяць сябе як дарослыя: адсочваюць нявызначанасць, выяўляюць дрэйф і вяртаюцца да больш бяспечнай паводзін, калі ўпэўненасць падае.


Планаванне і прыняцце рашэнняў: выбар далейшых дзеянняў

Пасля таго, як робат мае працаздольную карціну свету, яму трэба вырашыць, што рабіць. Планаванне часта праяўляецца ў двух аспектах:

  • Лакальнае планаванне (хуткія рэфлексы)
    Пазбягайце перашкод, запавольвайцеся каля людзей, трымайцеся паласы руху/калідораў.

  • Глабальнае планаванне (больш шырокая карціна) 🧭
    Выбірайце пункты прызначэння, аб'язджайце заблакаваныя зоны, плануйце задачы.

На практыцы менавіта тут робат пераўтварае фразу «Мне здаецца, я бачу вольны шлях» у канкрэтныя каманды руху, якія не зачапяцца за кут паліцы і не занясуць асабістую прастору чалавека.


Кантроль: ператварэнне планаў у плыўны рух

Сістэмы кіравання пераўтвараюць запланаваныя дзеянні ў рэальны рух, адначасова спраўляючыся з рэальнымі непрыемнасцямі, такімі як:

  • Трэнне

  • Змены карыснай нагрузкі

  • Гравітацыя

  • Затрымкі і люфты рухавіка

Да распаўсюджаных інструментаў адносяцца ПІД , кіраванне на аснове мадэлі , прагназуемае кіраванне на аснове мадэлі і адваротная кінематыка для рук, г.зн. матэматыка, якая пераўтварае «пастаўце захоп туды » ў рухі суставаў. [2]

Карысны спосаб разважаць пра гэта:
планаванне выбірае шлях.
Кіраванне прымушае робата сапраўды ісці па ім, не хістаючыся, не пераскокваючы межы маршруту і не вібруючы, як кошык для пакупак з кафеінам.


Навучанне: як робаты ўдасканальваюцца замест таго, каб іх перапраграмоўвалі назаўжды

Робаты могуць удасканальвацца, вучачыся на дадзеных, а не пераналаджваючыся ўручную пасля кожнай змены асяроддзя.

Асноўныя падыходы да навучання ўключаюць:

  • Навучанне пад наглядам 📚: Вучыцеся на пазначаных прыкладах (напрыклад, «гэта паддон»).

  • Саманавучанне 🔍: Вывучайце структуру з неапрацаваных дадзеных (напрыклад, прагназуйце будучыя кадры).

  • Навучанне з падмацаваннем 🎯: Навучайцеся дзеянням, максімізуючы сігналы ўзнагароджання з цягам часу (часта ў залежнасці ад агентаў, асяроддзя і прыбытку). [3]

Дзе RL ззяе: вывучэнне складаных паводзін, дзе ручное праектаванне кантролера з'яўляецца балючым.
Дзе RL становіцца пікантным: эфектыўнасць дадзеных, бяспека падчас даследавання і прабелы паміж сімуляцыяй і рэальным.


Узаемадзеянне чалавека і робата: штучны інтэлект, які дапамагае робатам працаваць з людзьмі

Для робатаў у дамах або на працоўных месцах узаемадзеянне мае значэнне. Штучны інтэлект дазваляе:

  • Распазнаванне маўлення (гук → словы)

  • Выяўленне намеру (словы → сэнс)

  • Разуменне жэстаў (паказанні, мова цела)

Гэта гучыць проста, пакуль не зразумееш: людзі непаслядоўныя, акцэнты розныя, пакоі шумныя, а «там» не з'яўляецца сістэмай каардынат.


Давер, бяспека і «не будзь жудасным»: менш вясёлая, але важная частка

Робаты — гэта сістэмы штучнага інтэлекту з фізічнымі наступствамі , таму пра давер і практыкі бяспекі нельга забываць.

Практычныя бяспечныя рыштаванні часта ўключаюць у сябе:

  • Маніторынг упэўненасці/нявызначанасці

  • Кансерватыўныя паводзіны пры пагаршэнні ўспрымання

  • Дзеянні рэгістрацыі для адладкі і аўдыту

  • Выразныя межы таго, што можа рабіць робат

Карысным спосабам фармулявання гэтага з'яўляецца кіраванне рызыкамі: кіраванне, картаграфаванне рызык, іх вымярэнне і кіраванне імі на працягу ўсяго жыццёвага цыклу — у адпаведнасці з тым, як NIST структуруе кіраванне рызыкамі штучнага інтэлекту ў больш шырокім сэнсе. [4]


Трэнд «вялікіх мадэляў»: робаты, якія выкарыстоўваюць асноўныя мадэлі

Базавыя мадэлі імкнуцца да больш універсальнай паводзін робатаў, асабліва калі мова, зрок і дзеянні мадэлююцца разам.

Адным з прыкладаў напрамкаў з'яўляюцца бачання-мовы-дзеяння (VLA) , дзе сістэма навучаецца звязваць тое, што яна бачыць + тое, што ёй кажуць рабіць + якія дзеянні яна павінна выканаць. RT-2 — шырока цытуемы прыклад такога падыходу. [5]

Захапляльная частка: больш гнуткае, больш высокаўзроўневае разуменне.
Праверка рэальнасці: надзейнасць фізічнага свету ўсё яшчэ патрабуе ахоўных парогаў — класічная ацэнка, абмежаванні бяспекі і кансерватыўны кантроль не знікаюць толькі таму, што робат можа «разумна гаварыць».


Заключныя заўвагі

Дык як робаты выкарыстоўваюць штучны інтэлект? Робаты выкарыстоўваюць штучны інтэлект для ўспрымання , ацэнкі стану (дзе я знаходжуся?) , планавання і кіравання , а часам і для навучання на аснове дадзеных для ўдасканалення. Штучны інтэлект дазваляе робатам спраўляцца са складанымі дынамічнымі асяроддзямі, але поспех залежыць ад надзейных, вымерных сістэм з паводзінамі, арыентаванымі на бяспеку.


Часта задаваныя пытанні

Як робаты выкарыстоўваюць штучны інтэлект для аўтаномнай працы?

Робаты выкарыстоўваюць штучны інтэлект для запуску бесперапыннага цыкла аўтаноміі: адчуваюць свет, інтэрпрэтуюць тое, што адбываецца, плануюць бяспечны наступны крок, дзейнічаюць з дапамогай рухавікоў і вучацца на аснове дадзеных. На практыцы гэта набор кампанентаў, якія працуюць узгоднена, а не адна «чароўная» мадэль. Мэта — надзейная паводзіны ў зменлівых умовах, а не аднаразовая дэманстрацыя ў ідэальных умовах.

Ці з'яўляецца штучны інтэлект робата проста адной з мадэляў ці поўным аўтаномным стэкам?

У большасці сістэм штучны інтэлект робатаў — гэта поўны стэк: успрыманне, ацэнка стану, планаванне і кіраванне. Машыннае навучанне дапамагае з такімі задачамі, як зрок і прагназаванне, у той час як фізічныя абмежаванні і класічнае кіраванне падтрымліваюць стабільнасць і прадказальнасць руху. У многіх рэальных умовах выкарыстоўваецца гібрыдны падыход, таму што надзейнасць важнейшая за кемлівасць. Вось чаму навучанне «толькі на вібрацыях» рэдка выжывае па-за кантраляванымі ўмовамі.

На якія датчыкі і мадэлі ўспрымання абапіраюцца робаты са штучным інтэлектам?

Робаты са штучным інтэлектам часта спалучаюць камеры, лідарныя прылады (LIDAR), датчыкі глыбіні, мікрафоны, інерцыяльныя блокі (IMU), энкодэры і датчыкі сілы/крутоўнага моманту або тактыльныя датчыкі. Мадэлі ўспрымання ператвараюць гэтыя патокі ў карысныя сігналы, такія як ідэнтыфікацыя аб'екта, поза, вольная прастора і сігналы руху. Практычнай найлепшай практыкай з'яўляецца вывад упэўненасці або нявызначанасці, а не толькі пазнакі. Гэтая нявызначанасць можа дапамагчы больш бяспечна планаваць, калі датчыкі пагаршаюць сваю працу з-за блікаў, размыцця або беспарадку.

Што такое SLAM у робататэхніцы і чаму гэта важна?

SLAM (адначасовая лакалізацыя і картаграфаванне) дапамагае робату ствараць карту, адначасова ацэньваючы сваё ўласнае месцазнаходжанне. Гэта цэнтральная тэхналогія для робатаў, якія перамяшчаюцца і павінны арыентавацца без «панікі» пры змене ўмоў. Тыповыя ўваходныя дадзеныя ўключаюць адаметрыю колаў, інерцыяльныя модулі і лідарныя або візуальныя арыенціры, часам GPS на вуліцы. Добрыя стэкі адсочваюць дрэйф і нявызначанасць, таму робат можа паводзіць сябе больш кансерватыўна, калі лакалізацыя становіцца хісткай.

Чым адрозніваецца планаванне робатаў і кіраванне робатамі?

Планаванне вызначае, што робат павінен рабіць далей, напрыклад, выбраць пункт прызначэння, аб'ехаць перашкоды або пазбягаць людзей. Кіраванне ператварае гэты план у плаўны, стабільны рух, нягледзячы на ​​трэнне, змены карыснай нагрузкі і затрымкі рухавіка. Планаванне часта падзяляецца на глабальнае планаванне (маршруты ў маштабе) і лакальнае планаванне (хуткія рэфлексы паблізу перашкод). У кіраванні звычайна выкарыстоўваюцца такія інструменты, як ПІД, кіраванне на аснове мадэлі або прагназаванае кіраванне мадэллю, каб надзейна прытрымлівацца плана.

Як робаты бяспечна спраўляюцца з нявызначанасцю або нізкай упэўненасцю?

Добра распрацаваныя робаты ўспрымаюць нявызначанасць як уплыў на паводзіны, а не як нешта, што можна ігнараваць. Калі ўпэўненасць ва ўспрыманні або лакалізацыі зніжаецца, распаўсюджаным падыходам з'яўляецца запаволенне, павелічэнне запасаў бяспекі, бяспечны прыпынак або просьба аб дапамозе чалавека замест таго, каб здагадвацца. Сістэмы таксама рэгіструюць дзеянні і кантэкст, таму інцыдэнты можна праверыць і лягчэй выправіць. Гэты падыход да «вытанчанай памылкі» з'яўляецца асноўным адрозненнем паміж дэманстрацыйнымі і разгортванымі робатамі.

Калі навучанне з падмацаваннем карыснае для робатаў, і што яго ўскладняе?

Навучанне з падмацаваннем часта выкарыстоўваецца для складаных навыкаў, такіх як маніпуляцыя або перамяшчэнне, дзе ручное праектаванне кантролера з'яўляецца балючым. Яно можа выявіць эфектыўныя паводзіны шляхам спроб і памылак, заснаваных на ўзнагароджанні, часта ў мадэляванні. Разгортванне становіцца складаным, таму што даследаванне можа быць небяспечным, дадзеныя могуць быць дарагімі, а прабелы паміж мадэляваннем і рэальным жыццём могуць парушаць палітыку. Многія канвееры выкарыстоўваюць навучанне з падмацаваннем выбарачна, разам з абмежаваннямі і класічным кіраваннем для бяспекі і стабільнасці.

Ці змяняюць асноўныя мадэлі тое, як робаты выкарыстоўваюць штучны інтэлект?

Падыходы, заснаваныя на базавых мадэлях, падштурхоўваюць робатаў да больш агульнай паводзін, заснаваных на выкананні інструкцый, асабліва ў мадэлях зрок-мова-дзеянне (VLA), такіх як сістэмы тыпу RT-2. Перавагай з'яўляецца гнуткасць: звязванне таго, што бачыць робат, з тым, што яму кажуць рабіць і як ён павінен дзейнічаць. Рэальнасць такая, што класічная ацэнка, абмежаванні бяспекі і кансерватыўны кантроль усё яшчэ маюць значэнне для фізічнай надзейнасці. Многія каманды разглядаюць гэта як кіраванне рызыкамі жыццёвага цыклу, падобнае па духу да такіх структур, як AI RMF NIST.

Спасылкі

[1] Durrant-Whyte & Bailey -
Адначасовая лакалізацыя і картаграфаванне (SLAM): частка I Асноўныя алгарытмы (PDF) [2] Lynch & Park -
Сучасная робататэхніка: механіка, планаванне і кіраванне (PDF-прэпрынт) [3] Sutton & Barto -
Навучанне з падмацаваннем: уводзіны (2-е выданне, чарнавік PDF) [4] NIST -
Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0) (PDF) [5] Brohan і інш. - RT-2: Мадэлі зроку-мовы-дзеяння пераносяць вэб-веды ў кіраванне робатамі (arXiv)

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога