Як робаты выкарыстоўваюць штучны інтэлект?

Як робаты выкарыстоўваюць штучны інтэлект?

Робаты выкарыстоўваюць штучны інтэлект падобна да таго, як людзі выкарыстоўваюць свой мозг, каб перамяшчацца па пакоі, не ўпіраючыся тварам у крэсла. Яны абапіраюцца на датчыкі, праграмнае забеспячэнне і алгарытмы, каб высветліць, што адбываецца, вырашыць, што важна, і прыняць меры — часта ў абмежаваных па часе умовах і з блытанымі рэальнымі дадзенымі.

Ніжэй прыведзены агляд таго, як штучны інтэлект працуе ўнутры робатаў, каб забяспечыць іх эфектыўнае функцыянаванне.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Калі робаты Ілана Маска пагражаюць працоўным месцам
Што могуць рабіць робаты Tesla і якія ролі могуць змяніцца.

🔗 Што такое штучны інтэлект гуманоіднага робата
Даведайцеся, як гуманоідныя робаты ўспрымаюць, рухаюцца і выконваюць інструкцыі.

🔗 Якія прафесіі заменіць штучны інтэлект
Пасады, найбольш схільныя да аўтаматызацыі, і навыкі, якія застаюцца каштоўнымі.

🔗 Праца ў сферы штучнага інтэлекту і будучыя кар'еры
Сённяшнія кар'ерныя шляхі ў сферы штучнага інтэлекту і як штучны інтэлект змяняе тэндэнцыі занятасці.


Як робаты выкарыстоўваюць штучны інтэлект? Хуткая ментальная мадэль

Большасць робатаў з падтрымкай штучнага інтэлекту прытрымліваюцца наступнага цыкла:

  • Пачуццё 👀: камеры, мікрафоны, лідар, датчыкі сілы, датчыкі колаў і г.д.

  • Разуменне 🧠: Выяўленне аб'ектаў, ацэнка месцазнаходжання, распазнаванне сітуацый, прагназаванне руху.

  • Плануйце 🗺️: Выбірайце мэты, пралічвайце бяспечныя шляхі, плануйце задачы.

  • Дзеянне 🦾: Генерацыя рухальных каманд, захоп, пераварот, балансаванне, пазбяганне перашкод.

  • Вучыцеся 🔁: Паляпшайце ўспрыманне або паводзіны з дапамогай дадзеных (часам анлайн, часцей афлайн).

Шмат якія рабатызаваныя «штучныя інтэлекты» насамрэч уяўляюць сабой набор разам працуючых элементаў — успрымання , ацэнкі стану , планавання і кіравання , — якія разам забяспечваюць аўтаномію.

Адна практычная «палявая» рэальнасць: складаная частка звычайна не ў тым, каб прымусіць робата зрабіць нешта адзін раз у чыстай дэманстрацыі, а ў тым, каб ён надзейна , калі асвятленне змяняецца, колы слізгаюць, падлога блішчыць, паліцы рухаюцца, а людзі ходзяць, як непрадказальныя NPC.

 

Робат са штучным інтэлектам

Што робіць мозг робата добрым для штучнага інтэлекту

Надзейная сістэма штучнага інтэлекту робата павінна быць не проста разумнай — яна павінна быць надзейнай у непрадказальных рэальных умовах.

Важныя характарыстыкі ўключаюць:

  • Прадукцыйнасць у рэжыме рэальнага часу ⏱️ (своечасовасць мае значэнне для прыняцця рашэнняў)

  • Устойлівасць да неакуратных дадзеных (блікі, шум, беспарадак, размытасць руху)

  • Вытанчаныя рэжымы адмовы 🧯 (знізь хуткасць, спыніся бяспечна, папрасі дапамогі)

  • Добрыя папярэднія даследаванні + добрае навучанне (фізіка + абмежаванні + машыннае навучанне — не проста «вібрацыі»)

  • Вымерная якасць успрымання 📏 (веданне таго, калі датчыкі/мадэлі пагаршаюць сваю працу)

Найлепшыя робаты часта не тыя, хто можа адзін раз зрабіць яркі трук, а тыя, хто можа добра выконваць сумную працу дзень за днём.


Параўнальная табліца распаўсюджаных будаўнічых блокаў штучнага інтэлекту для робатаў

Прадмет/інструмент штучнага інтэлекту Для каго гэта Прыблізная цана Чаму гэта працуе
Камп'ютарны зрок (выяўленне аб'ектаў, сегментацыя) 👁️ Мабільныя робаты, рукі, беспілотнікі Сярэдні Пераўтварае візуальны ўваход у карысныя дадзеныя, такія як ідэнтыфікацыя аб'екта
SLAM (мапіраванне + лакалізацыя) 🗺️ Робаты, якія перамяшчаюцца Сярэдне-высокі Адсочвае месцазнаходжанне робата, стварае карту, што вельмі важна для навігацыі [1]
Планаванне шляху + пазбяганне перашкод 🚧 Боты дастаўкі, складскія AMR Сярэдні Разлічвае бяспечныя маршруты і адаптуецца да перашкод у рэжыме рэальнага часу
Класічнае кіраванне (ПІД, кіраванне на аснове мадэлі) 🎛️ Усё, што з рухавікамі Нізкі Забяспечвае стабільны і прадказальны рух
Навучанне з падмацаваннем (НП) 🎮 Складаныя навыкі, маніпуляцыі, перамяшчэнне Высокі Навучаецца праз палітыку спроб і памылак, заснаванай на ўзнагароджанні [3]
Маўленне + мова (ASR, намер, LLM) 🗣️ Памочнікі, сэрвісныя робаты Сярэдне-высокі Дазваляе ўзаемадзейнічаць з людзьмі праз натуральную мову
Выяўленне анамалій + маніторынг 🚨 Заводы, ахова здароўя, крытычна важныя для бяспекі Сярэдні Выяўляе незвычайныя заканамернасці, перш чым яны стануць дарагімі або небяспечнымі
Зліццё датчыкаў (фільтры Калмана, навучанае зліццё) 🧩 Навігацыя, дроны, стэкі аўтаноміі Сярэдні Аб'ядноўвае крыніцы дадзеных з шумам для больш дакладных ацэнак [1]

Успрыманне: як робаты ператвараюць неапрацаваныя дадзеныя датчыкаў у сэнс

Успрыманне — гэта калі робаты ператвараюць патокі датчыкаў у нешта, што яны могуць рэальна выкарыстоўваць:

  • Камеры → распазнаванне аб'ектаў, ацэнка позы, разуменне сцэны

  • Лідар → адлегласць + геаметрыя перашкоды

  • Глыбінявыя камеры → 3D-структура і вольная прастора

  • Мікрафоны → маўленчыя і гукавыя сігналы

  • Датчыкі сілы/крутоўнага моманту → больш бяспечны захоп і сумесная праца

  • Тактыльныя датчыкі → выяўленне слізгацення, кантактныя падзеі

Робаты спадзяюцца на штучны інтэлект, каб адказаць на такія пытанні, як:

  • «Якія прадметы перада мной?»

  • «Гэта чалавек ці манекен?»

  • «Дзе ручка?»

  • «Штосьці рухаецца ў мой бок?»

Тонкая, але важная дэталь: сістэмы ўспрымання ў ідэале павінны выдаваць нявызначанасць (ці паказчык упэўненасці), а не проста адказ «так/не», бо ад таго, наколькі ўпэўнены робат, залежыць далейшае планаванне і рашэнні па бяспецы.


Лакалізацыя і картаграфаванне: ведайце, дзе вы знаходзіцеся, без панікі

Каб робат правільна функцыянаваў, яму трэба ведаць, дзе ён знаходзіцца. Часта гэта вырашаецца з дапамогай SLAM (адначасовая лакалізацыя і картаграфаванне) : стварэнне карты з адначасовай ацэнкай пазіцыі робата. У класічных фармулёўках SLAM разглядаецца як задача імавернаснай ацэнкі, з распаўсюджанымі сямействамі, якія ўключаюць падыходы на аснове EKF і на аснове часціц-фільтраў. [1]

Робат звычайна спалучае ў сабе:

  • Адометрыя колаў (базавае адсочванне)

  • Супастаўленне лідарнага сканавання або візуальных арыентыраў

  • ІМУ (кручэнне/паскарэнне)

  • GPS (на вуліцы, з абмежаваннямі)

Робатаў не заўсёды можна ідэальна лакалізаваць, таму добрыя стэкі паводзяць сябе як дарослыя: адсочваюць нявызначанасць, выяўляюць дрэйф і вяртаюцца да больш бяспечнай паводзін, калі ўпэўненасць падае.


Планаванне і прыняцце рашэнняў: выбар далейшых дзеянняў

Пасля таго, як робат мае працаздольную карціну свету, яму трэба вырашыць, што рабіць. Планаванне часта праяўляецца ў двух аспектах:

  • Лакальнае планаванне (хуткія рэфлексы)
    Пазбягайце перашкод, запавольвайцеся каля людзей, трымайцеся паласы руху/калідораў.

  • Глабальнае планаванне (больш шырокая карціна) 🧭
    Выбірайце пункты прызначэння, аб'язджайце заблакаваныя зоны, плануйце задачы.

На практыцы менавіта тут робат пераўтварае фразу «Мне здаецца, я бачу вольны шлях» у канкрэтныя каманды руху, якія не зачапяцца за кут паліцы і не занясуць асабістую прастору чалавека.


Кантроль: ператварэнне планаў у плыўны рух

Сістэмы кіравання пераўтвараюць запланаваныя дзеянні ў рэальны рух, адначасова спраўляючыся з рэальнымі непрыемнасцямі, такімі як:

  • Трэнне

  • Змены карыснай нагрузкі

  • Гравітацыя

  • Затрымкі і люфты рухавіка

Да распаўсюджаных інструментаў адносяцца ПІД , кіраванне на аснове мадэлі , прагназуемае кіраванне на аснове мадэлі і адваротная кінематыка для рук, г.зн. матэматыка, якая пераўтварае «пастаўце захоп туды » ў рухі суставаў. [2]

Карысны спосаб разважаць пра гэта:
планаванне выбірае шлях.
Кіраванне прымушае робата сапраўды ісці па ім, не хістаючыся, не пераскокваючы межы маршруту і не вібруючы, як кошык для пакупак з кафеінам.


Навучанне: як робаты ўдасканальваюцца замест таго, каб іх перапраграмоўвалі назаўжды

Робаты могуць удасканальвацца, вучачыся на дадзеных, а не пераналаджваючыся ўручную пасля кожнай змены асяроддзя.

Асноўныя падыходы да навучання ўключаюць:

  • Навучанне пад наглядам 📚: Вучыцеся на пазначаных прыкладах (напрыклад, «гэта паддон»).

  • Саманавучанне 🔍: Вывучайце структуру з неапрацаваных дадзеных (напрыклад, прагназуйце будучыя кадры).

  • Навучанне з падмацаваннем 🎯: Навучайцеся дзеянням, максімізуючы сігналы ўзнагароджання з цягам часу (часта ў залежнасці ад агентаў, асяроддзя і прыбытку). [3]

Дзе RL ззяе: вывучэнне складаных паводзін, дзе ручное праектаванне кантролера з'яўляецца балючым.
Дзе RL становіцца пікантным: эфектыўнасць дадзеных, бяспека падчас даследавання і прабелы паміж сімуляцыяй і рэальным.


Узаемадзеянне чалавека і робата: штучны інтэлект, які дапамагае робатам працаваць з людзьмі

Для робатаў у дамах або на працоўных месцах узаемадзеянне мае значэнне. Штучны інтэлект дазваляе:

  • Распазнаванне маўлення (гук → словы)

  • Выяўленне намеру (словы → сэнс)

  • Разуменне жэстаў (паказанні, мова цела)

Гэта гучыць проста, пакуль не зразумееш: людзі непаслядоўныя, акцэнты розныя, пакоі шумныя, а «там» не з'яўляецца сістэмай каардынат.


Давер, бяспека і «не будзь жудасным»: менш вясёлая, але важная частка

Робаты — гэта сістэмы штучнага інтэлекту з фізічнымі наступствамі , таму пра давер і практыкі бяспекі нельга забываць.

Практычныя бяспечныя рыштаванні часта ўключаюць у сябе:

  • Маніторынг упэўненасці/нявызначанасці

  • Кансерватыўныя паводзіны пры пагаршэнні ўспрымання

  • Дзеянні рэгістрацыі для адладкі і аўдыту

  • Выразныя межы таго, што можа рабіць робат

Карысным спосабам фармулявання гэтага з'яўляецца кіраванне рызыкамі: кіраванне, картаграфаванне рызык, іх вымярэнне і кіраванне імі на працягу ўсяго жыццёвага цыклу — у адпаведнасці з тым, як NIST структуруе кіраванне рызыкамі штучнага інтэлекту ў больш шырокім сэнсе. [4]


Трэнд «вялікіх мадэляў»: робаты, якія выкарыстоўваюць асноўныя мадэлі

Базавыя мадэлі імкнуцца да больш універсальнай паводзін робатаў, асабліва калі мова, зрок і дзеянні мадэлююцца разам.

Адным з прыкладаў напрамкаў з'яўляюцца бачання-мовы-дзеяння (VLA) , дзе сістэма навучаецца звязваць тое, што яна бачыць + тое, што ёй кажуць рабіць + якія дзеянні яна павінна выканаць. RT-2 — шырока цытуемы прыклад такога падыходу. [5]

Захапляльная частка: больш гнуткае, больш высокаўзроўневае разуменне.
Праверка рэальнасці: надзейнасць фізічнага свету ўсё яшчэ патрабуе ахоўных парогаў — класічная ацэнка, абмежаванні бяспекі і кансерватыўны кантроль не знікаюць толькі таму, што робат можа «разумна гаварыць».


Заключныя заўвагі

Дык як робаты выкарыстоўваюць штучны інтэлект? Робаты выкарыстоўваюць штучны інтэлект для ўспрымання , ацэнкі стану (дзе я знаходжуся?) , планавання і кіравання , а часам і для навучання на аснове дадзеных для ўдасканалення. Штучны інтэлект дазваляе робатам спраўляцца са складанымі дынамічнымі асяроддзямі, але поспех залежыць ад надзейных, вымерных сістэм з паводзінамі, арыентаванымі на бяспеку.


Спасылкі

[1] Durrant-Whyte & Bailey -
Адначасовая лакалізацыя і картаграфаванне (SLAM): частка I Асноўныя алгарытмы (PDF) [2] Lynch & Park -
Сучасная робататэхніка: механіка, планаванне і кіраванне (PDF-прэпрынт) [3] Sutton & Barto -
Навучанне з падмацаваннем: уводзіны (2-е выданне, чарнавік PDF) [4] NIST -
Структура кіравання рызыкамі штучнага інтэлекту (AI RMF 1.0) (PDF) [5] Brohan і інш. - RT-2: Мадэлі зроку-мовы-дзеяння пераносяць вэб-веды ў кіраванне робатамі (arXiv)

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога