Ці перабольшаны штучны інтэлект?

Ці перабольшаны штучны інтэлект?

Часам штучны інтэлект адчувае сябе як той сябар, які клянецца, што ўмее гатаваць, а потым з'яўляецца з паяльнай лямпай і сырой цыбуляй. Уражлівыя інструменты, загадкавыя вынікі, шмат дыму і ніякай пэўнасці, што вячэра хутка будзе.

Такім чынам… Ці перабольшаны штучны інтэлект? Так, у многіх адносінах. Таксама не, у іншых. Абодва варыянты могуць быць праўдай адначасова.

Ніжэй прыведзена сапраўдная справа: дзе сцвярджэнні завышаюцца 🎈, дзе каштоўнасць відавочная, але пераканаўчая 💼, і як адрозніць адно ад аднаго без ступені доктара філасофіі або духоўнага абуджэння.

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Які штучны інтэлект падыходзіць менавіта вам?
Параўнайце распаўсюджаныя інструменты штучнага інтэлекту па мэтах, бюджэце і прастаце выкарыстання.

🔗 Ці фармуецца бурбалка штучнага інтэлекту?
Прыкметы ажыятажу, рызыкі і тое, як выглядае ўстойлівы рост.

🔗 Ці надзейныя датчыкі штучнага інтэлекту для выкарыстання ў рэальным свеце?
Межы дакладнасці, ілжываспрацоўваючыя вынікі і парады па справядлівай ацэнцы.

🔗 Як штодня выкарыстоўваць штучны інтэлект на тэлефоне
Выкарыстоўвайце мабільныя праграмы, галасавыя памочнікі і падказкі, каб зэканоміць час.


Што людзі звычайна маюць на ўвазе, калі кажуць «штучны інтэлект перабольшаны» 🤔

Калі хтосьці кажа, што штучны інтэлект перабольшаны , ён звычайна рэагуе на адну (ці некалькі) з гэтых неадпаведнасцей:

  • Маркетынгавыя абяцанні супраць паўсядзённай рэальнасці.
    Дэманстрацыя выглядае чароўна. Разгортванне адчуваецца як скотч і малітва.

  • Магчымасці супраць надзейнасці
    Яно можа напісаць верш, перакласці кантракт, адладзіць код… а потым упэўнена вынайсці спасылку на палітыку. Крута, крута, крута.

  • Прагрэс супраць практычнасці
    Мадэлі хутка ўдасканальваюцца, але інтэграцыя іх у заблытаныя бізнес-працэсы — гэта павольна, палітычна і поўна нестандартных выпадкаў.

  • Апавяданні пра «замену людзей»
    Большасць рэальных перамог выглядаюць хутчэй як «выдаленне нудных частак», чым як «замена ўсёй працы».

І ў гэтым і заключаецца асноўная супярэчнасць: штучны інтэлект сапраўды магутны, але яго часта падаюць так, быццам ён ужо гатовы. Ён не гатовы. Ён… у працэсе распрацоўкі. Як дом з цудоўнымі вокнамі і без сантэхнікі 🚽

 

Штучны інтэлект перабольшаны?

Чаму так лёгка здараюцца (і працягваюць здарацца) завышаныя заявы пра штучны інтэлект 🎭

Некалькі прычын, чаму штучны інтэлект прыцягвае завышаныя заявы, як магніт:

Дэма-версіі — гэта па сутнасці падман (у самым прыемным сэнсе)

Дэманстрацыі адмыслова падрыхтаваны. Запыты настроены правільна. Дадзеныя чыстыя. Найлепшы сцэнар атрымлівае ўвагу, а выпадкі няўдач ператвараюцца ў кулуары, дзе людзі ядуць крекеры.

Прадузятасць выжывання гучная

Гісторыі пра тое, як «штучны інтэлект зэканоміў нам мільён гадзін», хутка распаўсюджваюцца. Гісторыі пра тое, як «штучны інтэлект прымусіў нас перапісваць усё двойчы», цішком хаваюцца ў чыёйсьці тэчцы праекта пад назвай «эксперыменты Q3» 🫠

Людзі блытаюць бегласць з праўдай

Сучасны штучны інтэлект можа гучаць упэўнена, карысна і канкрэтна, што падманвае наш мозг, прымушаючы яго меркаваць, што ён дакладны.

Вельмі распаўсюджаным спосабам апісання гэтага рэжыму няўдачы з'яўляецца канфабуляцыя : упэўнена сфармуляваны, але няправільны вынік (г.зн. «галюцынацыі»). NIST непасрэдна называе гэта ключавой рызыкай для генератыўных сістэм штучнага інтэлекту. [1]

Грошы ўзмацняюць мегафон

Калі на кону бюджэты, ацэнкі і кар'ерныя стымулы, у кожнага ёсць падстава сказаць: «гэта змяняе ўсё» (нават калі гэта ў асноўным змяняе слайд-дэкі).


Шаблон «інфляцыя → расчараванне → стабільная каштоўнасць» (і чаму гэта не азначае, што штучны інтэлект — падробка) 📈😬

Шмат якія тэхналогіі прытрымліваюцца той жа эмацыйнай дугі:

  1. Пікавыя чаканні (да аўторка ўсё будзе аўтаматызавана)

  2. Жорсткая рэальнасць (яна зламаецца ў сераду)

  3. Стабільная каштоўнасць (яна ціха становіцца часткай таго, як выконваецца праца)

Так, штучны інтэлект можа быць пераацэнены, але пры гэтым заставацца важным. Гэта не супрацьлегласці. Гэта суседзі па пакоі.


Дзе штучны інтэлект не перабольшваюць (ён дае вынікі) ✅✨

Гэта тая частка, якую прапускаюць, бо яна менш навуковай фантастыкі і больш электроннай табліцы.

Дапамога ў кадаванні — гэта рэальны прырост прадукцыйнасці

Для некаторых задач — шаблоннага праекта, тэставых скафаў, паўтаральных шаблонаў — дадатковыя кодавыя пілоты могуць быць сапраўды практычнымі.

хутчэй выканалі задачу кадавання (у іх артыкуле паведамляецца пра паскарэнне на 55% у гэтым канкрэтным даследаванні). [3]

Не магія, але сэнс. Загвоздка ў тым, што вам усё роўна трэба пераглядаць напісанае... бо «карысна» — гэта не тое ж самае, што «правільна»

Напісанне чарнавікоў, падвядзенне вынікаў і першапачатковае абдумванне

Штучны інтэлект выдатна спраўляецца з:

  • Ператварэнне чарнавых нататак у чысты чарнавік ✍️

  • Рэзюмэ доўгіх дакументаў

  • Генерацыя варыянтаў (загалоўкі, планы, варыянты электронных лістоў)

  • Тон перакладу («зрабіце гэта менш вострым» 🌶️)

Гэта, па сутнасці, нястомны малодшы памочнік, які часам хлусіць, таму вы кантралюеце. (Сурова. Таксама дакладна.)

Сартаванне кліентаў і ўнутраныя службы падтрымкі

Дзе штучны інтэлект, як правіла, працуе найлепш: класіфікаваць → атрымліваць → прапаноўваць , а не вынаходзіць → спадзявацца → разгортваць .

Калі вам патрэбна кароткая і бяспечная версія: выкарыстоўвайце штучны інтэлект для атрымання інфармацыі з зацверджаных крыніц і падрыхтоўкі чарнавікоў адказаў, але трымайце людзей пад адказнасцю за тое, што пастаўляецца, асабліва калі стаўкі ўзрастаюць. Пазіцыя «кіраваць + тэставаць + раскрываць інцыдэнты» выдатна спалучаецца з тым, як NIST апісвае генератыўнае кіраванне рызыкамі з дапамогай штучнага інтэлекту. [1]

Даследаванне дадзеных — з агароджамі

Штучны інтэлект можа дапамагчы людзям запытваць наборы дадзеных, тлумачыць дыяграмы і генераваць ідэі «на што глядзець далей». Перамога ў тым, каб зрабіць аналіз больш даступным, а не замяніць аналітыкаў.


Дзе штучны інтэлект пераацэньваюць (і чаму ён пастаянна расчароўвае) ❌🤷

«Цалкам аўтаномныя агенты, якія кіруюць усім»

Агенты могуць выконваць акуратныя працоўныя працэсы. Але як толькі вы дадасце:

  • некалькі крокаў

  • брудныя інструменты

  • дазволы

  • рэальныя карыстальнікі

  • рэальныя наступствы

…рэжымы няўдач множацца, як трусы. Спачатку міла, а потым ты ашаломлены 🐇

Практычнае правіла: чым больш нешта прэтэндуе на «свабоду рук», тым часцей варта пытацца, што адбудзецца, калі яно зламаецца.

«Неўзабаве будзе цалкам дакладна»

Дакладнасць, вядома, паляпшаецца, але надзейнасць няўстойлівая, асабліва калі мадэль не заснавана на правераных крыніцах.

Вось чаму сур'ёзная праца са штучным інтэлектам у выніку выглядае як: пошук + праверка + маніторынг + праверка чалавекам , а не «проста больш інтэнсіўнае падказванне». (Профіль GenAI NIST паведамляе пра гэта з ветлівай, настойлівай настойлівасцю.) [1]

«Адна мадэль, якая будзе кіраваць усімі»

На практыцы каманды часта змешваюцца:

  • меншыя мадэлі для танных/вялікааб'ёмных задач

  • большыя мадэлі для больш складаных разважанняў

  • пошук абгрунтаваных адказаў

  • правілы для межаў адпаведнасці

Ідэя «адзінага чароўнага мозгу» добра прадаецца. Яна акуратная. Людзі любяць акуратнасць.

«Заменіце цэлыя працоўныя месцы за адну ноч»

Большасць роляў — гэта набор задач. Штучны інтэлект можа выканаць толькі частку гэтых задач і амаль не закрануць астатнія. Чалавечыя часткі — меркаванні, адказнасць, адносіны, кантэкст — упарта застаюцца... чалавечымі.

Нам патрэбныя былі робаты-калегі. Замест гэтага мы атрымалі аўтазапаўненне на стэроідах.


Што робіць выпадак выкарыстання штучнага інтэлекту добрым (і дрэнным) 🧪🛠️

Гэта той раздзел, які людзі прапускаюць, а потым шкадуюць.

Добры сцэнар выкарыстання штучнага інтэлекту звычайна мае:

  • Зразумелыя крытэрыі поспеху (эканомія часу, зніжэнне колькасці памылак, паляпшэнне хуткасці рэагавання)

  • Нізкія і сярэднія стаўкі (або старанная праверка чалавекам)

  • Паўтаральныя шаблоны (адказы на часта задаваныя пытанні, распаўсюджаныя працоўныя працэсы, стандартная дакументацыя)

  • Доступ да надзейных дадзеных (і дазвол на іх выкарыстанне)

  • Запасны план, калі мадэль выдае бессэнсоўныя вынікі

  • Спачатку вузкі ахоп

дрэнны выпадак выкарыстання штучнага інтэлекту выглядае наступным чынам:

  • «Давайце аўтаматызуем прыняцце рашэнняў» без падсправаздачнасці 😬

  • «Мы проста падключым яго да ўсяго» (не… калі ласка, не)

  • Няма базавых паказчыкаў, таму ніхто не ведае, ці дапамагло гэта

  • Чакаючы, што гэта будзе машына праўды, а не машына шаблонаў

Калі вы збіраецеся памятаць толькі адну рэч: штучнаму інтэлекту лягчэй за ўсё давяраць, калі ён заснаваны на вашых уласных правераных крыніцах і абмежаваны добра акрэсленай задачай. У адваротным выпадку гэта вылічэнні на аснове вібрацый.


Просты (але надзвычай эфектыўны) спосаб праверыць рэчаіснасць штучнага інтэлекту ў вашай арганізацыі 🧾✅

Калі вам патрэбен грунтоўны адказ (не рэзкі аналіз), правядзіце гэты хуткі тэст:

1) Вызначце працу, для якой вы наймаеце штучны інтэлект

Напішыце гэта як апісанне працы:

  • Уваходныя дадзеныя

  • Выхады

  • Абмежаванні

  • «Зроблена — значыць…»

Калі вы не можаце апісаць гэта выразна, штучны інтэлект не растлумачыць гэта чароўным чынам.

2) Вызначце базавую лінію

Колькі часу гэта займае цяпер? Колькі памылак зараз? Як цяпер выглядае «добра»?

Няма базавай лініі = бясконцыя войны меркаванняў пазней. Папраўдзе, людзі будуць спрачацца вечна, і вы хутка старэеце.

3) Вызначце, адкуль бярэцца праўда

  • Унутраная база ведаў?

  • Запісы кліентаў?

  • Зацверджаныя палітыкі?

  • Падабраны набор дакументаў?

Калі адказ «мадэль будзе ведаць», гэта трывожны сігнал 🚩

4) Распрацуйце план узаемадзеяння чалавека

Вырашыце:

  • хто аглядае,

  • калі яны аглядаюць,

  • і што адбываецца, калі штучны інтэлект памыляецца.

Вось у чым розніца паміж «інструментам» і «адказнасцю». Не заўсёды, але часта.

5) Адлюструйце радыус выбуху на карце

Пачынайце з таго, дзе памылкі танныя. Пашырайце толькі пасля таго, як у вас ёсць доказы.

Вось як ператварыць завышаныя заявы ў карыснасць. Проста… эфектыўна… нават прыгожа 😌


Давер, рызыка і рэгуляванне — непрывабная частка, якая мае значэнне 🧯⚖️

Калі штучны інтэлект мае дачыненне да чагосьці важнага (людзей, грошай, бяспекі, юрыдычных пытанняў), кіраванне не з'яўляецца абавязковым.

Некалькі шырока згадваемых агароджаў:

  • Генератыўны профіль штучнага інтэлекту NIST (дапаўненне да RMF штучнага інтэлекту) : практычныя катэгорыі рызык + прапанаваныя дзеянні па кіраванні, тэсціраванні, паходжанні і раскрыцці інфармацыі аб інцыдэнтах. [1]

  • Прынцыпы АЭСР па штучным інтэлекце : шырока выкарыстоўваная міжнародная база для надзейнага, арыентаванага на чалавека штучнага інтэлекту. [5]

  • Закон ЕС аб ​​штучным інтэлекце : прававая база, заснаваная на ацэнцы рызык, якая ўстанаўлівае абавязацельствы ў залежнасці ад таго, як выкарыстоўваецца штучны інтэлект (і забараняе пэўныя практыкі «непрымальнай рызыкі»). [4]

І так, усё гэта можа здацца папяровай працай. Але ў гэтым розніца паміж «практычным інструментам» і «ой, мы ўкаранілі кашмар з захаваннем адпаведнасці»


Больш уважліва: ідэя «штучнага інтэлекту як аўтазапаўнення» — недаацэненая, але больш-менш праўдзівая 🧩🧠

Вось крыху недасканалая (і цалкам дарэчная) метафара: шмат якія штучныя інтэлекты падобныя на надзвычай мудрагелісты аўтазапаўняльнік, які прачытаў інтэрнэт, а потым забыўся, дзе ён гэта прачытаў.

Гэта гучыць грэбліва, але менавіта таму гэта працуе:

  • Выдатна валодае ўзорамі

  • Выдатна валодае мовай

  • Выдатна стварае «наступную верагоднасць»

І вось чаму гэта не атрымліваецца:

  • Яно натуральным чынам не «ведае», што праўда

  • Яно, натуральна, не ведае, чым займаецца ваша арганізацыя

  • Можа выдаваць упэўненую лухту без падставы (гл.: канфабуляцыі / галюцынацыі) [1]

Такім чынам, калі вашаму сцэнару выкарыстання патрэбна праўда, вы замацоўваеце яе з дапамогай пошуку, інструментаў, праверкі, маніторынгу і праверкі чалавекам. Калі ж вашаму сцэнару выкарыстання патрэбна хуткасць у распрацоўцы чарнавікоў і ідэй, вы даяце яму больш свабоды. Розныя налады, розныя чаканні. Як прыгатаванне ежы з соллю — не ўсім патрэбна аднолькавая колькасць.


Параўнальная табліца: практычныя спосабы выкарыстання штучнага інтэлекту, не патануўшы ў завышаных заявах 🧠📋

Інструмент / опцыя Аўдыторыя Цэнавая атмасфера Чаму гэта працуе
Памочнік у стылі чата (агульны) Асобныя асобы, каманды Звычайна бясплатны ўзровень + платны Выдатна падыходзіць для чарнавікоў, мазгавога штурму, падвядзення вынікаў... але правярайце факты (заўсёды)
Код другога пілота Распрацоўшчыкі Звычайна падпіска Паскарае выкананне распаўсюджаных задач кадавання, але ўсё яшчэ патрабуе праверкі + тэстаў і кавы
«Адказ з крыніцамі» на аснове пошуку Даследчыкі, аналітыкі Фрыміум-стыль Лепш падыходзіць для працоўных працэсаў «знайсці + знайсці зямлю», чым проста здагадвацца
Аўтаматызацыя працоўных працэсаў + штучны інтэлект Аператары, падтрымка Шмат'ярусны Ператварае паўтаральныя крокі ў паўаўтаматычныя патокі (паўаўтаматычны падыход — гэта ключавы фактар)
Унутраная мадэль / самастойны хостынг Арганізацыі з магчымасцямі машыннага навучання Інфра + людзі Большы кантроль + прыватнасць, але вы плаціце за абслугоўванне і галаўны боль
Структуры кіравання Лідары, рызыка, адпаведнасць Бясплатныя рэсурсы Дапамагае кіраваць рызыкамі + давер, не гламурна, але неабходна
Крыніцы бенчмаркінгу / праверкі рэальнасці Кіраўніцтва, палітыка, стратэгія Бясплатныя рэсурсы Дадзеныя перамагаюць вібрацыі і памяншаюць колькасць пропаведзяў у LinkedIn
«Агент, які робіць усё» Летучнікі 😅 Выдаткі + хаос Часам уражвае, часта далікатнае — працягвайце з закускамі і цярпеннем

Калі вам патрэбен адзіны цэнтр «праверкі рэальнасці» для дадзеных аб прагрэсе і ўплыве штучнага інтэлекту, Стэнфардскі індэкс штучнага інтэлекту — гэта добрае месца для пачатку. [2]


Заключны дубль + кароткі агляд 🧠✨

Такім чынам, штучны інтэлект перабольшваецца, калі хтосьці прадае:

  • бездакорная дакладнасць,

  • поўная аўтаномія,

  • імгненная замена цэлых роляў,

  • ці падключаемы да сістэмы мозг, які вырашае праблемы вашай арганізацыі…

...тады так, гэта майстэрства продажаў з глянцавым пакрыццём.

Але калі ставіцца да штучнага інтэлекту наступным чынам:

  • магутны памочнік,

  • найлепш выкарыстоўваць у вузкіх, добра акрэсленых задачах,

  • заснаваныя на надзейных крыніцах,

  • з людзьмі, якія пераглядаюць важныя рэчы…

...тады не, гэта не празмерная раскрутка. Гэта проста... няроўна. Як абанемент у спартзалу. Неверагодны, калі ім карыстацца правільна, бескарысны, калі пра яго толькі на вечарынках гавораць 😄🏋️

Кароткі агляд: штучны інтэлект занадта раскручваюць як чароўную замену меркаванню і недаацэньваюць як практычны памнажальнік для чарнавікоў, дапамогі ў кадаванні, трыяжу і працоўных працэсаў працы з ведамі.


Спасылкі

  1. Генератыўны профіль штучнага інтэлекту NIST (NIST AI 600-1, PDF) — дадатковае кіраўніцтва да структуры кіравання рызыкамі штучнага інтэлекту, у якім акрэслены ключавыя вобласці рызыкі і рэкамендаваныя дзеянні па кіраванні, тэсціраванні, паходжанні і раскрыцці інфармацыі аб інцыдэнтах. чытаць далей

  2. Індэкс штучнага інтэлекту Стэнфарда HAI — штогадовая справаздача, багатая дадзенымі, якая адсочвае прагрэс, укараненне, інвестыцыі і ўплыў штучнага інтэлекту на грамадства па асноўных крытэрыях і паказчыках. чытаць далей

  3. Даследаванне прадукцыйнасці GitHub Copilot — кантраляванае даследаванне GitHub аб хуткасці выканання задач і вопыце распрацоўшчыкаў пры выкарыстанні Copilot. чытаць далей

  4. Агляд Закона Еўрапейскай камісіі аб штучным інтэлекце — цэнтральная старонка Камісіі, на якой тлумачацца абавязацельствы ЕС па ўзроўнях рызыкі для сістэм штучнага інтэлекту і катэгорыі забароненых практык. чытаць далей

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога