Якая галоўная мэта генератыўнага штучнага інтэлекту?

Якая галоўная мэта генератыўнага штучнага інтэлекту?

Галоўная мэта генератыўнага штучнага інтэлекту даволі простая:

Гэта значыць ствараць новы, праўдападобны кантэнт — тэкст, выявы, аўдыё, код, відэа, дызайн — шляхам вывучэння заканамернасцей з існуючых дадзеных, а затым генерацыі новых вынікаў, якія адпавядаюць запыту.

Гэта аснова. Усё астатняе (прадукцыйнасць, крэатыўнасць, персаналізацыя, сінтэтычныя дадзеныя і г.д.) — гэта ў асноўным размова на тэму «што мы можам зрабіць з гэтай асновай?».

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Што такое генератыўны штучны інтэлект
Зразумейце, як мадэлі ствараюць тэкст, выявы, код і іншае.

🔗 Ці перабольшаны штучны інтэлект?
Збалансаваны погляд на ажыятаж, абмежаванні і рэальны ўплыў.

🔗 Які штучны інтэлект падыходзіць менавіта вам
Параўнайце папулярныя інструменты штучнага інтэлекту і абярыце найлепшы варыянт.

🔗 Ці існуе бурбалка штучнага інтэлекту
Прыкметы, на якія варта звярнуць увагу, рынкавыя рызыкі і што будзе далей.


Галоўная мэта генератыўнага штучнага інтэлекту 🧠

Калі вам патрэбна самае кароткае і дакладнае тлумачэнне:

  • Генератыўны штучны інтэлект вывучае «форму» дадзеных (мову, выявы, музыку, код)

  • Затым ён генеруе новыя ўзоры , якія адпавядаюць гэтай форме

  • Гэта робіцца ў адказ на падказку, кантэкст або абмежаванні

Так, ён можа напісаць абзац, намаляваць карціну, зрабіць рэмікс мелодыі, скласці пункт кантракту, стварыць тэставыя выпадкі або распрацаваць нешта падобнае на лагатып.

Не таму, што яно «разумее» так, як разумее чалавек (мы да гэтага яшчэ вернемся), а таму, што яно добра стварае вынікі, якія статыстычна і структурна адпавядаюць вывучаным ім заканамернасцям.

Калі вы хочаце атрымаць дарослы погляд на тое, «як выкарыстоўваць гэта, не наступаючы на ​​граблі», то сістэма кіравання рызыкамі штучнага інтэлекту NIST з'яўляецца надзейнай асновай для мыслення ў галіне рызык + кантролю. [1] А калі вы хочаце нешта спецыяльна настроенае на рызыкі генератыўнага штучнага інтэлекту (а не толькі штучнага інтэлекту ў цэлым), NIST таксама апублікаваў профіль GenAI, які больш падрабязна апісвае змены, калі сістэма генеруе кантэнт. [2]

 

Генератыўны штучны інтэлект

Чаму людзі спрачаюцца пра «галоўную мэту генератыўнага штучнага інтэлекту» 😬

Людзі абмяркоўваюць адзін аднаго, таму што выкарыстоўваюць розныя значэнні слова «мэта»

Некаторыя людзі маюць на ўвазе:

  • Тэхнічная мэта: генераваць рэалістычныя, узгодненыя вынікі (аснова)

  • Бізнес-мэта: знізіць выдаткі, павялічыць аб'ём вытворчасці, персаналізаваць вопыт

  • Мэта чалавека: атрымаць дапамогу ў хутчэйшым мысленні, стварэнні або камунікацыі

І так, яны сутыкаюцца.

Калі мы застанемся прыземленымі, галоўнай мэтай генератыўнага штучнага інтэлекту з'яўляецца генерацыя — стварэнне кантэнту, якога раней не існавала, на падставе ўводу дадзеных.

Бізнес-рэчы — гэта ўжо наступства. Культурная паніка таксама ёсць наступства (прабачце… трохі 😬).


З чым людзі блытаюць GenAI (і чаму гэта важна) 🧯

Кароткі спіс «не гэта» дапамагае вырашыць шмат праблем :

GenAI не з'яўляецца базай дадзеных

Яно не «знаходзіць праўду». Яно генеруе праўдападобныя вынікі. Калі вам патрэбна праўда, вы дадаяце абгрунтаванне (дакументы, базы дадзеных, цытаты, праверку чалавекам). У гэтым розным і заключаецца ўся гісторыя надзейнасці. [2]

GenAI не з'яўляецца аўтаматычна агентам

Мадэль, якая генеруе тэкст, — гэта не тое ж самае, што сістэма, якая можа бяспечна выконваць дзеянні (адпраўляць электронную пошту, змяняць запісы, разгортваць код). «Можа генераваць інструкцыі» ≠ «павінна іх выконваць»

GenAI не з'яўляецца намерам

Гэта можа ствараць кантэнт, які гучыць як наўмысны. Гэта не тое ж самае, што мець намер.


Што робіць генератыўны штучны інтэлект добрай версіяй? ✅

Не ўсе «генератыўныя» сістэмы аднолькава практычныя. Добрая версія генератыўнага штучнага інтэлекту — гэта не проста тая, якая стварае прыгожыя вынікі, а тая, якая стварае вынікі, якія з'яўляюцца каштоўнымі, кіраванымі і дастаткова бяспечнымі для кантэксту.

Добрая версія звычайна мае:

  • Звязнасць — не супярэчыць само сабе кожныя два сказы

  • Зазямленне — яно можа звязаць вынікі з крыніцай праўды (дакументы, цытаты, базы дадзеных) 📌

  • Кіраванасць — вы можаце рэгуляваць тон, фармат, абмежаванні (не толькі настройваць вібрацыю)

  • Надзейнасць — падобныя падказкі маюць падобную якасць, але не вынікі рулеткі

  • Бяспечнае агароджванне — гэта дазваляе пазбегнуць небяспечных, прыватных або забароненых выхадаў па задуме

  • Шчырасць — замест таго, каб выдумляць, можна сказаць «Я не ўпэўнены».

  • Адпаведнасць працоўнаму працэсу — ён адпавядае таму, як працуюць людзі, а не фантазійнаму працоўнаму працэсу

NIST у асноўным апісвае ўсю гэтую размову як «надзейнасць + кіраванне рызыкамі», што… непрывабна для ўсіх, чаго яны хацелі б зрабіць раней. [1][2]

Недасканалая метафара (прыгатуйцеся): добрая генератыўная мадэль падобная да вельмі хуткага кухоннага памочніка, які можа прыгатаваць што заўгодна... але часам блытае соль з цукрам, і вам патрэбна маркіроўка і дэгустацыя, каб не падаваць дэсерт-рагу 🍲🍰


Хуткі штодзённы міні-кейс (кампазітны, але вельмі звычайны) 🧩

Уявіце сабе каманду падтрымкі, якая хоча, каб GenAI падрыхтаваў чарнавікі адказаў:

  1. Тыдзень 1: «Проста дайце мадэлі адказаць на пытанні».

    • Вынік хуткі, упэўнены... і часам памылковы ў дарагіх адносінах.

  2. Тыдзень 2: Яны дадаюць пошук (выцягваюць факты з зацверджаных дакументаў) + шаблоны («заўсёды пытацца ідэнтыфікатар уліковага запісу», «ніколі не абяцаць вяртання грошай» і г.д.).

    • Памылковасць памяншаецца, паслядоўнасць паляпшаецца.

  3. Тыдзень 3: Яны дадаюць паласу агляду (адабрэнне чалавека для катэгорый высокай рызыкі) + простыя ацэнкі («спасылка на палітыку», «выкананне правіла вяртання грошай»).

    • Цяпер сістэма даступная для разгортвання.

Гэтая прагрэсія, па сутнасці, і з'яўляецца практычным пунктам гледжання NIST: мадэль — гэта толькі адзін элемент; элементы кіравання вакол яе робяць яе дастаткова бяспечнай. [1][2]


Параўнальная табліца - папулярныя генератыўныя варыянты (і чаму яны працуюць) 🔍

Цэны пастаянна мяняюцца, таму гэта наўмысна застаецца размытым. Акрамя таго: катэгорыі перакрываюцца. Так, гэта раздражняе.

Інструмент / падыход Аўдыторыя Кошт (прыкладна) Чаму гэта працуе (і невялікая асаблівасць)
Агульныя памочнікі ў чаце па LLM Усе, каманды Бясплатны ўзровень + падпіска Выдатна падыходзіць для чарнавікоў, рэзюмэ, мазгавога штурму. Часам упэўнена памыляецца... як смелы сябар 😬
API LLM для праграм Распрацоўшчыкі, прадуктовыя каманды На аснове выкарыстання Лёгка інтэгруецца ў працоўныя працэсы; часта ў спалучэнні з пошукам + інструментамі. Патрэбныя агароджы, інакш сітуацыя становіцца вострай
Генератары малюнкаў (дыфузійнага тыпу) Творцы, маркетолагі Падпіска/крэдыты Моцны ў стылі + варыяцыях; пабудаваны на шаблонах генерацыі ў стылі шумапрыглушэння [5]
Генератыўныя мадэлі з адкрытым зыходным кодам Хакеры, даследчыкі Бясплатнае праграмнае забеспячэнне + абсталяванне Кантроль + налада, налады з захаваннем прыватнасці. Але вы плаціце за праблемы з наладкай (і нагрэў відэакарты)
Аўдыё/музычныя генератары Музыкі, аматары Крэдыты/падпіска Хуткае прыдумванне ідэй для мелодый, тэм, гукавога дызайну. Ліцэнзаванне можа быць заблытаным (чытайце ўмовы)
Відэагенератары Творцы, студыі Падпіска/крэдыты Хуткія раскадроўкі і канцэптуальныя кліпы. Паслядоўнасць паміж сцэнамі ўсё яшчэ застаецца галаўным болем
Генерацыя з пашыраным пошукам (RAG) Бізнес Інфраструктура + выкарыстанне Дапамагае прывязаць генерацыю да вашых дакументаў; распаўсюджаны элемент кіравання для скарачэння «выдуманага матэрыялу» [2]
Генератары сінтэтычных дадзеных Каманды па зборы дадзеных Карпаратыўны Зручна, калі дадзеных мала/канфідэнцыйных; патрабуецца праверка, каб згенераваныя дадзеныя вас не падманвалі 😵

Пад капотам: генерацыя — гэта ў асноўным «завяршэнне шаблону» 🧩

Нерамантычная праўда:

Шмат генератыўнага штучнага інтэлекту — гэта «прадказанне таго, што будзе далей», маштабаванае да таго часу, пакуль не адчуваецца як нешта іншае.

  • У тэксце: стварыць наступны фрагмент тэксту (напрыклад, лексему) у паслядоўнасці — класічная аўтарэгрэсіўная схема, якая зрабіла сучасныя падказкі такімі эфектыўнымі [4]

  • На выявах: пачніце з шуму і ітэратыўна ператварыце яго ў структуру (інтуіцыя дыфузійнага сямейства) [5]

Вось чаму падказкі важныя. Вы даяце мадэлі частковы шаблон, і яна яго дапаўняе.

Вось чаму генератыўны штучны інтэлект можа быць выдатным у:

  • «Напішыце гэта больш прыязным тонам»

  • «Назавіце дзесяць варыянтаў загалоўкаў»

  • «Ператварыце гэтыя нататкі ў акуратны план»

  • «Згенераваць код для стварэння каркасаў + тэсты»

…а таксама чаму ў яго могуць узнікнуць праблемы з:

  • строгая факталагічная дакладнасць без абгрунтавання

  • доўгія, далікатныя ланцугі разважанняў

  • паслядоўная ідэнтычнасць ва ўсіх выніковых матэрыялах (персанажы, голас брэнда, паўтаральныя дэталі)

Гэта не «мысленне» як чалавек. Гэта стварэнне праўдападобных працягаў. Каштоўных, але іншых.


Дыскусія пра творчасць — «стварэнне» супраць «рэміксавання» 🎨

Тут людзі непрапарцыйна награваюцца. Я ў нейкай ступені разумею.

Генератыўны штучны інтэлект часта стварае вынікі, якія выглядаюць крэатыўна, таму што ён можа:

  • аб'яднаць паняцці

  • хутка вывучыць варыяцыі

  • павярхоўныя дзіўныя асацыяцыі

  • імітуюць стылі з дзіўнай дакладнасцю

Але ў яго няма намеру. Няма ўнутранага густу. Няма «Я зрабіў гэта, таму што гэта важна для мяне»

Невялікі адступ: людзі таксама пастаянна робяць рэміксы. Мы проста робім гэта з жыццёвым вопытам, мэтамі і густам. Такім чынам, лэйбл можа заставацца спрэчным. Фактычна, гэта творчы рычаг для людзей, і гэта самае галоўнае.


Сінтэтычныя дадзеныя — ціха недаацэненая мэта 🧪

Адна з нечакана важных галін генератыўнага штучнага інтэлекту — гэта стварэнне дадзеных, якія паводзяць сябе як рэальныя дадзеныя, не раскрываючы рэальных людзей або рэдкія адчувальныя выпадкі.

Чаму гэта каштоўна:

  • абмежаванні прыватнасці і адпаведнасці (меншы ўзровень раскрыцця рэальных запісаў)

  • мадэляванне рэдкіх падзей (выпадкі махлярства на мяжы, збоі нішавых канвеераў і г.д.)

  • тэставанне канвеераў без выкарыстання вытворчых дадзеных

  • дапаўненне дадзеных, калі рэальныя наборы дадзеных малыя

Але падвох застаецца падвохам: сінтэтычныя дадзеныя могуць незаўважна прайграваць тыя ж прадузятасці і сляпыя плямы, што і зыходныя дадзеныя, — вось чаму кіраванне і вымярэнне маюць гэтак жа вялікае значэнне, як і іх генерацыя. [1][2][3]

Сінтэтычныя дадзеныя падобныя на каву без кафеіну — яны выглядаюць належным чынам, маюць прыемны пах, але часам не выконваюць сваю працу так, як вы чакалі ☕🤷


Межы - у чым генератыўны штучны інтэлект дрэнны (і чаму) 🚧

Калі вы памятаеце толькі адно папярэджанне, памятайце пра гэта:

Генератыўныя мадэлі могуць ствараць плаўную бязглуздзіцу.

Распаўсюджаныя рэжымы паломкі:

  • Галюцынацыі — гэта ўпэўненае выдумленне фактаў, цытат або падзей

  • Састарэлыя веды — мадэлі, навучаныя на здымках, могуць прапусціць абнаўленні

  • Хуткая далікатнасць - невялікія змены ў фармулёўках могуць прывесці да вялікіх змен у выніках

  • Схаваная прадузятасць - заканамернасці, атрыманыя з скажоных дадзеных

  • Залішняя паслухмянасць — спробы дапамагчы нават тады, калі не павінны.

  • Непаслядоўныя разважанні , асабліва пры выкананні працяглых задач

Менавіта таму і існуе размова пра «надзейны штучны інтэлект»: празрыстасць, падсправаздачнасць, надзейнасць і дызайн, арыентаваны на чалавека, — гэта не тое, што прыемна мець; гэта тое, як пазбегнуць запуску гарматы даверу ў вытворчасць. [1][3]


Вымярэнне поспеху: ведаць, калі мэта дасягнута 📏

Калі галоўнай мэтай генератыўнага штучнага інтэлекту з'яўляецца «стварэнне каштоўнага новага кантэнту», то паказчыкі поспеху звычайна падзяляюцца на дзве катэгорыі:

Паказчыкі якасці (чалавечыя і аўтаматызаваныя)

  • правільнасць (дзе гэта дастасавальна)

  • лагічнасць і яснасць

  • адпаведнасць стылю (тон, голас брэнда)

  • паўната (ахоплівае тое, што вы прасілі)

Паказчыкі працоўнага працэсу

  • зэканомлены час на кожную задачу

  • скарачэнне колькасці пераглядаў

  • больш высокая прапускная здольнасць без зніжэння якасці

  • задаволенасць карыстальнікаў (найбольш паказальны паказчык, нават калі яго цяжка вымераць колькасна)

На практыцы каманды сутыкнуліся з няёмкай праўдай:

  • мадэль можа хутка ствараць «дастаткова добрыя» чарнавікі

  • але кантроль якасці становіцца новым вузкім месцам

Такім чынам, сапраўдная перамога — гэта не проста генерацыя. Гэта генерацыя плюс сістэмы агляду — пошук інфармацыі на аснове, ацэначныя наборы, рэгістрацыя, аб'яднанне ў чырвоныя каманды, шляхі эскалацыі... усе непрывабныя рэчы, якія робяць яе рэальнай. [2]


Практычныя рэкамендацыі «выкарыстоўвайце без шкадавання» 🧩

Калі вы выкарыстоўваеце генератыўны штучны інтэлект для чагосьці больш, чым проста забавы, некалькі звычак вельмі дапамогуць:

  • Папрасіце структуры: «Дайце мне пранумараваны план, а потым чарнавік».

  • Абмежаванні сілы: «Выкарыстоўвайце толькі гэтыя факты. Калі яны адсутнічаюць, пазначце, чаго не хапае».

  • Запыт на нявызначанасць: «Пералічыце здагадкі + упэўненасць».

  • Выкарыстоўвайце зазямленне: падключайцеся да дакументацыі/баз дадзеных, калі факты маюць значэнне [2]

  • Разглядаць вынікі як чарнавікі: нават выдатныя

А самы просты прыём — і самы чалавечы: прачытайце гэта ўслых. Калі гэта гучыць як спроба недзеяздольнага робата зрабіць уражанне на вашага кіраўніка, хутчэй за ўсё, гэта трэба адрэдагаваць 😅


Падвядзенне вынікаў 🎯

Галоўная мэта генератыўнага штучнага інтэлектуствараць новы кантэнт, які адпавядае зададзенаму заданню або абмежаванню , шляхам вывучэння заканамернасцей з дадзеных і атрымання праўдападобных вынікаў.

Гэта магутна, таму што:

  • паскарае распрацоўку чарнавікоў і ідэй

  • танна памнажае варыяцыі

  • дапамагае пераадолець прабелы ў навыках (пісьмо, кадаванне, дызайн)

Гэта рызыкоўна, таму што:

  • можа свабодна выдумляць факты

  • успадкоўвае прадузятасць і сляпыя плямы

  • патрабуе абгрунтавання і кантролю ў сур'ёзных кантэкстах [1][2][3]

Пры правільным выкарыстанні гэта менш «заменны мозг» і больш «цягавы рухавік з турбанаддувам».
Пры дрэнным выкарыстанні гэта гармата ўпэўненасці, накіраваная на ваш працоўны працэс... і гэта хутка дорага абыходзіцца 💥


Спасылкі

[1] NIST's AI RMF — структура для кіравання рызыкамі і кантролю, звязанымі са штучным інтэлектам. чытаць далей
[2] NIST AI 600-1 GenAI Profile — кіраўніцтва па рызыках, спецыфічных для GenAI, і іх змякчэнні (PDF). чытаць далей
[3] Прынцыпы штучнага інтэлекту АЭСР — набор прынцыпаў высокага ўзроўню для адказнага штучнага інтэлекту. чытаць далей
[4] Браўн і інш. (NeurIPS 2020) — фундаментальны дакумент па некалькіх падказках з дапамогай мадэляў вялікай мовы (PDF). чытаць далей
[5] Хо і інш. (2020) — дакумент па мадэлі дыфузіі, які апісвае генерацыю малюнкаў на аснове шумапрыглушэння (PDF). чытаць далей

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога