Ці надзейныя дэтэктары штучнага інтэлекту?

Ці надзейныя дэтэктары штучнага інтэлекту?

Людзі хочуць простага вердыкту. Устаўце абзац, націсніце кнопку, і дэтэктар выдасць вам Праўду з акуратным невялікім працэнтам.

Акрамя таго, пісьмо — гэта не акуратна. І «тэкст, створаны штучным інтэлектам» — гэта таксама не адна рэч . Гэта суп. Часам ён цалкам згенераваны, часам з лёгкай дапамогай, часам гэта чалавечы чарнавік з адшліфоўкай штучным інтэлектам, часам гэта чалавечы чарнавік з некалькімі рабатызаванымі сказамі, якія пракраліся, як кот за абедам 😼.

Такім чынам, узнікае пытанне, ці надзейныя датчыкі штучнага інтэлекту .

Яны могуць быць карыснымі ў якасці падказкі — штуршка, сігналу «магчыма, варта прыгледзецца». Але яны ненадзейныя ў якасці доказу . Нават блізка не. І нават кампаніі, якія вырабляюць дэтэктары, схільныя казаць пра гэта так ці інакш (часам гучна, часам дробным шрыфтам). Напрыклад, OpenAI заявіў, што немагчыма надзейна выявіць увесь тэкст, напісаны штучным інтэлектам , і нават апублікаваў лічбы ацэнкі, якія паказваюць значныя паказчыкі памылак і ілжывых спрацоўванняў. [1]

Артыкулы, якія вам могуць спадабацца пасля гэтага:

🔗 Як працуе выяўленне штучным інтэлектам
Паглядзіце, як інструменты выяўляюць тэксты штучнага інтэлекту з дапамогай шаблонаў і верагоднасцей.

🔗 Як штучны інтэлект прадказвае тэндэнцыі
Зразумець, як алгарытмы прагназуюць попыт на аснове дадзеных і сігналаў.

🔗 Як выкарыстоўваць штучны інтэлект на тэлефоне
Практычныя спосабы выкарыстання праграм штучнага інтэлекту для штодзённых задач.

🔗 Ці з'яўляецца пераўтварэнне тэксту ў маўленне штучным інтэлектам?
Даведайцеся, як сістэмы TTS генеруюць натуральныя галасы з пісьмовага тэксту.


Чаму людзі пастаянна пытаюцца, ці надзейныя датчыкі штучнага інтэлекту 😅

Таму што стаўкі дзіўна хутка ўзраслі.

  • Настаўнікі хочуць абараніць акадэмічную сумленнасць 🎓

  • Рэдактары хочуць спыніць ненадакучлівыя спам-артыкулы 📰

  • Менеджэры па падборы персаналу хочуць сапраўдныя ўзоры тэкстаў 💼

  • Студэнты хочуць пазбегнуць ілжывых абвінавачванняў 😬

  • Брэнды хочуць паслядоўнага голасу, а не фабрыкі капіравання і ўстаўкі кантэнту 📣

І ў глыбіні душы адчуваецца прага камфорту машыны, якая можа з упэўненасцю сказаць «гэта сапраўднае» ці «гэта падробка». Як металадэтэктар у аэрапорце.

Акрамя таго… мова — гэта не метал. Мова — гэта хутчэй туман. Можна пасвяціць у яго ліхтарыкам, але людзі ўсё роўна спрачаюцца пра тое, што яны бачылі.

 

Дэтэктар штучнага інтэлекту

Надзейнасць на практыцы супраць дэманстрацый 🎭

У кантраляваных умовах дэтэктары могуць выглядаць уражліва. У паўсядзённым выкарыстанні яны становяцца менш акуратнымі — бо дэтэктары не «бачаць аўтарства», а заканамернасці .

Нават старонка класіфікацыі тэкстаў OpenAI, якая зараз спынена, адкрыта гаворыць пра асноўную праблему: надзейнае выяўленне не гарантаванае, а прадукцыйнасць залежыць ад такіх рэчаў, як даўжыня тэксту (з кароткім тэкстам складаней). Яны таксама падзяліліся канкрэтным прыкладам кампрамісу: выяўленне толькі часткі тэксту, напісанага штучным інтэлектам, пры гэтым часам няправільна маркіруючы тэкст, напісаны чалавекам. [1]

Штодзённае пісьмо поўнае незразумелых момантаў:

  • сур'ёзнае рэдагаванне

  • шаблоны

  • тэхнічны тон

  • неродная фраза

  • кароткія адказы

  • жорсткае акадэмічнае фарматаванне

  • «Я напісаў гэта а другой гадзіне ночы, і мой мозг быў падсмажаны» энергія

Такім чынам, дэтэктар можа рэагаваць на стыль , а не на паходжанне. Гэта як спрабаваць вызначыць, хто спёк торт, гледзячы на ​​крошкі. Часам можна здагадацца. Часам можна проста ацаніць вібрацыі крошак.


Як працуюць датчыкі штучнага інтэлекту (і чаму яны ламаюцца) 🧠🔧

Большасць «дэтэктараў штучнага інтэлекту», якія вы сустрэнеце ў дзікай прыродзе, падзяляюцца на два асноўныя тыпы:

1) Выяўленне на аснове стылю (адгадванне па тэкставых шаблонах)

Гэта ўключае ў сябе класічныя падыходы «класіфікатара» і падыходы, падобныя на прадказальнасць/збянтэжанасць. Інструмент вывучае статыстычныя сігналы, якія звычайна з'яўляюцца ў пэўных выніках мадэлі... а затым робіць абагульненні.

Чаму яно ламаецца:

  • Чалавечы тэкст таксама можа выглядаць «статыстычным» (асабліва фармальны, арыентаваны на рубрыкі або шаблонны).

  • Сучаснае пісьмо часта змешваецца (чалавек + рэдагаванне + прапановы штучнага інтэлекту + граматычныя інструменты).

  • Інструменты могуць стаць занадта ўпэўненымі па-за зонай камфортнага тэсціравання. [1]

2) Паходжанне / вадзяны знак (праверка, а не здагадка)

Замест таго, каб спрабаваць вызначыць аўтарства па «дробках», сістэмы паходжання спрабуюць далучыць якія пацвярджаюць паходжанне , або ўбудаваць сігналы, якія пазней можна праверыць.

Праца NIST па сінтэтычным кантэнце падкрэслівае ключавую рэальнасць: нават дэтэктары вадзяных знакаў маюць ненулявыя ілжыва спрацоўваючыя і ілжыва адмоўныя вынікі , і надзейнасць залежыць ад таго, ці перажыве вадзяны знак шлях ад стварэння → рэдагавання → перапублікацыі → скрыншоты → апрацоўка на платформе. [2]

Так, паходжанне ў прынцыпе чысцейшае ... але толькі тады, калі экасістэма цалкам яго падтрымлівае.


Асноўныя рэжымы няўдач: ілжывапазітыўныя і ілжываадмоўныя вынікі 😬🫥

У гэтым і заключаецца сутнасць. Калі вы хочаце ведаць, ці надзейныя датчыкі штучнага інтэлекту, вам трэба спытаць: якой цаной ?

Ілжыва спрацоўвае (чалавек пазначыў гэта як штучны інтэлект) 😟

Гэта кашмарны сцэнар у школах і на працоўных месцах: чалавек нешта піша, яго паскардзяць, і раптам ён абараняецца ад лічбы на экране.

Вось балюча распаўсюджаная заканамернасць:

Студэнт адпраўляе кароткае разважанне (скажам, пару сотняў слоў).
Дэтэктар выдае ўпэўнена выглядаючую адзнаку.
Усе панікуюць.
Потым вы даведваецеся, што сам інструмент папярэджвае, што кароткія адпраўленыя адказы могуць быць менш надзейнымі — і што адзнака не павінна выкарыстоўвацца як адзіная падстава для негатыўных мер. [3]

Уласныя рэкамендацыі Turnitin (у заўвагах да выпуску/дакументацыі) папярэджваюць, што працы аб'ёмам менш за 300 слоў могуць быць менш дакладнымі , і нагадваюць установам не выкарыстоўваць бал штучнага інтэлекту як адзіную падставу для неспрыяльных дзеянняў у дачыненні да студэнта. [3]

Ілжывыя спрацоўванні таксама звычайна з'яўляюцца, калі запіс такі:

  • занадта фармальны

  • паўтаральныя па дызайне (рубрыкі, справаздачы, шаблоны брэндаў)

  • кароткі (менш сігналу, больш здагадак)

  • старанна вычытаны і адшліфаваны

Дэтэктар можа сказаць: «Гэта падобна на тэкст, які я бачыў ад штучнага інтэлекту», нават калі гэта не так. Гэта не злы намер. Гэта проста супастаўленне з шаблонам з дапамогай паўзунка ўпэўненасці.

Ілжываадмоўныя вынікі (штучны інтэлект не пазначае) 🫥

Калі хтосьці выкарыстоўвае штучны інтэлект і злёгку рэдагуе — змяняе парадак, перафразуе, дадае нейкія чалавечыя памылкі — дэтэктары могуць гэта прапусціць. Акрамя таго, інструменты, настроеныя на пазбяганне ілжывых абвінавачванняў, часта прапускаюць больш тэксту са штучным інтэлектам па сваёй сутнасці (гэта кампраміс парога). [1]

Такім чынам, вы можаце атрымаць найгоршую камбінацыю:

  • Шчырых пісьменнікаў часам пакараюць

  • рашучыя ашуканцы часта гэтага не робяць

Не заўсёды. Але дастаткова часта, каб выкарыстоўваць дэтэктары ў якасці «доказу» было рызыкоўна.


Што робіць наладу дэтэктара «добрай» (нават калі дэтэктары не ідэальныя) ✅🧪

Калі вы ўсё роўна збіраецеся выкарыстоўваць адзін з іх (бо ўстановы займаюцца ўстановамі), добрая схема выглядае не як «суддзя + прысяжныя», а хутчэй як «трыяж + доказы»

Адказная ўстаноўка ўключае ў сябе:

  • Празрыстыя абмежаванні (папярэджанні з кароткім тэкстам, абмежаванні даменаў, дыяпазоны даверу) [1][3]

  • Выразныя парогі + нявызначанасць як слушны вынік («мы не ведаем» не павінна быць табу)

  • Праверка чалавекам і доказы працэсу (чарнавікі, планы, гісторыя пераглядаў, цытаваныя крыніцы)

  • Палітыка, якая відавочна не спрыяе прыняццю рашэнняў, якія прыводзяць да пакарання, толькі на падставе балаў [3]

  • Абарона прыватнасці (не накіроўвайце канфідэнцыйную інфармацыю на недакладныя панэлі кіравання)


Параўнальная табліца: падыходы да выяўлення і праверкі 📊🧩

Гэты стол наўмысна мае невялікія асаблівасці, бо менавіта так сталы звычайна выглядаюць, калі іх сабраў чалавек, пацягваючы халодную гарбату ☕.

Інструмент / Падыход Аўдыторыя Тыповае выкарыстанне Чаму гэта працуе (і чаму не)
Дэтэктары штучнага інтэлекту на аснове стылю (агульныя інструменты «ацэнкі штучнага інтэлекту») Усе Хуткая трыяж Хутка і проста, але можа пераблытаць стыль з паходжаннем — і, як правіла, нестабільна на кароткім або моцна адрэдагаваным тэксце. [1]
Інстытуцыйныя дэтэктары (інтэграваныя з LMS) Школы, універсітэты Пазначэнне працоўнага працэсу Зручна для скрынінгу, але рызыкоўна, калі разглядаць як доказ; многія інструменты відавочна папярэджваюць аб недапушчэнні вынікаў, заснаваных толькі на ацэнцы. [3]
Стандарты паходжання (пасведчанні аб кантэнце / у стылі C2PA) Платформы, рэдакцыі Адсочваць паходжанне + рэдагаванні Больш мацнейшы пры комплексным укараненні; абапіраецца на метададзеныя, якія выжываюць у больш шырокай экасістэме. [4]
Экасістэмы вадзяных знакаў (напрыклад, спецыфічныя для пастаўшчыкоў) Пастаўшчыкі інструментаў, платформы Праверка на аснове сігналаў Працуе, калі кантэнт паступае з інструментаў для дадання вадзяных знакаў і можа быць выяўлены пазней; не ўніверсальны, і дэтэктары ўсё яшчэ маюць частату памылак. [2][5]

Дэтэктары ў адукацыі 🎓📚

Адукацыя — самае складанае асяроддзе для дэтэктараў, бо шкода мае асабісты і неадкладны характар.

Студэнтаў часта вучаць пісаць па шаблонах, бо літаральна ацэньваюць па структуры:

  • тэзісы

  • шаблоны абзацаў

  • паслядоўны тон

  • фармальныя пераходы

Такім чынам, дэтэктары могуць у выніку пакараць студэнтаў за… выкананне правілаў.

Калі ў школе выкарыстоўваюцца датчыкі, найбольш бяспечны падыход звычайна ўключае:

  • дэтэктары толькі для трыяжу

  • без штрафаў без праверкі чалавекам

  • магчымасць для студэнтаў растлумачыць свой працэс

  • чарнавік гісторыі / планы / крыніцы як частка ацэнкі

  • вусныя наступныя дзеянні, калі гэта мэтазгодна

І так, вусныя наступныя пытанні могуць здавацца допытам. Але яны могуць быць больш справядлівымі, чым «робат кажа, што вы падманулі», асабліва калі сам дэтэктар папярэджвае аб недапушчэнні рашэнняў толькі на падставе балаў. [3]


Дэтэктары для найму і напісання тэкстаў на працоўным месцы 💼✍️

Пісьмовыя заданні на працоўным месцы часта бываюць наступнымі:

  • шаблонны

  • адпаліраваны

  • паўтаральны

  • рэдагавана некалькімі людзьмі

Іншымі словамі: яно можа выглядаць алгарытмічным, нават калі гэта чалавек.

Калі вы наймаеце супрацоўнікаў, лепшым падыходам, чым абапірацца на балы дэтэктара, з'яўляецца:

  • прасіць напісанне, прывязанае да рэальных працоўных задач

  • дадайце кароткі прамы эфір (нават 5 хвілін)

  • ацэньваць аргументацыю і яснасць, а не толькі «стыль»

  • дазволіць кандыдатам загадзя раскрываць правілы дапамогі штучнага інтэлекту

Спроба «выявіць штучны інтэлект» у сучасных працоўных працэсах — гэта як спроба высветліць, ці выкарыстоўваў хтосьці праверку арфаграфіі. У рэшце рэшт вы разумееце, што свет змяніўся, пакуль вы не глядзелі. [1]


Дэтэктары для выдаўцоў, SEO і мадэрацыі 📰📈

Дэтэктары могуць быць карыснымі для пакетнай сартавання : пазначаць падазроныя кучы кантэнту для праверкі чалавекам.

Але ўважлівы рэдактар-чалавек часта выяўляе праблемы, падобныя на праблемы штучнага інтэлекту, хутчэй, чым дэтэктар, таму што рэдактары заўважаюць:

  • расплывістыя сцвярджэнні без канкрэтыкі

  • упэўнены тон без доказаў

  • адсутная тэкстура бетону

  • «сабраная» фраза, якая не гучыць як ужытая

І вось у чым загвоздка: гэта не нейкая чароўная звышздольнасць. Гэта проста рэдакцыйны інстынкт, які дазваляе знайсці сігналы даверу .


Лепшыя альтэрнатывы, чым простае выяўленне: паходжанне, апрацоўка і «пакажыце сваю працу» 🧾🔍

Калі дэтэктары ў якасці доказу ненадзейныя, лепшыя варыянты, як правіла, выглядаюць не як адзінкавы вынік, а хутчэй як шматслаёвы доказ.

1) Працэс доказаў (негламурны герой) 😮💨✅

  • чарнавікі

  • гісторыя рэдагаванняў

  • нататкі і планы

  • цытаты і спасылкі на крыніцы

  • кантроль версій для прафесійнага напісання тэкстаў

2) Праверкі сапраўднасці, якія не падманутыя 🗣️

  • «Чаму вы абралі менавіта гэтую структуру?»

  • «Якую альтэрнатыву вы адхілілі і чаму?»

  • «Растлумач гэты абзац каму-небудзь маладзейшаму»

3) Стандарты паходжання + вадзяныя знакі, дзе гэта магчыма 🧷💧

Пасведчанні аб кантэнце C2PA прызначаны для таго, каб дапамагчы аўдыторыі адсочваць паходжанне і гісторыю рэдагавання лічбавага кантэнту (напрыклад, канцэпцыя «маркіроўкі харчовай каштоўнасці» для медыя). [4]
Тым часам экасістэма SynthID ад Google сканцэнтравана на вадзяных знаках і іх наступным выяўленні для кантэнту, створанага з дапамогай падтрымоўваных інструментаў Google (і партала дэтэктараў, які скануе загрузкі і вылучае верагодныя вобласці з вадзянымі знакамі). [5]

Гэта , падобныя да праверкі — не ідэальныя, не ўніверсальныя, але накіраваныя ў больш выразным кірунку, чым «здагадкі па вібрацыях». [2]

4) Зразумелая палітыка, якая адпавядае рэчаіснасці 📜

«Штучны інтэлект забаронены» — гэта проста… і часта нерэальна. Шматлікія арганізацыі рухаюцца ў бок:

  • «Штучны інтэлект дазволіў праводзіць мазгавы штурм, а не абмяркоўваць канчатковыя чарнавікі»

  • «Штучны інтэлект дазволены, калі раскрываецца»

  • «Штучны інтэлект улічваў граматыку і яснасць, але арыгінальныя разважанні павінны быць вашымі»


Адказны спосаб выкарыстання датчыкаў штучнага інтэлекту (калі вам гэта неабходна) ⚖️🧠

  1. Выкарыстоўвайце датчыкі толькі як сцяжок
    . Не як прысуд. Не як пакаранне. [3]

  2. Праверце тып тэксту
    : Кароткі адказ? Спіс з маркіраванымі спісамі? Моцна адрэдагаваны? Чакайце больш шумных вынікаў. [1][3]

  3. Шукайце абгрунтаваныя доказы:
    чарнавікі, спасылкі, паслядоўны голас на працягу доўгага часу і здольнасць аўтара растлумачыць зроблены выбар.

  4. Дапусцім, што змешанае аўтарства зараз з'яўляецца нармальнай з'явай.
    Людзі + рэдактары + граматычныя інструменты + прапановы штучнага інтэлекту + шаблоны — гэта… аўторак.

  5. Ніколі не спадзявайцеся на адну лічбу.
    Адзінкавыя балы спрыяюць лянівым рашэнням, а лянівыя рашэнні — гэта тое, як з'яўляюцца ілжывыя абвінавачванні. [3]


Заключная заўвага ✨

Такім чынам, карціна надзейнасці выглядае наступным чынам:

  • Надзейны як прыблізны намёк: часам ✅

  • Надзейны доказ: не ❌

  • Бяспечна як адзіная падстава для пакарання або выдалення: абсалютна не 😬

Ставіцеся да датчыкаў як да пажарнай сігналізацыі:

  • гэта можа падказаць вам прыгледзецца бліжэй

  • яно не можа дакладна сказаць вам, што здарылася

  • яно не можа замяніць расследаванне, кантэкст і працэсуальныя доказы

Аўтаматы праўдзівасці ў адзін клік у асноўным прызначаны для навуковай фантастыкі або інфармацыйнай рэкламы.


Спасылкі

[1] OpenAI - Новы класіфікатар штучнага інтэлекту для ідэнтыфікацыі тэксту, напісанага штучным інтэлектам (уключае абмежаванні + абмеркаванне ацэнкі) - чытаць далей
[2] NIST - Зніжэнне рызык, звязаных з сінтэтычным кантэнтам (NIST AI 100-4) - чытаць далей
[3] Turnitin - Мадэль выяўлення тэксту, напісанага штучным інтэлектам (уключае папярэджанні аб кароткім тэксце + не выкарыстоўвае бал як адзіную падставу для неспрыяльных дзеянняў) - чытаць далей
[4] C2PA - Агляд C2PA / Content Credentials - чытаць далей
[5] Google - SynthID Detector - партал, які дапамагае ідэнтыфікаваць кантэнт, згенераваны штучным інтэлектам - чытаць далей

Знайдзіце найноўшы штучны інтэлект у афіцыйнай краме памочнікаў штучнага інтэлекту

Пра нас

Назад да блога