Штучны інтэлект паўсюль — ціха сартуе, ацэньвае і прапануе. Гэта зручна… пакуль ён не выцісне некаторыя групы наперад і не пакіне іншыя ззаду. Калі вы задаваліся пытаннем, што такое зрушэнне штучнага інтэлекту , чаму яно з'яўляецца нават у адшліфаваных мадэлях і як яго паменшыць, не пагаршаючы прадукцыйнасць, гэты дапаможнік для вас.
Артыкулы, якія вам могуць спадабацца пасля гэтага:
🔗 Што азначае GPT
Простая тлумачэнне назвы і паходжання GPT.
🔗 Што такое прагназуючы штучны інтэлект
Як прагнастычныя мадэлі прагназуюць вынікі на аснове гістарычных і рэальных дадзеных.
🔗 Што такое штучны інтэлект з адкрытым зыходным кодам
Вызначэнне, асноўныя перавагі, праблемы, ліцэнзіі і прыклады праектаў.
🔗 Як укараніць штучны інтэлект у свой бізнес
Пакрокавая дарожная карта, інструменты, працоўныя працэсы і асноўныя элементы кіравання зменамі.
Кароткае вызначэнне: што такое прадузятасць штучнага інтэлекту?
Прадузятасць штучнага інтэлекту — гэта калі вынікі працы сістэмы штучнага інтэлекту сістэматычна спрыяюць або ўскладняюць пэўныя людзі ці групы. Часта гэта вынікае з незбалансаваных дадзеных, вузкага выбару вымярэнняў або больш шырокага кантэксту, у якім сістэма пабудавана і выкарыстоўваецца. Прадузятасць не заўсёды зламысная, але яна можа хутка павялічыцца, калі яе не кантраляваць. [1]
Карыснае адрозненне: прадузятасць — гэта перакос у прыняцці рашэнняў, а дыскрымінацыя — гэта шкодны ўплыў, які перакос можа выклікаць у свеце. Не заўсёды можна цалкам ліквідаваць прадузятасць, але трэба кіраваць ёю, каб яна не прыводзіла да несправядлівых вынікаў. [2]
Чаму разуменне прадузятасці насамрэч робіць вас лепшым 💡
Дзіўны погляд, праўда? Але веданне таго, што такое прадузятасць штучнага інтэлекту, дазваляе вам:
-
Лепшы ў дызайне — вы раней заўважыце далікатныя здагадкі.
-
Лепшае кіраванне — вы будзеце дакументаваць кампрамісы, а не проста адмаўляцца ад іх.
-
Лепш вядзе размовы — з кіраўнікамі, рэгулятарамі і людзьмі, якіх гэта тычыцца.
Акрамя таго, вывучэнне мовы паказчыкаў і палітыкі справядлівасці эканоміць час пазней. Шчыра кажучы, гэта як купляць карту перад падарожжам — недасканалую, але значна лепшую за вібрацыі. [2]
Тыпы прадузятасці штучнага інтэлекту, якія вы сапраўды ўбачыце ў дзікай прыродзе 🧭
Прадузятасць праяўляецца на працягу ўсяго жыццёвага цыклу штучнага інтэлекту. Распаўсюджаныя заканамернасці, з якімі сутыкаюцца каманды:
-
Зрушэнне выбаркі дадзеных — некаторыя групы недастаткова прадстаўлены або адсутнічаюць.
-
Прадузятасць этыкетак — гістарычныя этыкеткі кадуюць забабоны або шумныя чалавечыя меркаванні.
-
Зрушэнне вымярэння — паказчыкі, якія не адлюстроўваюць тое, што вы сапраўды шануеце.
-
Зрушэнне ацэнкі — тэставыя наборы не ахопліваюць пэўныя папуляцыі або кантэксты.
-
Зрушэнне разгортвання - добрая лабараторная мадэль, якая выкарыстоўваецца ў няправільных умовах.
-
Сістэмныя і чалавечыя прадузятасці — больш шырокія сацыяльныя заканамернасці і выбар каманды прасочваюцца ў тэхналогіі.
Карысная ментальная мадэль, распрацаваная арганізацыямі па стандартызацыі, класіфікуе прадузятасці па чалавечых, тэхнічных і сістэмных катэгорыях і рэкамендуе сацыяльна-тэхнічнае кіраванне, а не толькі карэкціроўку мадэлі. [1]
Дзе прадузятасць прабіраецца ў канвеер 🔍
-
Праблема фармулявання — занадта вузкае вызначэнне мэтавай аўдыторыі выключыць людзей, якім павінен служыць прадукт.
-
Крыніцы дадзеных — гістарычныя дадзеныя часта кадуюць мінулыя няроўнасці.
-
Выбар функцый — проксі-версіі для канфідэнцыйных атрыбутаў могуць узнавіць канфідэнцыйныя атрыбуты.
-
Навучанне — мэты аптымізуюць сярэднюю дакладнасць, а не справядлівасць.
-
Тэставанне — калі ваш набор меркаванняў скажоны, вашы паказчыкі таксама.
-
Маніторынг — змены ў карыстальніках або кантэксце могуць зноў выклікаць праблемы.
Рэгулятары падкрэсліваюць важнасць дакументавання рызык справядлівасці на працягу ўсяго жыццёвага цыклу, а не толькі падчас мадэлявання. Гэта практыка, у якой павінны ўдзельнічаць усе ўдзельнікі. [2]
Як нам вымераць справядлівасць, не ходзячы па крузе? 📏
Няма адной метрыкі, якая б кіравала ўсімі. Выбірайце ў залежнасці ад вашага выпадку выкарыстання і шкоды, якой вы хочаце пазбегнуць.
-
Дэмаграфічная роўнасць — паказчыкі адбору павінны быць аднолькавымі ва ўсіх групах. Добра падыходзіць для пытанняў размеркавання, але можа супярэчыць мэтам дакладнасці. [3]
-
Зраўняныя шанцы — узровень памылак, такіх як ілжывапазітыўныя і сапраўды станоўчыя вынікі, павінен быць падобным. Карысна, калі кошт памылак адрозніваецца ў залежнасці ад групы. [3]
-
Каліброўка — пры аднолькавай колькасці балаў вынікі павінны быць аднолькава верагоднымі ва ўсіх групах. Карысна, калі балы ўплываюць на рашэнні чалавека. [3]
Інструментарый робіць гэта практычным, вылічваючы прабелы, графікі і панэлі кіравання, каб вы маглі перастаць здагадвацца. [3]
Практычныя спосабы памяншэння прадузятасці, якія сапраўды працуюць 🛠️
Падумайце пра шматслаёвыя меры па змякчэнні наступстваў , а не пра адзіную чароўную кулю:
-
Аўдыт дадзеных і ўзбагачэнне — выяўленне прабелаў у ахопе, збор больш бяспечных дадзеных там, дзе гэта законна, выбарка дакументаў.
-
Перавага і перадыскрэтызацыя - адкарэктуйце размеркаванне навучання, каб паменшыць перакос.
-
Абмежаванні падчас апрацоўкі — дадайце мэты справядлівасці да мэты, каб мадэль непасрэдна вывучала кампрамісы.
-
Зніжэнне зрушэння ў залежнасці ад канкурэнцыі — навучайце мадэль такім чынам, каб адчувальныя атрыбуты нельга было прадказаць з унутраных прадстаўленняў.
-
Пасляапрацоўка — каліброўка парогаў прыняцця рашэнняў для кожнай групы, калі гэта мэтазгодна і законна.
-
Праверкі з удзелам чалавека — спалучайце мадэлі з тлумачальнымі зводкамі і шляхамі эскалацыі.
Бібліятэкі з адкрытым зыходным кодам, такія як AIF360 і Fairlearn, прапануюць як метрыкі, так і алгарытмы памяншэння рызык. Яны не чароўныя, але дадуць вам сістэматычную адпраўную кропку. [5][3]
Рэальны доказ таго, што прадузятасць мае значэнне 📸💳🏥
-
Аналіз твараў — шырока цытаваныя даследаванні дакументавалі значныя адрозненні ў дакладнасці паміж гендэрнымі і тыпамі скуры ў камерцыйных сістэмах, што падштурхоўвае да паляпшэння практыкі ацэнкі. [4]
-
Рашэнні з высокімі стаўкамі (крэдыт, найм, жыллё) — нават без намеру, прадузятыя вынікі могуць супярэчыць абавязкам справядлівасці і барацьбы з дыскрымінацыяй. Пераклад: вы адказваеце за наступствы, а не толькі за код. [2]
Кароткі анекдот з практыкі: падчас ананімнага аўдыту найму каманда выявіла прабелы ў заўвазе жанчын на тэхнічных пасадах. Простыя крокі — лепшая стратыфікацыя падзелаў, праверка функцый і ўстанаўленне парогаў для кожнай групы — большую частку разрыву запоўнілі з невялікім кампрамісам у дакладнасці. Ключ быў не ў адным прыёме; гэта быў паўтаральны цыкл вымярэння-змякчэння-маніторынгу.
Палітыка, права і кіраванне: як выглядае «добрае» 🧾
Вам не трэба быць юрыстам, але вам трэба распрацоўваць справядліва і тлумачальна:
-
Прынцыпы справядлівасці — арыентаваныя на чалавека каштоўнасці, празрыстасць і недыскрымінацыя на працягу ўсяго жыццёвага цыклу. [1]
-
Абарона дадзеных і роўнасць — калі гаворка ідзе пра персанальныя дадзеныя, чакайце абавязкаў адносна справядлівасці, абмежавання мэты і правоў асобы; таксама могуць прымяняцца правілы сектара. Загадзя вызначце свае абавязкі. [2]
-
Кіраванне рызыкамі — выкарыстоўвайце структураваныя структуры для выяўлення, вымярэння і маніторынгу прадузятасці ў рамках больш шырокіх праграм кіравання рызыкамі, звязанымі са штучным інтэлектам. Запішыце гэта. Праглядзіце гэта. Паўтарыце. [1]
Невялікі нюанс: папяровая апрацоўка — гэта не проста бюракратыя; гэта спосаб даказаць, што вы сапраўды выканалі працу, калі хтосьці спытае.
Параўнальная табліца: інструменты і фрэймворкі для барацьбы з прадузятасцю штучнага інтэлекту 🧰📊
| Інструмент або фрэймворк | Лепш за ўсё падыходзіць для | Кошт | Чаму гэта працуе... так бы мовіць |
|---|---|---|---|
| AIF360 | Спецыялісты па апрацоўцы дадзеных, якія жадаюць атрымаць метрыкі і змякчэнне наступстваў | Бясплатна | Шмат алгарытмаў у адным месцы; хуткае стварэнне прататыпаў; дапамагае вызначыць базавую інфармацыю і параўнаць выпраўленні. [5] |
| Фэрлерн | Каманды, якія балансуюць дакладнасць з абмежаваннямі справядлівасці | Бясплатна | Зразумелыя API для ацэнкі/змякчэння наступстваў; карысныя візуалізацыі; зручны для навучання з дапамогай scikit. [3] |
| Штучны інтэлект NIST (SP 1270) | Рызыка, адпаведнасць патрабаванням і лідэрства | Бясплатна | Агульная мова для кіравання чалавечымі/тэхнічнымі/сістэмнымі зрушэннямі і жыццёвым цыклам. [1] |
| Кіраўніцтва па ICO | Брытанскія каманды, якія апрацоўваюць персанальныя дадзеныя | Бясплатна | Практычныя кантрольныя спісы для вызначэння рызык справядлівасці/дыскрымінацыі на працягу ўсяго жыццёвага цыклу штучнага інтэлекту. [2] |
Кожны з іх дапамагае вам адказаць на пытанне, што такое прадузятасць штучнага інтэлекту ў вашым кантэксце, даючы вам структуру, метрыкі і агульную лексіку.
Кароткі, крыху неадназначны працоўны працэс 🧪
-
Вызначце шкоду, якой вы хочаце пазбегнуць — шкоду ад размеркавання рэсурсаў, дыспрапорцыі ў колькасці памылак, шкоду годнасці і г.д.
-
Выберыце метрыку, якая адпавядае гэтай шкодзе , напрыклад, зраўняныя шанцы, калі мае значэнне цотнасць памылак. [3]
-
Выканайце базавыя аналізы з выкарыстаннем сённяшніх дадзеных і мадэлі. Захавайце справаздачу аб справядлівасці.
-
Спачатку паспрабуйце выпраўленні з нізкім трэннем — лепшае падзеленне дадзеных, усталяванне парогаў або пераўзважэнне.
-
перанесці на этап абмежаванняў, якія знаходзяцца ў працэсе апрацоўкі.
-
Перагледзьце наборы, якія адмаўляюцца ад адказнасці і прадстаўляюць рэальных карыстальнікаў.
-
Маніторынг у вытворчасці — змены ў размеркаванні адбываюцца; панэлі кіравання таксама павінны адбывацца.
-
Кампрамісы ў дакументах — справядлівасць залежыць ад кантэксту, таму растлумачце, чаму вы абралі парітэт X замест парітэту Y. [1][2]
Рэгулятары і органы па стандартызацыі нездарма працягваюць падкрэсліваць важнасць жыццёвага цыклу. Гэта працуе. [1]
Парады па камунікацыі для зацікаўленых бакоў 🗣️
-
Пазбягайце тлумачэнняў толькі з выкарыстаннем матэматыкі — спачатку пакажыце простыя дыяграмы і канкрэтныя прыклады.
-
Выкарыстоўвайце простую мову — раскажыце, што мадэль можа зрабіць несправядліва і на каго гэта можа паўплываць.
-
Павярхоўныя кампрамісы — абмежаванні справядлівасці могуць паўплываць на дакладнасць; гэта не памылка, калі гэта памяншае шкоду.
-
Плануйце непрадбачаныя абставіны — як прыпыніць або адмяніць працу, калі ўзнікнуць праблемы.
-
Заклікайце да ўважлівага агляду — знешняя праверка або перавод у чырвоную каманду выяўляе сляпыя зоны. Нікому гэта не падабаецца, але дапамагае. [1][2]
Часта задаваныя пытанні: што такое прадузятасць штучнага інтэлекту на самой справе? ❓
Хіба прадузятасць не з'яўляецца проста дрэннымі дадзенымі?
Не толькі. Дадзеныя маюць значэнне, але і выбар мадэлявання, дызайн ацэнкі, кантэкст разгортвання і стымуляванне каманды — усё гэта ўплывае на вынікі. [1]
Ці магу я цалкам ліквідаваць прадузятасць?
Звычайна не. Ваша мэта — кіраваць прадузятасцю, каб яна не выклікала несправядлівых наступстваў — думайце пра скарачэнне і кіраванне, а не пра дасканаласць. [2]
Які паказчык справядлівасці мне выкарыстоўваць?
Выбірайце на аснове тыпу шкоды і правілаў дамена. Напрыклад, калі ілжывапазітыўныя вынікі больш шкодзяць групе, засяродзьцеся на парытэце частаты памылак (зраўняныя шанцы). [3]
Ці патрэбна мне юрыдычная экспертыза?
Калі ваша сістэма закранае магчымасці або правы людзей, так. Правілы, арыентаваныя на спажыўцоў і роўнасць, могуць прымяняцца да алгарытмічных рашэнняў, і вам трэба паказаць сваю працу. [2]
Заключныя заўвагі: занадта доўга, не чытаў 🧾✨
Калі хтосьці спытае вас, што такое прадузятасць штучнага інтэлекту , вось вам просты адказ: гэта сістэматычнае перакос у выніках працы штучнага інтэлекту, які можа прывесці да несправядлівых наступстваў у рэальным свеце. Вы дыягнастуеце яго з дапамогай адпаведных кантэксту метрык, змякчаеце яго з дапамогай шматслаёвых метадаў і кіруеце ім на працягу ўсяго жыццёвага цыклу. Гэта не адна памылка, якую трэба выправіць — гэта пытанне прадукту, палітыкі і людзей, якое патрабуе пастаяннага барабаннага бойку вымярэнняў, дакументацыі і пакоры. Думаю, няма чарадзейнай кулі... але ёсць прыстойныя кантрольныя спісы, сумленныя кампрамісы і лепшыя звычкі. І так, некалькі эмодзі ніколі не перашкодзяць. 🙂
Спасылкі
-
Спецыяльная публікацыя NIST 1270 — Да стандарту для выяўлення і кіравання прадузятасцю ў штучным інтэлекце . Спасылка
-
Офіс інфармацыйнага камісара Вялікабрытаніі - А як наконт справядлівасці, прадузятасці і дыскрымінацыі? Спасылка
-
Дакументацыя Fairlearn — агульныя паказчыкі справядлівасці (дэмаграфічны парытэт, ураўнаваныя шанцы, каліброўка). Спасылка
-
Буаламвіні, Дж. і Гебру, Т. (2018). Гендэрныя адценні: міжсекцыйныя адрозненні ў дакладнасці ў камерцыйнай гендэрнай класіфікацыі . FAT* / PMLR. Спасылка
-
IBM Research - Прадстаўляем AI Fairness 360 (AIF360) . Спасылка