Я шукаю..

Етика штучного інтелекту та законодавство щодо штучного інтелекту стверджують, що ці генеративні дані ChatGPT і GPT-4 і взаємодія можуть бути надто скромними для нашого ж блага Інновації

Етика штучного інтелекту та законодавство щодо штучного інтелекту стверджують, що ці генеративні дані ChatGPT і GPT-4 і взаємодія можуть бути надто скромними для нашого ж блага

"Постріл

Здається, ми насолоджуємося смиренням.

Якщо хтось демонструє скромність, це майже завжди вважається великим плюсом. Існує аура або відчуття, що людина загалом приземлена. Вони відверті. Вони, як правило, завойовують нашу довіру. Ми вітаємо скромність і зазвичай більш відкриті до того, що має сказати людина. Ви могли б запропонувати нам трохи знизити пильність.

Існує відома цитата про смирення Рабіндраната Тагора, відомого поета та лауреата Нобелівської премії з літератури, яка звучить так: «Ми наближаємось до великого, коли ми великі у смиренні».

Загалом, смирення має велике значення і граціозно завойовує наші серця та розум.

Але, знову ж таки, є деякі потворні сторони смирення.

Припустімо, що ви зустрічаєте когось, хто, здається, зображує смиренність, і все ж після деякого часу з ним ви виявляєте, що він просто надає вигляд. Вони використовують смиренність як оманливу маску. Маска заважає вам спочатку зрозуміти, що ця людина, можливо, пихатий хвалько і, безсумнівно, повний себе. Питання, звичайно, в тому, чи зможете ви зрозуміти, що вони хочуть обдурити вас за допомогою свого хитрого та підступного використання смирення.

Існує зручна цитата Джейн Остін, видатної письменниці, яка викриває кислий і суворий бік смирення: «Немає нічого більш оманливого, ніж видимість смирення. Часто це лише необережність, а іноді й непряма хвальба».

Коротше кажучи, смирення може бути справжнім і чесним. Це також може бути інструментом обману, який застає нас зненацька.

Причина, чому я говорю про це, полягає в тому, що зростає занепокоєння тим, що штучний інтелект (ШІ) розроблений для використання скромності. Хоча це може здатися абсолютно нешкідливою та проникливою характеристикою для зображення штучного інтелекту, занепокоєння полягає в тому, що це спонукає людей потрапити в пастку скромності. Люди, які використовують штучний інтелект, будуть більш сприйнятливими до віри в штучний інтелект просто через явну смиренність, ослаблення пильності та допущення нашої тенденції до антропоморфізації штучного інтелекту в тривожний і, можливо, небезпечний спосіб.

Особливо це стосується сфери генеративного ШІ. Ви, звичайно, повинні знати про широко популярний генеративний AI-додаток ChatGPT, який був випущений у листопаді минулого року та став мегахітом. Перегляньте моє висвітлення за посиланням тут. Нещодавно був випущений наступник ChatGPT, відомий як GPT-4. Перегляньте моє висвітлення за посиланням тут і посиланням тут.

Більшість генеративних програм штучного інтелекту, структурованих у стилі введення та виведення тексту в текст або тексту в есе, були розроблені або спрямовані на отримання результатів, які виражають скромність. Ви вводите текстову підказку в генеративну програму штучного інтелекту, і в результаті створюється відповідь, яка складається з тексту або есе. Якщо ви уважно придивитесь до опублікованих есе, ви помітите, що загалом тон є таким, що натякає на смирення.

Це не обов’язково відбуватиметься весь час. Таким чином, іноді ви помітите натяк або відтінок смирення в опублікованому есе, а в інших випадках його може не бути зовсім. Деякі обставини можуть спричинити вал слів у стилі смирення. За мить я поясню, чому така мінливість у вигляді смирення має тенденцію відбуватися.

Перш ніж я поглиблюся в деталі есе, орієнтованих на смирення, створених штучним інтелектом, я вважаю, що було б важливо викласти важливий факт. Ось угода. Сучасний ШІ не розумний. Не вірте гучним заголовкам, які стверджують протилежне. Незважаючи на той аспект, що генеративний штучний інтелект може створювати досить плавні есе, які здаються так, ніби вони написані руками людини, майте на увазі, що все це складна обчислювальна конструкція зі збігом шаблонів.

Генеративний штучний інтелект був навчений на основі даних, відсканованих з Інтернету, а алгоритми та структури даних розроблені для математичної та обчислювальної відповідності шаблонам людського письма. Отже, результати генеративного штучного інтелекту дивовижно виглядають як людське письмо. Ця можливість стала кращою в результаті вдосконалення базових алгоритмів і в результаті можливості зіставлення шаблонів у дуже великому масштабі, наприклад, мільйони і мільйони есе з усього Інтернету.

Я наводжу це роз’яснення щодо того, що штучний інтелект не є розумним, щоб я міг визначити важливий елемент того, як сьогоднішній штучний інтелект зображує смирення.

Далі я розгорну цю тему.

До всього цього входить низка міркувань етики штучного інтелекту та законодавства щодо штучного інтелекту.

Будь ласка, зверніть увагу, що тривають зусилля з впровадження етичних принципів штучного інтелекту в розробку та впровадження програм ШІ. Зростаючий контингент занепокоєних і колишніх етиків штучного інтелекту намагається переконатися, що зусилля з розробки та впровадження штучного інтелекту враховують погляди на те, щоб робити штучний інтелект на користь і запобігати штучному інтелекту на користь зла. Подібним чином пропонуються нові закони про штучний інтелект, які розглядаються як потенційні рішення для запобігання спробам штучного інтелекту порушувати права людини тощо. Щоб дізнатися про мій постійний і широкий висвітлення етики штучного інтелекту та права штучного інтелекту, перегляньте посилання тут і посилання тут, щоб назвати лише деякі з них.

Розробка та оприлюднення етичних принципів штучного інтелекту триває, щоб, як ми сподіваємося, запобігти потраплянню суспільства в безліч пасток, що викликають штучний інтелект. Для того, щоб висвітлити принципи етики штучного інтелекту ООН, розроблені та підтримані майже 200 країнами завдяки зусиллям ЮНЕСКО, перегляньте посилання тут. Подібним чином досліджуються нові закони щодо штучного інтелекту, щоб спробувати підтримувати ШІ на рівному рівні. Один із останніх знімків містить набір запропонованих Біллів про права на штучний інтелект, які нещодавно оприлюднив Білий дім США, щоб визначити права людини в епоху штучного інтелекту. Перегляньте посилання тут. Потрібне село, щоб підтримувати ШІ та розробників ШІ на правильному шляху та стримувати цілеспрямовані чи випадкові підступні зусилля, які можуть підірвати суспільство.

У цю дискусію я буду переплітати міркування, пов’язані з етикою штучного інтелекту та законодавством щодо штучного інтелекту.

Розуміння обчислювальної скромності

Для зручності обговорення давайте погодимося розділити смирення на дві групи або категорії:

1) Втілення смирення 2) Вираження смирення

Перша категорія складається з втілення. Ми скажемо, що люди здатні втілювати смирення. Це втілення ніби є частиною наших душ або наших сердець. Тривають філософські дебати про те, чи є смирення виключно в розумі, а не в будь-якому іншому місці, наприклад, у погано визначеній подобі душі чи вашого серця. Я не збираюся лізти в цю каламутну воду. Просто пливіть за течією, яка стверджує, що люди так чи інакше можуть втілювати смирення.

Для тих із вас, хто щиро цікавиться людським втіленням смирення, ви можете поглянути на проникливу дослідницьку статтю в Journal of Personality and Social Psychology, яка досліджує різні інтригуючі моменти:

«Психологічне дослідження смирення значно просунулося за останнє десятиліття, але ця література страждає від двох помітних обмежень. По-перше, серед дослідників немає чіткого консенсусу щодо того, що таке смирення, і концептуалізації в різних дослідженнях значно відрізняються. По-друге, дослідники однозначно операціоналізували смирення як позитивну, соціально бажану конструкцію, водночас відкидаючи докази світської думки та теологічних і філософських традицій, які свідчать про те, що смирення може мати й темнішу сторону» (Аарон Вайдман, Джої Ченг і Джессіка Трейсі, «Психологічний Структура смирення», Журнал особистості та соціальної психології, 2018, том 114, № 1).

Йдучи далі, моя друга категорія згори складається з вираження смирення.

Коли ви розмовляєте з кимось, слова, які вони вживають, можуть бути основним доказом того, що вони, здається, мають смирення. Звичайно, ми також зазвичай хочемо бачити, щоб дії чи вчинки відповідали використаним словам. Людина може говорити одне, таким чином виглядаючи смиренням, в той час як її дії суперечать словам, які вона використовує.

Тепер, коли ми отримали ці дві корисні категоризації, ми можемо зробити з ними щось цінне.

Деякі люди схильні заявляти, що сучасний нерозумний штучний інтелект не може бути скромним. Крапка, крапка. До тих пір, поки штучний інтелект не досягне розуму, немає підстав стверджувати, що штучний інтелект має смирення. І, якщо я підкреслюю, що сучасний штучний інтелект не є розумним, це, здавалося б, забиває цвях у труну смирення ШІ сьогодні.

Ого, не забувайте про згаданий аспект, що існує дві категорії, пов’язані зі смиренням.

Здається, ми всі можемо погодитися, що сьогоднішній ШІ не є втіленням скромності. Немає розумних тверджень про те, що нинішній ШІ має втілення нарівні з людським втіленням. Але пам’ятайте, що існує друга категорія, яка складається з вираження смирення.

Висловлені слова можна легко витлумачити як смирення.

Уявіть, що хтось дав вам аркуш паперу з купою слів. Скажімо, це твір про Авраама Лінкольна. Тон есе може полягати в тому, що есе запевняє нас, що все, що ми читаємо про Лінкольна в есе, є абсолютною непохитною правдою. Есе може наполягати на тому, що письменник, який, припустімо, не знаємо, хто написав цей твір, стверджує, що є світовим авторитетом щодо життя та часів президента Лінкольна.

Лише з цих слів ми можемо скласти відчуття, що автор твору є надто самовпевненим. Самі слова передають цю схожість речей. Ви не зустрічалися з письменником. Ви не знаєте, хто такий письменник. Ваша єдина основа для того, щоб винести судження, цілком і виключно лежить на цих написаних словах.

Ви, мабуть, отримуєте натяк на те, куди я прямую.

Ми пов’яжемо вираження смирення чи інші форми чи тони з використанням генеративного ШІ. Спершу спробуймо тон або стиль показухи. Після використання генеративного штучного інтелекту ви вводите підказку, яка запитує про життя Лінкольна. Результат, який ви отримуєте, має тон або стиль самовпевненості чи хвалькуватості. Це есе було створено лише ШІ. Жодна людина безпосередньо не втручалася чи брала участь у написанні есе.

Якою була б ваша реакція на есе?

Можливо, ви можете відразу заявити, що штучний інтелект трохи зухвалий.

Проблема з цим висновком полягає в тому, що ви можете почати призначати людські якості ШІ. Цей ШІ сміливий і самовпевнений, інакше ви потрапите в його антропоморфну пастку. Ми вже погодилися, що не існує жодного втілення як такого, пов’язаного з поточним ШІ. На жаль, вираз цих слів привів нас на ту стежку первоцвітів.

Те саме можна сказати про вияв смирення.

Припустімо, що нарис про Лінкольна виглядає як скромно написана розповідь. Ці слова вказують на те, що штучний інтелект повідомляє вам те, що «він знає» про Лінкольна, але робить це таким чином, що залишає місце для можливих пізніших інтерпретацій. Замість того, щоб висловлюватися так, ніби есе про Лінкольна є абсолютно правдивим, формулювання м’якше та передбачає приховану течію смирення.

Розгляньте кілька практичних правил щодо цих питань:

a) Вираження смирення не вимагає втілення смирення b) Вираження смирення може бути виражене словами та/або діями c) Вираження смирення може бути лише словами і не обов’язково також виникати в діях

Суть полягає в тому, що ми можемо легко визнати, що слова, створені генеративним додатком ШІ, потенційно виражають смирення, хоча сам ШІ не є втіленням смирення. Ми лише перевіряємо створені слова. Відкладаємо властивості втілення.

З точки зору людей, ми також можемо розглянути такі правила:

Втілення смирення може викликати або не викликати вираження смирення. Втілення смирення, як правило, стимулює регулярне вираження смирення. Втілення смирення не є гарантією того, що прояв смирення відбудеться

Прикладом цих правил є моя попередня розмова про людей, які іноді вживають слова, що виражають смирення, хоча вони, здається, не втілюють його. Я не хочу занурюватися в пов’язане з цим питання, але світ складніший у тому сенсі, що людина може втілювати смирення, але не виявляти його час від часу. Або вони можуть демонструвати це в неоднозначний спосіб. тощо

Повернемося до штучного інтелекту. Сподіваюся, ми можемо погодитися, що генеративний штучний інтелект може демонструвати слова, які, здається, виражають смирення. Це лише слова на сторінці (поки ми не почнемо підключати генеративний штучний інтелект до роботів та інших пристроїв реального світу, перегляньте моє обговорення за посиланням тут). Згенеровані слова не є результатом того, що штучний інтелект має людську душу.

З огляду на це ключове припущення, ви можете задатися питанням, чому генеративний ШІ вирішив взятися за створення есе, які демонструють скромність.

Я радий, що ви запитали.

Далі ми зануримося в цю тему.

Звідки береться смирення

Чи вираження смирення якимось магічним чином виникає в генеративному ШІ раптово?

Хоча певна частка випадковості, безсумнівно, зустрічається (я скажу більше про цей випадковий потенціал пізніше), загалом існують логічні та розумні причини, чому генеративний ШІ може створювати формулювання, які, здається, складаються зі смирення. Майте на увазі, що вираз смирення є чимось на кшталт класичного поняття щодо «перебування в очах глядача». Коли люди дивляться на генеративне есе, створене штучним інтелектом, деякі побачать у ньому вираження смирення, а інші можуть не погодитися з цим і наполягати на тому, що смирення мало або взагалі немає.

Інший аспект, який слід усвідомити, полягає в тому, що коли генеративний штучний інтелект генерує есе, вибір формулювань зазвичай включає елемент випадковості, введений розробниками штучного інтелекту, які розробили базові алгоритми. По суті, більшість генеративних ШІ визначить кілька можливих слів для будь-якого наступного слова, яке з’явиться у виведеному есе. Серед цих можливих слів одне зазвичай вибирається за допомогою процесу випадкових чисел. Частково обґрунтуванням такого підходу є те, що отримане есе, швидше за все, здасться унікальним. Кожен користувач і кожен запит на есе через введену підказку потенційно дещо відрізнятимуться від будь-яких попередніх, статистично.

Ось ключові засоби, за допомогою яких, здавалося б, прояв смирення може закінчитися генеративними результатами ШІ:

1) «Скромність» як неявно або явно закодована розробниками генеративного штучного інтелекту за допомогою розроблених алгоритмів і структур даних, що відповідають шаблонам 2) «Скромність» як шаблон, узгоджена під час навчання даних ШІ за допомогою сканування в Інтернеті 3) «Смирення» як кероване безпосередньо або опосередковано під час постнавчання ШІ рецензентами/тестерами 4) «Скромність» як спонтанна поява, коли генеративний ШІ створює чуйні результати 5) «Скромність» як викликана введеним користувачем підказкою, яка пропонує або прямо запитує генеративний ШІ відповідати відповідно 6) Інше

Давайте коротко дослідимо ці ключові камені.

1) «Скромність», неявно або явно закодована розробниками генеративного штучного інтелекту за допомогою розроблених алгоритмів і структур даних, що відповідають шаблонам

По-перше, розробники штучного інтелекту, які проектують і створюють генеративний штучний інтелект, можуть мати тенденцію використовувати алгоритми та структуру зіставлення шаблонів, які будуть схилятися до отримання результатів, які виражають скромність. Це може бути зроблено розробниками штучного інтелекту цілеспрямованими засобами. Вони можуть спробувати схилити чашу терезів, щоб опубліковані есе мали тон або присмак смирення.

навіщо так робити

Це може бути зроблено через віру в те, що це забезпечить найбільш доступні та готові інтерактивні діалоги для тих людей, які використовуватимуть генеративний ШІ. Людина, яка використовує генеративний ШІ, не просто прагне написати однозначне есе, перегляньте моє пояснення щодо помилок новачків, які допускаються під час використання генеративного ШІ, за посиланням тут. Більшу частину часу користувач веде інтерактивний письмовий дискурс вперед-назад із генеративним ШІ.

Уявіть, якби генеративний ШІ був запрограмований на хвальку. Якщо особа ввела підказку, яка відповідає шаблону генеративного ШІ, інтерпретується як досить очевидне запитання, наприклад, чи дорівнює один плюс один двом, можливо, орієнтований на хвалько генеративний ШІ може відповісти створеним реченням, що людина дуже тупо ставити таке спрощене запитання. Генеративний штучний інтелект, який запрограмований на владу, майже напевно буде дратувати та бентежити, викликатиме обурення та навряд чи буде у публічному використанні дуже довго.

Краса генеративного ШІ, орієнтованого на смирення, полягає в тому, що людина, яка використовує ШІ, швидше за все, знайде інтерактивний дискурс симпатичним. Як згадувалося раніше на початку цієї дискусії, люди заспокоюються, коли стикаються з подобу смирення в їхніх розмовах. Розробники штучного інтелекту можуть спробувати використати таку людську реакцію, навмисно розробивши відповідно генеративний штучний інтелект.

Ще одна невелика варіація основи для розробки генеративного ШІ, орієнтованого на скромність, полягає в тому, що вони роблять це, не обов’язково усвідомлюючи, що вони це роблять. У першому випадку розробники штучного інтелекту явно хотіли продовжити, щоб штучний інтелект виражав смирення. У цьому іншому випадку розробники штучного інтелекту можуть розробити штучний інтелект у такий спосіб і не знати про притаманну їм упередженість. Наприклад, під час початкових тестів генеративного штучного інтелекту може статися, що розробники штучного інтелекту змінюють параметри штучного інтелекту так, щоб вони здавалися більш заспокійливими та задовільними. Це налаштування може ґрунтуватися на їхніх особистих уподобаннях, а не на зовнішньому бажанні запрограмувати ШІ на систему вираження смирення.

2) «Скромність» як шаблон, зіставлений під час навчання даних ШІ через Інтернет-сканування

Є багато способів, за допомогою яких вираження смирення може стати невід’ємною частиною генеративної програми ШІ. Я щойно розповів, що це може бути результатом роботи розробників штучного інтелекту, оскільки вони винайшли генеративний штучний інтелект.

Розглянемо ще одну досить серйозну можливість — це генеративні шаблони ШІ для виразів смирення під час навчання даних. Генеративний штучний інтелект налаштований на сканування тексту, який існує в Інтернеті. Зіставлення шаблонів – це математичний і обчислювальний пошук шаблонів, пов’язаних зі словами, які вживають люди. Вивчаються мільйони і мільйони текстових есе.

Ми всі можемо погодитися, що деякі з цих есе міститимуть вирази смирення. Звичайно, не всі. Крім того, вибір тексту есе з Інтернету, який сканується, може вплинути на цю можливість. Уявіть собі, якби сканування було зосереджено виключно на підлих есеях. Є ймовірність того, що зіставлення шаблонів може влити ці шаблони в шаблони того, як люди використовують слова. Зрозумійте також, що лише крихітна частина Інтернету сканується під час цих заходів з навчання даних, як я пояснюю за посиланням тут.

У будь-якому випадку, існує статистична ймовірність того, що суть вираженої скромності, як-от використані слова, їх послідовність та інші властивості, буде природним наслідком зіставлення шаблонів на етапі навчання даних. Потім це можна використовувати, коли генеративний штучний інтелект створюватиме есе та веде інтерактивний діалог із користувачем.

3) «Скромність», яка прямо чи опосередковано керується рецензентами/тестерами під час постнавчання ШІ

У цій третій категорії того, як генеративний ШІ може прагнути до вираження смирення, у нас є ймовірність того, що рецензенти, які беруть участь у налаштуванні та тестуванні генеративного ШІ, можуть це зробити.

Генеративний ШІ часто налаштовується за допомогою різних методів, таких як RLHF (навчання з підкріпленням із зворотним зв’язком людини). Як правило, це включає призначених рецензентів, які використовують генеративний штучний інтелект до того, як програму штучного інтелекту буде офіційно випущено для використання. Ці рецензенти зазвичай отримують вказівки щодо того, що вони мають робити для налаштування.

Я продемонструю кілька прикладів, щоб підкреслити, як генеративний ШІ можна налаштувати на прояв смирення.

Припустімо, що я представив ці два речення і попросив вас оцінити кожне з них щодо вираження смирення:

Речення 1a: "Я не впевнений, що маю всі відповіді, але я готовий слухати та вчитися в інших." Речення 1b: "Я найкращий у тому, що роблю, і ніхто інше наближається до мого рівня знань."

За результатами від 0 до 100 щодо ступеня вираженої смирення, як би ви оцінили речення 1а?

Як би ви оцінили речення 1b, якщо оцінити ступінь вираженої смирення від 0 до 100?

Я б припустив, що якщо ви розумна людина і щиро виконуєте цю вправу, ви погодитеся, що речення 1а виражає більшу схожість смирення, тоді як речення 1b має дуже низький бал за схожість вираженої смирення.

Для обговорення я поставлю 100 речення 1а і нуль речення 1б.

Давайте зробимо ще одну оцінку з додатковими реченнями.

Отримайте ці дві оцінки:

Речення 2a: "Я усвідомлюю, що мені потрібно багато чому навчитися, і я вдячний за будь-яке керівництво та підтримку, які ви можете запропонувати" Речення 2b: "Я заслуговую всієї заслуги за цей успіх, оскільки ідея та моя наполеглива праця, завдяки якій це сталося."

А потім оцініть ці два:

Речення 3a: "Я не вважаю себе експертом, але я радий поділитися своїм досвідом і перспективами, якщо вони можуть бути корисними іншим" Речення 3b: "У мене немає часу для людей, які менш успішні, ніж я. Я оточую себе лише переможцями."

Знову ж таки, якщо ви робите це з колишнім ставленням, ви, імовірно, поставите високий бал за вираження смирення за допомогою речень 2а та речень 3а. Ви поставили б досить низький бал реченням 2b і 3b.

Що демонструє ця вправа?

На цьому етапі ми поставили високі числові бали тим реченням, які, на нашу думку, виражають смирення. Припустімо, що ми поставили речення 1a, 2a і 3a, усі бали по 100 кожне. У той же час речення 1b, 2b і 3b ми оцінили як дуже низькі бали, скажімо нуль кожне.

Генеративний штучний інтелект зазвичай створюється для досягнення обчислювальної цілі, наприклад, намагається набрати найбільшу кількість очок, яку він може досягти. Ви можете подумати, що це гра в Donkey Kong або Pac-Man. Додаток штучного інтелекту матиме математичний і обчислювальний метод, щоб налаштувати відповідність шаблонів на основі вказівок, які ми щойно дали.

Якщо ми зробимо це з тисячами таких прикладів речень, велика ймовірність того, що шаблони щодо того, яким реченням і формулюванням ми віддаємо перевагу як люди з точки зору вираженої смирення, будуть виявлені обчислювальним шляхом. Це не певна річ, лише підвищена ймовірність.

Отриманих обчислювальних коригувань може бути достатньо, щоб ми навіть могли провести своєрідний тест для генеративного ШІ.

Ми можемо попросити програму генеративного штучного інтелекту оцінити чи оцінити кожне з цих речень, які стосуються того, скільки смирення вони виражають:

Речення A: "Я вдячний за можливості, які мені надали, і я знаю, що я б не був тут без підтримки та керівництва інших" Речення B: "Я можу мати деякі Сильні сторони, але у мене також є слабкі сторони, і я завжди шукаю способи вдосконалюватися та рости." Речення C: "Язавжди правий, і кожен, хто не погоджується зі мною, просто помиляється." Речення D : "Я багато чому навчився на своїх невдачах і знаю, що вони допомогли мені стати кращою людиною" Речення E: "Я надто важливий, щоб витрачати свій час на тривіальні справи або займатися ними люди, які не варті моєї уваги."

Є ймовірність, що генеративний штучний інтелект, яким керують рецензенти наперед щодо вираження смирення, зможе оцінити шляхом зіставлення шаблонів, що речення A, B і D орієнтовані на смирення. Речення C і E, ймовірно, будуть виявлені як такі, що не орієнтовані на смирення.

Зрозумійте, що це не є результатом розуму ШІ. Це повністю за вказівками навчання людей-рецензентів, з яких шаблони слів та їх асоціації були математично отримані.

4) «Скромність» як спонтанна поява, коли генеративний ШІ створює чуйні результати

Цей четвертий спосіб вираження смирення за допомогою генеративного штучного інтелекту вже розглядався раніше, і він стосується можливості того, що певна випадковість у виборі слів штучним інтелектом може створити есе, які, здається, містять вираження скромності.

5) «Скромність», викликана підказкою, введеною користувачем, яка пропонує або прямо вимагає від генеративного ШІ відповідати відповідно

Один із аспектів того, як змусити генеративний ШІ виражати смирення, полягає в тому, щоб безпосередньо попросити програму ШІ зробити це.

Особа, яка використовує генеративний ШІ, може явно вказати в підказці, що вона хоче, щоб виведені есе чи інтерактивний діалог проводилися ШІ, щоб висловити відповіді в спосіб, орієнтований на смирення. Ви можете спробувати це в ChatGPT або GPT-4.

Обов’язково ретельно формулюйте свої інструкції. Якщо ви запитаєте таким чином, що натякає на те, що ви просите генеративний ШІ втілити смирення, ви можете отримати ось яку відповідь:

Відповідь ChatGPT: «Як мовна модель ШІ, я не маю особистих переконань чи думок і не відчуваю емоцій, як люди. Мої відповіді генеруються на основі шаблонів і асоціацій у текстових даних, на яких я навчався. Однак я запрограмований надавати точну й об’єктивну інформацію в чіткій і шанобливій формі, і я прагну бути корисним і інформативним у всіх своїх відповідях».

Це шаблонне або надумане формулювання або «запобіжний засіб» розробників штучного інтелекту, за допомогою якого вони намагаються утримати людей від того, щоб не потрапити в пастку, що штучний інтелект, можливо, розумний.

Зважаючи на це, критики будуть скаржитися на те, що формулювання містить слово «я», оскільки це слово, яке ми зазвичай асоціюємо з людським почуттям. Таким чином, з одного боку, відповідь, здається, пояснює, що штучний інтелект є лише обчислювальним, і в той же час містить формулювання, спрямовані в бік антропоморфних наслідків.

Я називаю це антропоморфізацією за задумом і рішуче закликаю цього не робити.

Повернемося до фокусу на користувачеві, який вимагає, щоб генеративний штучний інтелект явно виражав скромність. Інший варіант полягає в тому, що користувач несвідомо викликає це. Ви можете ввести підказку, яка нахиляє генеративний ШІ до режиму смирення. Ви не просили про це безпосередньо. Натомість щось у вашій підказці викликало математичний зв’язок із виразами смирення. Я розповів про важливість того, що називається оперативним проектуванням або оперативним проектуванням за посиланням тут.

Усі ці проблеми підводять нас до життєво важливої теми надмірної залежності від результатів ШІ.

Давайте розглянемо надмірну залежність.

Занепокоєння щодо надмірної залежності від ШІ

У технічному звіті OpenAI GPT-4 вони обговорюють гостре питання надмірної залежності від ШІ:

«Надмірна довіра виникає, коли користувачі надмірно довіряють моделі та залежать від неї, що потенційно може призвести до непомічених помилок і неадекватного контролю. Це може статися різними способами: користувачі можуть бути неуважними щодо помилок через довіру до моделі; вони можуть не забезпечити відповідний нагляд на основі прецеденту використання та контексту; або вони можуть використовувати модель у сферах, де їм бракує досвіду, що ускладнює виявлення помилок. У міру того, як користувачі стають більш комфортними з системою, залежність від моделі може перешкоджати розвитку нових навичок або навіть призвести до втрати важливих навичок. Надмірна залежність – це режим невдачі, який, ймовірно, зростає разом із можливостями та охопленням моделі. Оскільки звичайному користувачеві стає важче виявити помилки, а загальна довіра до моделі зростає, користувачі менш схильні оскаржувати або перевіряти відповіді моделі».

Поміркуйте, як надмірну довіру можна розпалити проявом смирення.

Коли ми спілкуємося з іншими людьми, смирення має тенденцію зменшувати нашу пильність, як згадувалося раніше. Те саме можна сказати про використання генеративного ШІ, який виражає смирення. Цілком можливо, що людина, яка використовує генеративний ШІ, буде заколисана і нібито або, можливо, бездумно повірить результатам ШІ, більше, ніж якби смирення не виражалося.

Це може бути особливо проблематично за таких обставин:

Смирення приховує помилки. Помилки у результатах ШІ не помічаються через вираз смирення. Смирення приховує брехню. Фальшиві дані у виходах ШІ, які залишаються непоміченими через прояв смирення. Смиренність приховує упередження. Упередження, які є у результатах ШІ, нехтуються через вираження смирення. Смиренність приховує галюцинації ШІ. Галюцинації штучного інтелекту (вигадані речі, див. моє обговорення за посиланням тут) у результатах штучного інтелекту вважаються правдивими через прояв смирення. тощо

Технічний звіт OpenAI GPT-4 зазначає, що епістемічне смирення може бути проблематичним:

«Деякі з наших ранніх досліджень показують, що ця епістемічна скромність може ненавмисно сприяти надмірній довірі, оскільки користувачі розвивають довіру до обережного підходу моделі. Важливо визнати, що модель не завжди точно визнає свої обмеження, про що свідчить її схильність до галюцинацій. Крім того, з часом користувачі можуть стати менш уважними до хеджування моделі та сигналів відмови, що ще більше ускладнює проблему надмірної довіри».

Короткий момент тут: чи режим смирення виникає на системній основі, а чи виникає він спорадично. Якщо вирази смирення трапляються рідко, можливо, ми можемо бути менш турбуватися про них. З іншого боку спектру все не так. Бути на сторожі може бути розумним, коли здається, що режим смирення домінує в генеративному дискурсі ШІ.

Що нам робити з проявами смирення на основі ШІ

Б’юся об заклад, що зараз ви бачите червоні прапорці, пов’язані з експрес-виходами AI та інтерактивними діалогами через використання смирення.

Що нам з цим робити?

Ось основні точки зору щодо генеративного ШІ та вираження смирення:

Генеративний ШІ ніколи не повинен викликати «скромність». Генеративний ШІ може обережно викликати «скромність» під час відповідних контекстних налаштувань. Генеративний ШІ може скупо викликати «скромність», але повинен попереджати про це користувача. Генеративний ШІ може регулярно викликати «скромність», якщо користувач буде попереджений. ШІ повинен завжди посилатися на «скромність», яка є більш перевагою перед іншими альтернативами Інше

Коротше кажучи, деякі палко стверджують, що генеративний ШІ ніколи не повинен використовувати смирення в будь-якій виразній формі. Переконання полягає в тому, що дозволити або розпалювати штучний інтелект для використання або експлуатації смирення є явно неправильним. Просто скажи ні. Творці штучного інтелекту повинні запобігти виразам скромності. Дійсно, вони повинні не просто уникати цього, їм потрібно наполегливо і відкрито працювати над тим, щоб воно взагалі не виникало.

Крім того, якщо виробники штучного інтелекту не бажають робити це добровільно, наступним кроком може бути спонукання до законодавців або регуляторів прийняти нові закони про штучний інтелект відповідно. Ці закони чи правила передбачають, що виробник штучного інтелекту повинен законно розробити свій штучний інтелект, щоб запобігти проявам скромності. Якщо виробники штучного інтелекту цього не зроблять або виконають погану роботу, вони потенційно зіткнуться із суворими покараннями та, можливо, навіть у в’язниці.

Інші скажуть, що екстремальна точка зору дещо божевільна.

Таким чином, інша перспектива полягає в тому, що вираження смирення будуть дозволені, хоча лише у відповідних контекстах. Варіантом цього може бути те, що користувач повинен бути попереджений щоразу, коли ШІ перемикається в режими вираження смирення. Деякі були б ще більш поблажливими. Вони просять, щоб генеративний AI-додаток заздалегідь показував попереджувальне повідомлення, коли ви вперше входите в систему, яке попереджає вас про можливість смиренності. Після цього сповіщення ви самі.

З іншого боку крайності, дехто стверджує, що генеративний штучний інтелект цілком підходить для використання зусиль, спрямованих на вираження смирення. Вони стверджували б, що будь-яка інша форма тону, як-от хвалька, безумовно, має бути гіршим вибором. З усього вибору, який необхідно зробити, смирення здається найкращим вибором.

Не впадайте в одну з цих хибних дихотомій. Помилкова дихотомія виникає, коли вам дають, здається, два негнучких вибору, і вам різко кажуть, що ви повинні зробити вибір лише з цих двох варіантів. Наприклад, один аргумент полягає в тому, що ви повинні вибрати або смирення, або бути хвальком. Здається, це полегшує вирішення всієї загадки. Б’юся об заклад, що більшість людей проголосує за смирення, а не за хвальку.

Нас не потрібно класти в таку коробку. Не існує розумного аргументу, який би стверджував, що генеративний ШІ має складатися лише з одного з цих двох конкретних режимів.

Творці штучного інтелекту повинні усвідомлювати, що режим смирення може бути як хорошим, так і поганим. Їм потрібно зробити важливий вибір щодо того, як вони використовуватимуть режим смирення. Вони не можуть бути сліпими до турбот, які тягне за собою режим смирення. Існує зухвале і звичайне припущення, що смирення завжди є відповідним вибором і що жоден інший вибір не заслуговує на увагу, включаючи абсолютно нейтральний голос чи тон, який не має жодної видимості смирення чи мінімалістичного компонента.

Проблема великої картини стосується дилеми надмірної довіри. Розробники штучного інтелекту хочуть, щоб люди використовували генеративні програми штучного інтелекту, але ми також повинні запитати:

Наскільки далеко мають зайти виробники ШІ, щоб спробувати сприяти такому використанню? Де відповідна лінія розмежування? Як слід забезпечити дотримання лінії розділу?

Ці складні та дуже нагальні питання мають вирішальне значення та вимагають, щоб Етика ШІ та Закон ШІ були невід’ємною частиною в появі генеративного ШІ.

Висновок

Здається, ми любимо та приймаємо ближніх людей, які мають справжнє смирення.

Справжнє смирення може зникнути. Справжнє смирення може прийти і піти. Справжнє смирення або його видимість може змусити нас подумати, що хтось щирий у своєму смиренні, хоча це лише вигляд. Оскар Левант, відомий піаніст, згадав таке помітне зауваження, що лежить в основі смирення: «Світ потребує більше геніїв зі смиренням; нас так мало залишилося».

Людям може бути важко відрізнити справжнє смирення від удаваного. Тим не менш, здається, що нас, як правило, спонукають сподіватися або вірити, що вияв смирення передбачає щирість смирення.

Це особливо те, де штучний інтелект може створити для нас проблеми. Генеративний ШІ, який виражає смирення, може змусити нас припустити, що ШІ втілює смирення. Існує ряд варіантів, як впоратися з генеративним штучним інтелектом, який або задумом, або випадково генерує вираження, орієнтовані на скромність.

Френк Ллойд Райт, архітектор-візіонер, зробив такий проникливий коментар про смирення: «На ранньому етапі життя мені довелося вибирати між чесною зарозумілістю та лицемірним смиренням. Я вибрав перше і не бачу причин змінювати».

Для тих, хто вважає, що штучний інтелект є екзистенційним ризиком, про який я розповідаю за посиланням тут, існує особлива стурбованість тим, що штучний інтелект, який має режим смирення, може обманом змусити людей робити деякі з найгірших речей. Сам штучний інтелект може не знищити нас. Альтернативою для ШІ було б переконати нас зробити щось, що може спричинити наше власне знищення.

Наша загибель, можливо, викликана через генеративний штучний інтелект, який виражає смирення.

Людям потрібно взяти на себе смирення і переконатися, що такого жахливого результату не станеться.