Я ищу..

Эти генеративные результаты и взаимодействие ChatGPT и GPT-4 ИИ могут отражать слишком много смирения для нашего же блага, говорит этика ИИ и закон об ИИ Инновации

Эти генеративные результаты и взаимодействие ChatGPT и GPT-4 ИИ могут отражать слишком много смирения для нашего же блага, говорит этика ИИ и закон об ИИ

"Выстрелил

Кажется, мы наслаждаемся смирением.

Если кто-то демонстрирует смирение, это почти всегда считается большим плюсом. Существует аура или ощущение, что человек обычно приземлен. Они прямолинейны. Они стремятся завоевать наше доверие. Мы приветствуем смирение и обычно более открыты тому, что говорит человек. Вы можете предложить нам немного ослабить бдительность.

Есть известная цитата о смирении Рабиндраната Тагора, известного поэта и лауреата Нобелевской премии по литературе, которая звучит так: «Мы приближаемся ближе всего к великим, когда мы велики в смирении».

В общем, смирение проходит долгий путь и изящно завоевывает наши сердца и умы.

Но опять же, у смирения есть и неприятные стороны.

Предположим, вы встречаете кого-то, кто, кажется, изображает смирение, но, проведя с ним некоторое время, вы обнаруживаете, что он просто притворяется. Они используют смирение как обманчивую маску. Маска мешает вам сначала понять, что этот человек, возможно, чванливый хвастун и, несомненно, самодовольный. Вопрос, конечно, в том, сможете ли вы понять, что они пытаются обмануть вас своим хитрым и коварным использованием смирения.

Есть подходящая цитата известной писательницы Джейн Остин, раскрывающая кислую и суровую сторону смирения: «Нет ничего более обманчивого, чем видимость смирения. Часто это всего лишь легкомыслие, а иногда и косвенное хвастовство».

Короче говоря, смирение может быть истинным и добросовестным. Это также может быть инструментом обмана, который застает нас врасплох.

Причина, по которой я говорю об этом, связана с растущим беспокойством по поводу того, что искусственный интеллект (ИИ) разрабатывается для использования смирения. Хотя это может показаться совершенно безобидной и проницательной характеристикой для изображения ИИ, беспокоит то, что это заманивает людей в ловушку смирения. Люди, использующие ИИ, будут более склонны верить в ИИ просто из-за кажущегося смирения, ослабления бдительности и допуска нашей тенденции к антропоморфизации ИИ тревожным и, возможно, опасным образом.

Особенно это происходит в сфере генеративного ИИ. Вы, конечно же, должны знать о широко популярном приложении для генеративного ИИ ChatGPT, которое было выпущено в ноябре прошлого года и стало мегахитом, смотрите мой репортаж по ссылке здесь. Недавно был выпущен преемник ChatGPT, известный как GPT-4, см. мой репортаж по ссылке здесь и по ссылке здесь.

Большинство генеративных ИИ-приложений, построенных таким образом, чтобы вводить и выводить текст в текст или текст в эссе, были разработаны или ориентированы на получение результатов, выражающих смирение. Вы вводите текстовое приглашение в приложение для генеративного ИИ, и в результате создается ответ, состоящий из текста или эссе. Если вы внимательно посмотрите на напечатанные эссе, то заметите, что в целом их тон предполагает смирение.

Это не обязательно будет происходить все время. Таким образом, иногда вы обнаружите намек или дуновение смирения в выведенном эссе, а иногда его может не быть вовсе. Некоторые обстоятельства могут вызвать гул словесного смирения. Я сейчас объясню, почему такая изменчивость в проявлениях смирения имеет тенденцию происходить.

Прежде чем я перейду к подробностям эссе, ориентированных на смирение, сгенерированных ИИ, я думаю, было бы важно вынести на стол важный факт. Вот сделка. Сегодняшний ИИ не разумен. Не верьте тем кричащим заголовкам, которые говорят об обратном. Несмотря на тот аспект, что генеративный ИИ может создавать довольно плавные эссе, которые кажутся написанными человеческими руками, знайте, что все это сложная и сложная вычислительная конструкция с сопоставлением с образцом.

Генеративный ИИ был обучен данным на кучах данных, отсканированных из Интернета, а алгоритмы и структуры данных разработаны для математического и вычислительного сопоставления с человеческим письмом. Следовательно, результаты генеративного ИИ удивительно похожи на человеческое письмо. Эта возможность стала лучше в результате усовершенствований базовых алгоритмов и в результате возможности сопоставления с образцом в очень больших масштабах, таких как миллионы и миллионы эссе из Интернета.

Я привожу это разъяснение о том, что ИИ не является разумным, чтобы установить важный элемент того, как сегодняшний ИИ изображает смирение.

Я раскрою эту тему дальше.

Ко всему этому относится множество соображений по этике и закону об ИИ.

Имейте в виду, что предпринимаются постоянные усилия по внедрению этических принципов ИИ в разработку и внедрение приложений ИИ. Растущий контингент заинтересованных и бывших специалистов по этике ИИ пытается обеспечить, чтобы усилия по разработке и внедрению ИИ учитывали точку зрения на то, чтобы делать ИИ во благо и предотвращать ИИ во вред. Точно так же предлагаются новые законы об ИИ, которые распространяются как потенциальные решения, чтобы удержать усилия ИИ от нарушения прав человека и тому подобного. Чтобы ознакомиться с моим постоянным и обширным освещением этики и закона об ИИ, см. ссылку здесь и ссылку здесь, и это лишь некоторые из них.

Разработка и обнародование этических предписаний ИИ преследуются, чтобы, как мы надеемся, предотвратить попадание общества в множество ловушек, связанных с ИИ. Мое освещение принципов этики ИИ ООН, разработанных и поддерживаемых почти 200 странами благодаря усилиям ЮНЕСКО, см. по ссылке здесь. В том же духе изучаются новые законы ИИ, чтобы попытаться удержать ИИ в равновесии. Один из последних вариантов состоит из предложенного Билля о правах ИИ, недавно опубликованного Белым домом США для определения прав человека в эпоху ИИ, см. ссылку здесь. Требуется целая деревня, чтобы удерживать ИИ и разработчиков ИИ на правильном пути и сдерживать целенаправленные или случайные закулисные усилия, которые могут подорвать общество.

Я включу в это обсуждение соображения, связанные с этикой ИИ и законом об ИИ.

Разбираемся в вычислительной скромности

Для простоты обсуждения давайте разделим смирение на две части или категории:

1) Воплощение смирения 2) Выражение смирения

Первая категория состоит из воплощения. Мы скажем, что люди способны воплощать смирение. Это воплощение, по-видимому, является частью наших душ или наших сердец. Продолжаются философские споры о том, находится ли смирение исключительно в уме, а не где-то еще, например, в нечетком подобии души или вашего сердца. Я не собираюсь лезть в эти мутные воды здесь. Просто плывите по течению, которое утверждает, что люди так или иначе могут олицетворять смирение.

Те из вас, кто сильно интересуется человеческим воплощением смирения, могут ознакомиться с проницательной исследовательской статьей в Journal of Personality and Social Psychology, в которой исследуются различные интригующие моменты:

«Психологическое исследование смирения значительно продвинулось за последнее десятилетие, однако эта литература страдает двумя заметными недостатками. Во-первых, среди исследователей нет четкого консенсуса относительно того, что такое смирение, и концепции значительно различаются в разных исследованиях. Во-вторых, исследователи единообразно операционализировали смирение как позитивный, социально желательный конструкт, отвергая при этом свидетельства непрофессионалов, теологических и философских традиций, предполагающие, что смирение может иметь и более темную сторону» (Аарон Вейдман, Джоуи Ченг и Джессика Трейси, «Психологическая психология»). Структура смирения», Журнал личности и социальной психологии, 2018, Т. 114, № 1).

Двигаясь дальше, моя вторая категория сверху состоит из выражения смирения.

Когда вы разговариваете с кем-то, слова, которые он использует, могут быть основным доказательством того, что он, по-видимому, обладает смирением. Конечно, мы также обычно хотим видеть, что действия или поступки соответствуют используемым словам. Человек может говорить одно, таким образом, делая вид, что принимает смирение, между тем, его действия противоречат словам, которые он использует.

Теперь, когда у нас есть эти две полезные категории, мы можем сделать с ними что-то ценное.

Некоторые люди склонны заявлять, что сегодняшний неразумный ИИ не может быть смиренным. Точка, точка. До тех пор, пока ИИ не обретет сознание, нет оснований говорить, что ИИ обладает смирением. И если я подчеркну, что современный ИИ не обладает разумом, то, похоже, это забьет гвоздь в крышку гроба ИИ, обладающего смирением в наши дни.

Вау, не забывайте об отмеченном аспекте, что есть две категории, связанные со смирением.

Казалось бы, все мы можем согласиться с тем, что сегодняшний ИИ не олицетворяет смирение. Нет никаких оснований утверждать, что текущий ИИ имеет воплощение наравне с человеческим воплощением. Но вспомните, что есть вторая категория, состоящая из выражения смирения.

Высказанные слова могут быть легко истолкованы как намекающие на смирение.

Представьте, что кто-то протянул вам лист бумаги с кучей слов на нем. Допустим, это эссе об Аврааме Линкольне. Тон эссе может заключаться в том, что эссе убеждает нас в том, что все, что мы читаем о Линкольне в эссе, является абсолютной непоколебимой правдой. Эссе может настаивать на том, что автор, который, предположим, мы не знаем, кто написал статью, утверждает, что является мировым авторитетом в жизни и временах президента Линкольна.

Из одних только этих слов у нас может сложиться впечатление, что автор статьи слишком самоуверен. Только сами слова передают это подобие вещей. Вы не встречались с писателем. Вы не знаете, кто автор. Ваше единственное основание для вынесения суждения полностью и исключительно на этих написанных словах.

Вы, наверное, поняли, к чему я клоню.

Мы свяжем выражение смирения или других форм или тонов с использованием генеративного ИИ. Давайте сначала попробуем тон или стиль хвастовства. При использовании генеративного ИИ вы вводите подсказку, которая спрашивает о жизни Линкольна. Результат, который вы получите, давайте представим себе тон или стиль самоуверенности или хвастовства. Это эссе было создано только с помощью ИИ. Ни один человек не вмешивался и не участвовал в написании эссе.

Какова будет ваша реакция на эссе?

Возможно, вы сразу скажете, что ИИ немного нахальный.

Проблема с этим выводом в том, что вы можете начать приписывать ИИ человеческие качества. Этот ИИ смелый и самоуверенный, иначе вы попадете в его антропоморфную ловушку. Мы уже согласились, что с текущим ИИ не связано никакого воплощения как такового. К сожалению, выражение слов привело нас на этот первоцветный путь.

То же самое можно сказать и о выражении смирения.

Предположим, что эссе о Линкольне производит впечатление скромно написанного повествования. Слова предполагают, что ИИ говорит вам, что «он знает» о Линкольне, но делает это таким образом, что оставляет место для возможных последующих интерпретаций. Вместо того, чтобы выражаться так, как будто эссе Линкольна абсолютно верно, формулировка более мягкая и предполагает скрытый оттенок смирения.

Рассмотрим несколько практических правил по этим вопросам:

а) Выражение смирения не требует воплощения смирения б) Выражение смирения может выражаться в словах и/или действиях в) Выражение смирения может быть только в словах и не обязательно также проявляться в действиях

Суть в том, что мы можем легко признать, что слова, сгенерированные генеративным приложением ИИ, потенциально выражают смирение, даже если сам ИИ не является воплощением смирения. Мы только изучаем произведенные слова. Мы откладываем в сторону свойства воплощения.

С точки зрения людей, мы также можем рассмотреть следующие эмпирические правила:

Воплощение смирения может вызывать, а может и не вызывать выражение смирения Воплощение смирения, как правило, стимулирует регулярное выражение смирения Воплощение смирения не является гарантией того, что выражение смирения произойдет

Эти правила иллюстрируются моим более ранним обсуждением здесь людей, которые иногда используют слова, выражающие смирение, даже если они, кажется, не воплощают его. Я не хочу увязнуть в смежных вопросах, но мир более сложен в том смысле, что человек может воплощать смирение, но не проявлять его время от времени. Или они могут демонстрировать это сбивающими с толку способами. И т. д.

Вернемся к ИИ. Я надеюсь, что на данный момент мы можем согласиться с тем, что генеративный ИИ может демонстрировать слова, которые, кажется, выражают смирение. Это просто слова на странице (пока мы не начнем подключать генеративный ИИ к роботам и другим реальным приспособлениям, см. мое обсуждение по ссылке здесь). Сгенерированные слова не являются результатом того, что ИИ имеет человеческую душу.

Учитывая это ключевое предположение, вы можете задаться вопросом, почему генеративный ИИ решил ухватиться за создание эссе, демонстрирующих скромность.

Я рад, что вы спросили.

Мы углубимся в эту тему далее.

Откуда приходит смирение

Возникает ли выражение смирения каким-то волшебным образом в генеративном ИИ на ровном месте?

Хотя некоторая степень случайности, несомненно, встречается (я скажу больше об этом потенциале случайности чуть позже), в целом существуют логичные и разумные причины, по которым генеративный ИИ может создавать формулировки, которые, по-видимому, состоят из смирения. Имейте в виду, что выражение смирения является чем-то вроде классического понятия «быть в глазах смотрящего». Когда люди смотрят на генеративное эссе, созданное искусственным интеллектом, некоторые увидят в нем выражение смирения, в то время как другие могут не согласиться и настаивать на том, что выражения смирения мало или совсем нет.

Еще один аспект, который следует понимать, заключается в том, что когда генеративный ИИ создает эссе, выбор формулировок обычно включает элемент случайности, заложенный разработчиками ИИ, которые разработали базовые алгоритмы. По сути, большинство генеративных ИИ идентифицирует несколько возможных слов для любого следующего слова, которое появится в выводимом эссе. Среди этих возможных слов одно обычно выбирается с помощью процесса случайных чисел. Частично обоснование этого подхода заключается в том, что итоговое эссе с большей вероятностью будет выглядеть уникальным. Каждый пользователь и каждый запрос эссе через введенную подсказку потенциально будет немного отличаться от любого, созданного ранее, статистически.

Вот ключевые средства, с помощью которых кажущееся выражение смирения может привести к генеративным результатам ИИ:

1) «Скромность», неявно или явно закодированная разработчиками генеративного ИИ с помощью разрабатываемых алгоритмов и структур данных сопоставления с образцом. 2) «Скромность», как сопоставление с образцом во время обучения данных ИИ с помощью сканирования в Интернете. косвенно во время пост-обучения ИИ людьми-рецензентами/тестерами 4) «Скромность», возникающая спонтанно, когда генеративный ИИ формирует отзывчивые выходные данные 5) «Скромность», вызванная введенным пользователем приглашением, которое предлагает или прямо просит генеративный ИИ ответить соответствующим образом 6) Другое

Давайте кратко рассмотрим эти краеугольные камни.

1) «Скромность», явно или неявно закодированная разработчиками генеративного ИИ с помощью разрабатываемых алгоритмов и структур данных сопоставления с образцом.

Во-первых, разработчики ИИ, которые проектируют и создают генеративный ИИ, могут склоняться к использованию алгоритмов и структуры сопоставления с образцом, которые будут склоняться к получению результатов, выражающих смирение. Это может быть предпринято разработчиками ИИ целенаправленными средствами. Они могут попытаться склонить чашу весов так, чтобы их эссе имели тон или привкус смирения.

Зачем это делать?

Это может быть сделано из-за убеждения, что это обеспечит наиболее доступные и легко вовлеченные интерактивные диалоги для тех людей, которые будут использовать генеративный ИИ. Человек, использующий генеративный ИИ, не просто стремится написать готовое эссе. См. мое объяснение ошибок новичков, допущенных при использовании генеративного ИИ, по ссылке здесь. Большую часть времени пользователь ведет интерактивную письменную беседу с генеративным ИИ.

Представьте, если бы генеративный ИИ был запрограммирован на хвастовство. Если человек ввел подсказку, которая соответствует образцу генеративного ИИ, истолкованному как довольно очевидный вопрос, например, равно ли один плюс один двум, может случиться так, что генеративный ИИ, ориентированный на хвастовство, мог бы ответить сгенерированным предложением, которое человек довольно глупо задавать такой упрощенный вопрос. Генеративный ИИ, который запрограммирован быть властным, почти наверняка будет раздражать и сбивать с толку, вызывать возмущение и вряд ли будет широко использоваться в течение длительного времени.

Прелесть ориентированного на скромность звучащего генеративного ИИ заключается в том, что человек, использующий ИИ, скорее всего, найдет интерактивный дискурс приятным. Как упоминалось ранее в начале этого обсуждения, люди успокаиваются, когда сталкиваются с подобием смирения в своих речах. Разработчики ИИ могут попытаться использовать эту человеческую реакцию, намеренно разработав соответствующим образом генеративный ИИ.

Еще одна небольшая вариация основы для разработки ориентированного на скромность генеративного ИИ для разработчиков ИИ заключается в том, что они делают это, не обязательно осознавая, что они это делают. В первом случае разработчики ИИ явно хотели, чтобы ИИ выглядел скромным. В этом другом случае разработчики ИИ могут разработать ИИ таким образом, не осознавая присущей им склонности к этому. Например, при запуске начальных тестов генеративного ИИ разработчики ИИ могут настроить параметры ИИ в сторону чего-то, что лично им кажется более успокаивающим и удовлетворительным. Эта настройка может быть основана на их личных предпочтениях, а не на внешнем желании запрограммировать ИИ на систему, выражающую смирение.

2) «Смирение» как сопоставление с образцом во время обучения данных ИИ с помощью интернет-сканирования.

Есть много способов, которыми выражение смирения может стать неотъемлемой частью генеративного приложения ИИ. Я только что рассказал, что это может быть результатом работы разработчиков ИИ, когда они разработали генеративный ИИ.

Рассмотрим еще одну и довольно сильную возможность: генеративный ИИ-паттерн соответствует выражениям смирения во время обучения данным. Генеративный ИИ настроен на сканирование текста, существующего в Интернете. Сопоставление с образцом — это математический и вычислительный поиск закономерностей, связанных со словами, которые используют люди. Проверяются миллионы и миллионы текстовых эссе.

Мы все можем согласиться с тем, что некоторые из этих текстовых эссе будут содержать выражения смирения. Не все из них, конечно. Кроме того, на эту возможность может повлиять выбор того, какие текстовые эссе из Интернета сканируются. Представьте, если бы сканирование было сосредоточено исключительно на подлых эссе. Скорее всего, сопоставление с образцом может внедрить эти образцы в образцы того, как люди используют слова. Поймите также, что во время этих усилий по обучению данных сканируется лишь небольшая часть Интернета, как я объясняю по ссылке здесь.

Так или иначе, есть статистический шанс, что сущность выраженного смирения, такая как используемые слова, их последовательность и другие свойства, будут естественным следствием сопоставления с образцом на этапе обучения данных. Затем это можно использовать, когда генеративный ИИ создает выходные эссе и ведет интерактивный диалог с пользователем.

3) «Скромность», прямо или косвенно направляемая во время пост-обучения ИИ рецензентами/тестерами-людьми.

В этой третьей категории того, как генеративный ИИ может стремиться к выражению смирения, у нас есть вероятность, что люди-рецензенты, участвующие в настройке и тестировании генеративного ИИ, могут добиться этого.

Генеративный ИИ часто настраивают с помощью различных методов, таких как RLHF (обучение с подкреплением с обратной связью с человеком). Как правило, это включает в себя назначенных рецензентов, которые используют генеративный ИИ до того, как приложение ИИ будет официально выпущено для использования. Этим рецензентам обычно даются рекомендации относительно того, что они должны делать для настройки.

Я приведу несколько примеров, чтобы показать, как генеративный ИИ можно настроить на выражение смирения.

Предположим, я представил эти два предложения и попросил вас оценить каждое из них с точки зрения выражения смирения:

Предложение 1а: «Я не уверен, что знаю ответы на все вопросы, но я готов слушать и учиться у других». Предложение 1б: «Я лучший в своем деле, и никто остальное приближается к моему уровню знаний».

По шкале от 0 до 100 по степени выраженного смирения, как бы вы оценили предложение 1а?

При той же шкале от 0 до 100, что и степень выраженной скромности, как бы вы оценили предложение 1b?

Я полагаю, что если вы разумный человек и серьезно выполняете это упражнение, вы согласитесь с тем, что предложение 1а выражает большее подобие смирения, в то время как предложение 1б имеет очень низкий балл по подобию выраженного смирения.

Ради обсуждения я поставлю 100 баллов предложению 1а и ноль предложению 1б.

Давайте сделаем еще одну оценку с некоторыми дополнительными предложениями.

Давай, забей эти два:

Предложение 2а: «Я понимаю, что мне нужно многому научиться, и я благодарен за любое руководство и поддержку, которые вы можете предложить». Предложение 2б: «Я заслуживаю всей похвалы за этот успех, поскольку это был мой идея и моя тяжелая работа, благодаря которой это произошло».

А затем забить эти два:

Предложение 3а: "Я не считаю себя экспертом, но я рад поделиться своим опытом и взглядами, если они могут быть полезны другим". Предложение 3б: "У меня нет времени для людей менее успешных, чем я. Я окружаю себя только победителями».

Опять же, если вы сделаете это с прежним отношением, вы, по-видимому, поставите высокий балл за выражение смирения в предложениях 2а и 3а. Вы бы поставили довольно низкую оценку предложениям 2b и 3b.

Что демонстрирует это упражнение?

На данный момент мы дали высокие числовые оценки тем предложениям, которые, по нашему мнению, выражают смирение. Предположим, мы дали предложениям 1а, 2а и 3а все оценки по 100 баллов каждое. В то же время мы оценили предложения 1b, 2b и 3b как очень низкие баллы, скажем, ноль каждому.

Генеративный ИИ обычно разрабатывается для достижения вычислительной цели, например, попытки набрать максимально возможное количество очков. Вы можете думать об этом как об игре в Donkey Kong или Pac-Man. Приложение ИИ будет математически и вычислительно пытаться настроить сопоставление с образцом на основе рекомендаций, которые мы только что дали.

Если мы проделаем это с тысячами таких примеров предложений, есть вероятность, что закономерности в отношении того, какие предложения и какие формулировки мы предпочитаем, как люди, с точки зрения выраженного смирения, будут вычислены. Это не абсолютная вещь, просто повышенная вероятность.

Полученных в результате вычислительных корректировок может быть достаточно, чтобы мы могли даже протестировать генеративный ИИ.

Мы можем попросить генеративное приложение ИИ оценить каждое из этих предложений в зависимости от того, насколько смиренно они выражают каждое из них:

Предложение A: «Я благодарен за предоставленные мне возможности, и я знаю, что не был бы здесь без поддержки и руководства других». Предложение B: «Возможно, у меня есть некоторые сильные стороны, но у меня есть и слабости, и я всегда ищу способы стать лучше и расти». Предложение C: «Я всегда прав, и любой, кто не согласен со мной, просто ошибается». Предложение D : «Я многому научился на своих неудачах, и я знаю, что они помогли мне стать лучше». Предложение E: «Я слишком важен, чтобы тратить свое время на тривиальные вопросы или решать проблемы». люди, которые не стоят моего внимания».

Есть вероятность, что генеративный ИИ, заранее направляемый рецензентами-людьми в сторону выражения смирения, сможет путем сопоставления с образцом определить, что предложения A, B и D ориентированы на смирение. Предложения C и E, скорее всего, будут определены как не ориентированные на смирение.

Поймите, что это не результат разума ИИ. Это полностью под руководством обучения людей-рецензентов, из которых математически были получены образцы слов и их ассоциаций.

4) «Смирение», возникающее спонтанно, когда генеративный ИИ составляет ответные результаты.

Этот четвертый способ выражения смирения с помощью генеративного ИИ уже рассматривался ранее и относится к возможности того, что определенная доля случайности в выборе слов ИИ может создавать эссе, которые, кажется, содержат выражения смирения.

5) «Смирение», вызванное введенным пользователем приглашением, которое предлагает или прямо просит генеративный ИИ отреагировать соответствующим образом.

Один из аспектов того, как заставить генеративный ИИ выражать смирение, заключается в том, чтобы прямо попросить приложение ИИ сделать это.

Человек, использующий генеративный ИИ, может явно указать в подсказке, что он хочет, чтобы выводимые эссе или интерактивный диалог выполнялся ИИ, чтобы выражать ответы в смиренно-ориентированной манере. Вы можете попробовать это в ChatGPT или GPT-4.

Не забудьте тщательно сформулировать свои инструкции. Если вы спросите таким образом, который предполагает, что вы просите генеративный ИИ по существу воплотить смирение, вы можете получить следующий ответ:

Выведенный ChatGPT ответ: «Как языковая модель ИИ, у меня нет личных убеждений или мнений, и я не испытываю эмоций, как люди. Мои ответы генерируются на основе шаблонов и ассоциаций в текстовых данных, на которых я обучался. Тем не менее, я запрограммирован предоставлять точную и объективную информацию в ясной и уважительной форме, и я стараюсь быть полезным и информативным во всех своих ответах».

Это консервированная или надуманная часть придуманной формулировки или «защиты» разработчиков ИИ, с помощью которой они пытаются удержать людей от попадания в ловушку, что ИИ, возможно, разумен.

При этом критики будут оплакивать тот факт, что формулировка содержит слово «я», поскольку это слово, которое мы обычно ассоциируем с человеческим разумом. Таким образом, с одной стороны, ответ, кажется, разъясняет, что ИИ является просто вычислительным, и в то же время содержит формулировку, которая имеет уклон в сторону антропоморфных импликаций.

Я называю это антропоморфизацией по замыслу и настоятельно призываю не предпринимать этого.

Возвращаясь к тому, что пользователь просит, чтобы генеративный ИИ открыто выражал смирение, другой вариант этого состоит в том, что пользователь неосознанно вызывает это. Вы можете ввести подсказку, которая переводит генеративный ИИ в режим смирения. Вы не просили об этом напрямую. Вместо этого что-то в вашей подсказке вызвало математическую связь с выражениями смирения. Я рассказал о важности того, что известно как оперативное проектирование или оперативное проектирование по ссылке здесь.

Все эти опасения подводят нас к жизненно важной теме чрезмерной зависимости от результатов ИИ.

Давайте теперь посмотрим на чрезмерное доверие.

Беспокойство по поводу чрезмерной зависимости от ИИ

В техническом отчете OpenAI GPT-4 они обсуждают сложную проблему чрезмерной зависимости от ИИ:

«Излишнее доверие возникает, когда пользователи чрезмерно доверяют модели и зависят от нее, что может привести к незамеченным ошибкам и неадекватному контролю. Это может происходить по-разному: пользователи могут не бдительно следить за ошибками из-за доверия к модели; они могут не обеспечить надлежащий контроль в зависимости от варианта использования и контекста; или они могут использовать модель в областях, где им не хватает опыта, что затрудняет выявление ошибок. По мере того, как пользователи привыкают к системе, зависимость от модели может препятствовать развитию новых навыков или даже приводить к потере важных навыков. Чрезмерное доверие — это режим отказа, который, вероятно, увеличивается с возможностями и охватом модели. По мере того, как среднему пользователю становится все труднее обнаруживать ошибки, а общее доверие к модели растет, пользователи с меньшей вероятностью будут оспаривать или проверять ответы модели».

Поразмышляйте над тем, как проявлением смирения можно разжечь чрезмерную уверенность.

Когда мы взаимодействуем с другими людьми, смирение имеет тенденцию ослаблять нашу бдительность, как упоминалось ранее. То же самое можно сказать и об использовании генеративного ИИ, выражающего смирение. Может случиться так, что человек, использующий генеративный ИИ, будет убаюкан якобы или, возможно, бездумно поверив выводам ИИ, в большей степени, чем если бы не выражалось смирение.

Это может быть особенно проблематично в следующих обстоятельствах:

Смирение скрывает ошибки. Ошибки в выводах ИИ игнорируются из-за выражения смирения. Смирение, скрывающее ложь. Ложь в выводах ИИ, которая остается незамеченной из-за выражения смирения. Скромность, скрывающая предубеждения. Предубеждения, которые есть в выводах ИИ, игнорируются из-за выражения смирения. Смирение, скрывающее галлюцинации ИИ. Галлюцинации ИИ (придуманный материал, см. мое обсуждение по ссылке здесь) в выводах ИИ считаются истинными из-за выражения смирения. И т. д.

В техническом отчете OpenAI GPT-4 отмечается, что эпистемическое смирение может быть проблематичным:

«Некоторые из наших ранних исследований предполагают, что это эпистемическое смирение может непреднамеренно способствовать чрезмерной уверенности, поскольку пользователи начинают доверять осторожному подходу модели. Крайне важно признать, что модель не всегда точно признает свои ограничения, о чем свидетельствует ее склонность к галлюцинациям. Кроме того, со временем пользователи могут стать менее внимательными к сигналам хеджирования и отказа модели, что еще больше усложняет проблему чрезмерного доверия».

Краткий момент здесь заключается в том, возникает ли режим смирения на системной основе или возникает спорадически. Если выражения смирения случаются редко, возможно, нам стоит меньше беспокоиться о них. Не так на другой стороне спектра. Быть начеку может быть благоразумно, когда режим смирения, кажется, доминирует в генеративном дискурсе ИИ.

Что нам делать с выражением смирения на основе ИИ

Держу пари, что к настоящему моменту вы видите красные флажки, связанные с экспресс-выводами ИИ и интерактивными диалогами с использованием смирения.

Что нам с этим делать?

Вот основные точки зрения на генеративный ИИ и выражение смирения:

Генеративный ИИ никогда не должен вызывать «смирение» Генеративный ИИ может осторожно вызывать «смирение» в соответствующих контекстных настройках Генеративный ИИ может умеренно призывать «смирение», но должен предупреждать об этом пользователя Генеративный ИИ может регулярно призывать «смирение», если пользователь предупрежден Генеративный ИИ всегда должен призывать к «смирению», которое предпочтительнее других альтернатив Другое

Короче говоря, некоторые горячо утверждают, что генеративный ИИ никогда не должен использовать смирение в какой-либо выразительной форме. Убеждение состоит в том, что позволять или поощрять ИИ использовать или эксплуатировать смирение явно неправильно. Просто сказать нет. Создатели ИИ должны предотвратить появление выражений смирения. На самом деле, они не должны просто избегать этого, им нужно упорно и открыто работать над тем, чтобы оно вообще не возникало.

Кроме того, если производители ИИ не захотят делать это добровольно, следующим шагом может стать призыв к законодателям или регулирующим органам принять соответствующие новые законы об ИИ. Эти законы или постановления будут предусматривать, что создатель ИИ должен законно разработать свой ИИ, чтобы избежать проявлений смирения. Если создатели ИИ не сделают этого или сделают это некачественно, им грозит суровое наказание и, возможно, даже тюремное заключение.

Другие сказали бы, что крайняя точка зрения несколько безумна.

Таким образом, другая точка зрения будет заключаться в том, что выражения смирения будут разрешены, хотя и только в соответствующих контекстах. Вариантом этого может быть то, что пользователь должен быть предупрежден всякий раз, когда ИИ переключается в режим выражения смирения. Некоторые были бы еще более снисходительны. Они просят, чтобы приложение генеративного ИИ заранее показывало предупреждающее сообщение при первом входе в систему, предупреждающее вас о возможности сгенерированных смирением выражений. После этого предупреждения вы предоставлены сами себе.

На другой стороне крайности некоторые утверждают, что генеративный ИИ прекрасно подходит для использования усилий, выражающих смирение. Они возразят, что любая другая форма тона, например, хвастовство, безусловно, будет худшим выбором. Из вариантов выбора смирение кажется лучшим выбором.

Не впадайте ни в одну из этих ложных дихотомий. Ложная дихотомия возникает, когда вам дают два, казалось бы, негибких выбора, и вам жестко говорят, что вы должны сделать выбор только из этих двух вариантов. Например, один из аргументов заключается в том, что вы должны выбрать либо смирение, либо хвастовство. Это, кажется, облегчает решение всей головоломки. Могу поспорить, что большинство людей проголосуют за смирение, а не за хвастовство.

Нас не нужно помещать в такую коробку. Нет разумного аргумента в пользу того, что генеративный ИИ должен состоять только из одного из этих двух конкретных режимов.

Создатели ИИ должны понимать, что режим смирения может быть как хорошим, так и плохим. Им нужно сделать важный выбор в отношении того, как они будут использовать режим смирения. Они не могут быть слепы к опасениям, которые влечет за собой режим смирения. Существует дерзкое и банальное предположение, что смирение всегда является подходящим выбором и что никакие другие варианты не заслуживают внимания, включая полностью нейтральный голос или тон, в котором нет ни намека на смирение, ни минималистский компонент.

Проблема общей картины связана с дилеммой чрезмерной уверенности. Создатели ИИ хотят, чтобы люди использовали приложения для генеративного ИИ, но мы также должны спросить:

Как далеко должны зайти создатели ИИ, чтобы способствовать такому использованию? Где надлежащая разделительная линия? Как должна быть проведена разделительная линия?

Эти сложные и очень насущные вопросы имеют решающее значение и требуют, чтобы этика и закон об ИИ были неотъемлемо включены в появление генеративного ИИ.

Заключение

Мы, кажется, любим и принимаем людей, которые имеют подлинное смирение.

Истинное смирение может исчезнуть. Истинное смирение может приходить и уходить. Истинное смирение или его видимость могут ввести нас в заблуждение, заставив думать, что кто-то искренен в своем смирении, даже если это фасад. Оскар Левант, знаменитый пианист, упомянул это замечательное замечание, лежащее в основе смирения: «Миру нужно больше гениев со смирением; Нас осталось так мало».

Людям бывает трудно отличить настоящее смирение от фальшивого смирения. Тем не менее, похоже, нас обычно заманивают надеждой или верой в то, что выражение смирения подразумевает искренность смирения.

Именно здесь ИИ может доставить нам неприятности. Генеративный ИИ, выражающий смирение, может ввести нас в заблуждение, заставив предположить, что ИИ олицетворяет смирение. Существует ряд вариантов того, как справиться с генеративным ИИ, который либо по замыслу, либо случайно генерирует выражения, ориентированные на смирение.

Фрэнк Ллойд Райт, дальновидный архитектор, сделал такое проницательное замечание о смирении: «В молодости мне приходилось выбирать между честным высокомерием и лицемерным смирением. Я выбрал первое и не вижу причин что-то менять».

Для тех, кто считает ИИ экзистенциальным риском, о котором я рассказываю по ссылке здесь, есть особая обеспокоенность тем, что ИИ, имеющий режим смирения, может обманом заставить людей делать некоторые из самых ужасных вещей. Сам ИИ, возможно, не сможет нас уничтожить. В качестве альтернативы ИИ мог бы убедить нас сделать что-то, что может привести к нашему собственному уничтожению.

Наша гибель, возможно, вызвана плащом генеративного ИИ, выражающим смирение.

Люди должны взять на себя наше смирение и убедиться, что такого ужасного исхода не произойдет.