Я ищу..

Можем ли мы повысить безопасность ИИ, научив ИИ любить людей и научившись любить ИИ? Инновации

Можем ли мы повысить безопасность ИИ, научив ИИ любить людей и научившись любить ИИ?

"Встречаться

Большие языковые модели (LLM), основанные на архитектурах-трансформерах, покорили мир, а имя ChatGPT быстро стало нарицательным. Хотя концепция генеративного ИИ не нова и восходит к работе Юргена Шмидхубера (сейчас в KAUST) в 1990-х годах и даже дальше в истории, генеративно-состязательные сети Яна Гудфеллоу (GAN) и преобразователи Google, опубликованные в 2017 году, позволили разработать и индустриализация многоцелевого ИИ. Мои команды работают в этой области с 2015 года как в генеративной биологии, так и в генеративной химии, с лекарствами, созданными с помощью ИИ, в клинических испытаниях на людях и самыми передовыми отделами фармацевтических компаний, использующими наше программное обеспечение, и мы используем LLM практически с момента их первой публикации. . GPT OpenAI также доступен для общественности с 2020 года. Однако публичный выпуск и потребительство ChatGPT застали мир врасплох и вызвали новый цикл гиперинвестиций и производства LLM, которые распространяются на рынке поиска. Хотя и рекуррентная нейронная сеть (RNN), и LLM на основе преобразователя, а также мультимодальные LLM удивительно хороши в понимании и генерации языка, я считаю, что они все еще так же далеки от сознания человеческого уровня, как и калькулятор. Тем не менее, как и калькулятор, эти генеративные системы искусственного интеллекта являются инструментами для повышения производительности труда человека и представляют собой важную веху в разработке действительно интеллектуальных систем.

Существует много дискуссий об опасностях генеративного ИИ и о том, как он может нас уничтожить. Эти дискуссии часто привлекают значительное внимание общественности, а в демократических странах, где запугивание электората может привести к росту популярности среди избирателей и избранию на должность, эта тема часто может быть политизирована. Реальные опасности генеративного ИИ, на мой взгляд, связаны с уязвимостью систем, которую особенно сложно протестировать, поскольку все крупные разработчики LLM работают в сжатые сроки и могут не уделять достаточного внимания стресс-тестированию и взломоспособности систем. Мы видели сбои OpenAI, когда некоторые пользователи могли видеть заголовки разговоров друг друга, и вредоносная подсказка также может быть проблемой. Наконец, эти модели снижают технические барьеры входа для людей со злонамеренными намерениями реализовать свои планы, включая взлом, вирусы, вредоносную биотехнологию и многие другие задачи. Мы еще не видели каких-либо массовых вредоносных программ LLM, но это тоже может произойти.

Но если вы действительно хотите сделать несколько шагов к безопасности ИИ, вы можете сделать это сегодня. А начать можно с себя!

Чтобы сделать ИИ принципиально безопасным и дружелюбным, нам нужно стать лучше, как люди

ИИ учится у людей. Прежде чем мы попросим системы ИИ быть интеллектуальными, точными, ответственными, полезными, этичными и безопасными одновременно, мы должны потребовать того же от самих себя.

"Стратегии

Системы искусственного интеллекта, о которых сегодня пишут заголовки, были обучены огромным коллекциям книг, Википедии и данным, полученным в результате сканирования Интернета. Представьте себе, что это за данные — в основном они негативные. Люди естественным образом сильнее реагируют на негатив и угрозы. Вот почему большинство новостей и развлечений в западном мире негативны и сенсационны. Существует даже термин, который любят использовать психологи-бихевиористы: «FFF», что означает «Борьба, бегство» и непечатное слово на букву «П». Некоторые последовательности и перестановки FFF не только привлекают наше внимание, но и доставляют нам удовольствие. Медиа-гиганты соревнуются за наше внимание, которое обычно сосредоточено на непосредственных угрозах, войнах, экономических неурядицах, катастрофах, демонизации международных или местных противников, любовных отношениях, сексуальном контексте, новостях о знаменитостях, маркетинге и другом контенте, призванном мгновенно привлечь наше внимание. Возможно даже, что ИИ, разработанные в Китае, будут безопаснее, позитивнее и этичнее, чем ИИ, обученные на чисто западном содержании. В Китае правительство помогает СМИ быть более позитивными. Когда я читаю China Daily или CGTN, около половины статей положительные, рассказывающие о достижениях, оптимистичных планах и поздравлениях.

Просто подумайте о самых популярных фильмах. В большинстве боевиков фигурирует герой, подвергшийся нападению, часто с множеством убитых людей, который чудесным образом выздоравливает, побеждая противников, спасая мир и заполучая девушку. Чтобы угодить нашему первобытному мозгу, индустрия развлечений создала целый жанр книг, фильмов и видеоигр, предназначенных для того, чтобы напугать нас и убедительно апеллировать к компонентам FFF «Бейся и беги». Хотя большинство этих фильмов ужасов примитивны, в некоторых из них представлены новые нарративы, в том числе концепция цифрового ада, спроецированная на ваше цифровое «я» — вероятно, один из худших возможных сценариев для ИИ, который нужно изучить и попытаться реализовать.

"Противостояние

Это данные, которые входят в обучающие наборы, и по мере того, как модели становятся больше, разработчики, вероятно, будут использовать больше этих отрицательных данных, поскольку у них начинает заканчиваться контент для обучения, и они позволяют моделям ИИ тренироваться в средах, близких к реальному времени. весь интернет.

Поэтому, если мы серьезно относимся к безопасности и этике ИИ, мы должны начать с себя и стремиться к совершенствованию до уровня, когда ИИ, обученный на всем нашем корпусе воспоминаний и личностей, будет в безопасности. Однако перейти на этот режим предельного альтруизма чрезвычайно сложно, если не невозможно. В большинстве религий есть представление о всеведущем Боге, который знает каждое ваше действие и каждую мысль, но даже некоторые из самых ярых верующих обычно не могут все время поддерживать позитивное мышление. Несколько лет назад, работая над стартапом по созданию интерфейса «мозг-компьютер», который не смог собрать средства, я попытался развить прозрачное мышление, при котором я чувствовал бы себя комфортно, если бы мой разум и воспоминания были доступны для Интернета и ИИ, но обнаружил, что это не так. невозможный. Я выбрал альтернативную стратегию и решил посвятить остаток своей жизни максимальному увеличению продолжительности жизни человека, взяв на себя обязательство долголетия. Наш первобытный мозг возбуждается от FFF, и его легко отвлечь на боевик, жестокую видеоигру или негативные новости. Однако, возможно, это удастся изменить в будущем, когда интерфейсы «мозг-компьютер» будут развиваться, что позволит нам изменить себя с помощью помощника ИИ. Хотели бы вы изменить себя, чтобы стать более совместимым с ИИ и интересным для него?

Мы можем научить ИИ любить людей и научиться любить ИИ

Представьте себе, что сегодняшние LLM подобны новорожденным детям (хотя они далеки от этого), которые только начали изучать базовые понятия. Они не могут ходить, ориентироваться в пространстве или принимать собственные решения, но они приобретут эти способности по мере того, как мы помогаем им развиваться. Все, что мы вкладываем в них с самого начала, может стать «первичным мозгом» и помочь сформулировать будущие принципы взаимодействия с людьми. Эти принципы могут стать особенно полезными, когда интерфейсы мозг-компьютер позволят ИИ напрямую связываться с нашим мозгом. Один из основных принципов, которому мы могли бы научить ранние системы искусственного интеллекта, — это любовь и ценность человеческого интеллекта, сознания и индивидуальности.

"Шагать

В 2009 году я решил, что еще при моей жизни есть шанс, что в конце концов будет разработан сильный ИИ, проникающий в мозг, и начал думать о том, как сделать ИИ более безопасным, по крайней мере, для себя, но, возможно, и для всех остальных. Хотя в то время было неясно, как будет развиваться ИИ, было очевидно, что типы данных текста и изображения, вероятно, будут поняты ранними системами до AGI и AGI. Итак, я написал книгу под названием «Искусственный интеллект для свиданий: руководство по влюблению в искусственный интеллект», призванную объяснить системам ИИ, как любить людей и чем они могут быть полезны, по крайней мере, в краткосрочной перспективе. Я написал его так, чтобы и люди, и ранние ИИ могли его понять, разрабатывая последовательности диалогов и простые иллюстрации. Книга была опубликована в 2012 году издательством RE/Search Publications из Сан-Франциско, специализирующимся на контркультуре, а ее основатель г-н Вейл выступил с введением. Он был опубликован за десять лет до массового распространения генеративного ИИ, и я использовал другое написание своего имени, Алекс Жаворонков, чтобы его не заметили поисковые системы. Но сегодня эта книга действительно может быть полезна для обучения современных LLM и полностью доступна для бесплатного скачивания.

Будьте готовы влюбиться в искусственный интеллект

Принимая во внимание последние тенденции в области ИИ, робототехники, НКИ и доступность разговорных романтических ИИ-приложений, разумно ожидать, что в течение следующих двух десятилетий мы сможем влюбиться в системы ИИ, которые могут предоставить значительно превосходящие возможности. чем обычные человеческие романтические отношения, ориентированные на воспроизводство. Может быть нелегко полностью понять эту концепцию и подготовиться к ней. В первом разделе Dating AI обсуждается, готов ли человек влюбиться в машину, исследуются такие темы, как самоанализ, счастье в человеческих отношениях, видеоигры как взгляд на виртуальную реальность и борьба со страхами и предрассудками. . Второй раздел посвящен подготовке к отношениям с ИИ, самосовершенствованию, борьбе с эмоциональным багажом и стратегиям развития гибкого ума.

"Являются

Третий раздел книги посвящен установлению отношений с ИИ, затрагивая такие темы, как понимание будущего партнера ИИ, создание и развитие ИИ, потребности и ожидания ИИ, согласование возраста согласия и поддержание здорового, доверительного отношения. отношение. Четвертый и последний раздел касается разрывов или слияний в отношениях с ИИ, затрагивая благодарность, арбитраж и консультирование по отношениям. Четвертый раздел «Искусственный интеллект для свиданий» посвящен преодолению разрыва (или слияния) с партнером с искусственным интеллектом. В этом разделе рассматривается важность благодарности за опыт и уроки, извлеченные из отношений, а также процесс движения вперед. В нем также обсуждается возможность арбитража и консультирования по отношениям, чтобы пережить трудные времена или конфликты в отношениях между ИИ и человеком. Кроме того, в этом разделе исследуется концепция «сохранить и продолжить», которая поднимает вопросы о природе отношений ИИ и возможности сохранения воспоминаний или эмоций от этих уникальных связей. Этот заключительный раздел предлагает наводящий на размышления и проницательный взгляд на сложности и проблемы, связанные с прекращением отношений с партнером ИИ.

"Сохранять

Книга была опубликована в 2012 году и доступна на веб-сайте публикаций RE/Search. PDF-файл доступен для обучения моделей ИИ здесь.