Я шукаю..

Ізраїльський стартап D-ID відкриває обличчя чат-ботам Generative AI Інновації

Ізраїльський стартап D-ID відкриває обличчя чат-ботам Generative AI

Розмовний штучний інтелект – це цікаво, але нудно. Коли ми говоримо «давайте поговоримо», ми не обов’язково маємо на увазі «я наберу трохи тексту, а ви відповісте іншим». Людські розмови – це, перш за все, спілкування віч-на-віч. Але як щодо наших розмов із чат-ботами ШІ?

"Створити

Компанія D-ID, що базується в Тель-Авіві, оголосила сьогодні про наступний етап у своєму стрімкому переході на хвилю генеративного штучного інтелекту, запустивши на Mobile World Congress свій API для чату, першу платформу, яка дозволяє спілкуватися віч-на-віч за допомогою «Цифрового штучного інтелекту». Людина» природним шляхом. «Ми підтримуємо великі мовні моделі», які створюють генеративний штучний інтелект, такий як ChatGPT, — каже співзасновник і генеральний директор Гіл Перрі. «Ми додаємо йому обличчя».

Понад 110 мільйонів відео вже створено за допомогою платформи D-ID AI, що дозволяє творцям створювати цифрових людей і фотореалістичних цифрових доповідачів із тексту, зменшуючи вартість, час і зусилля, необхідні для створення відео. Перший генеративний інструмент штучного інтелекту D-ID, Deep Nostalgia, захопив Інтернет на кілька місяців, оскільки мільйони людей використовували його, щоб оживити фотографії предків та історичних діячів. Його технологія стала ще більш вірусною із запуском Creative Reality Studio наприкінці минулого року — цього тижня Перрі сказав мені, що кожні п’ять секунд у D-ID з’являється новий абонент.

Тепер D-ID виводить спілкування за допомогою чат-ботів на абсолютно новий рівень. Фотореалістичні цифрові помічники, які розробники та підприємства створюють за допомогою цієї технології, тепер можуть взаємодіяти зі споживачами більш людяним, привабливим та ефективним способом. «Розмова ведеться між людьми. Вони також знаходяться між людиною та персонажем або між персонажем та персонажем. Але вони не між текстом і текстом», — каже Перрі.

Мільярдер «Backsies»: Техасець будує другий стан на уламках імперії нерухомості, яку він продав

Більше подібних історій. Менше подібних історій

Найкращі приклади того, що ви можете робити з ChatGPT

Більше подібних історій. Менше подібних історій

Жіноча тренерська мережа запускає оплачуване стажування в Тоттенхем Хотспур

Більше подібних історій. Менше подібних історій

50% респондентів нещодавнього великого опитування, проведеного на замовлення Forrester, сказали, що вони часто відчувають розчарування у своїй взаємодії з чат-ботами, і майже 40% цих взаємодій були негативними. 30% споживачів сказали, що після негативного досвіду чат-бота вони, ймовірно, переведуть покупку до іншого бренду, відмовляться від покупки взагалі або розкажуть друзям і родині про свій поганий досвід роботи з брендом.

D-ID хоче значно покращити роботу чат-бота, пропонуючи розмови в реальному часі з цифровими людьми. Gartner прогнозує, що до 2026 року половина B2B-покупців взаємодіятиме з цифровою людиною в циклі купівлі. Оскільки витрати на оплату праці складають до 95% витрат контакт-центру, а враховуючи переважаючу нестачу робочої сили та жорсткий ринок праці, компанії по всьому світу збільшують свої інвестиції. в чат-ботах. Gartner прогнозує, що до 2027 року чат-боти стануть основним каналом обслуговування клієнтів приблизно для чверті організацій.

IDC дослідила потенційні бізнес-наслідки генеративних програм ШІ та дійшла висновку, що «основним застосуванням ранніх версій генеративного ШІ є керовані ШІ чат-боти та агенти для контакт-центрів і самообслуговування клієнтів, такі як Salesforce і Genesys, і вони мають спочатку дала неоднозначні результати».

Чи були ці «змішані результати» через відсутність облич? «Наше бачення полягає в тому, щоб порушити те, як люди взаємодіють із будь-чим цифровим», — каже Перрі. «Замість графічного інтерфейсу ми матимемо інтерфейс людини». Забудьте про посібники користувача та текстові чати. Якщо вам потрібна допомога в налаштуванні нового пристрою, чи не краще було б поговорити з автоматизованим людиноподібним агентом?

За словами Перрі, переваги, які підприємства отримують від використання цифрових людей на базі D-ID, «полягають у кращому зв’язку зі своїми клієнтами, кращому використанні їхніх продуктів і вищій задоволеності клієнтів», а також значному зниженні вартості підтримки клієнтів і помітне збільшення її масштабів.

Крім того, що D-ID пропонує розробникам свій API, тісно співпрацює зі своїми корпоративними клієнтами, пропонуючи їм три варіанти використання великих мовних моделей: використання існуючої функціональності моделей, таких як GPT-3, із додатковими огорожами; навчання існуючих моделей конкретному корпоративному контенту, такому як маркетингові матеріали; і використання традиційних методів обробки природної мови (NLP), таких як структуровані запитання та відповіді із заздалегідь визначеними правилами.

Я запитав Перрі про широко розрекламовані невдачі (неточність, «галюцинації» тощо) сучасних генеративних моделей ШІ. Він вважає, що завдяки ресурсам технічних гігантів, які стоять за цими моделями, і їхньому широкомасштабному тестуванню, що триває, вони швидко покращать свою продуктивність. Він також нагадав мені, що «етика та конфіденційність — у нашій ДНК», оскільки D-ID спочатку було створено п’ять років тому як рішення для деідентифікації.

D-ID також брав участь у більш ніж річному процесі створення набору керівних рекомендацій для тих, хто створює, ділиться та розповсюджує контент, створений ШІ. Щойно про це було оголошено як Партнерство щодо відповідальних практик AI для синтетичних медіа.

«Ми віримо, що наступний TikTok буде побудовано на основі цієї технології», — каже Перрі.