15 ключових помилок, яких слід уникати під час навчання моделей ШІ Інновації

15 ключових помилок, яких слід уникати під час навчання моделей ШІ

Оскільки штучний інтелект стає все більш поширеним у сучасному світі, важливість ретельного навчання моделей ШІ для виконання складних завдань стає все більш критичною. Однак багато організацій роблять типові помилки в процесі розробки моделей ШІ, що призводить до неоптимальних результатів.

Деякі з цих помилок можуть включати недостатню кількість або низьку якість даних, відсутність чітких цілей і нерозуміння обмежень моделі. Нижче члени Ради з технологій Forbes досліджують ці та інші поширені помилки, яких допускають організації під час навчання моделей ШІ, і надають поради, як їх уникнути.

1. Відсутність моніторингу якості даних

Я познайомився з керівником відділу даних у компанії, що займається виробництвом безпілотних автомобілів. Вони заплатили за те, щоб дані зображення були позначені для них — наприклад, «клацніть зображення з велосипедами». Вони навчили модель, і продуктивність знизилася. Як виявилося, у їхніх даних відсутні мітки. Завдяки базовому моніторингу вони могли виявити це на ранній стадії, не перенавчаючи велику дорогу модель на поганих даних. «Сміття всередину, сміття геть», як кажуть. – Кайл Кірван, Bigeye

2. Невикористання різноманітного набору даних

Однією з ключових помилок, які організації допускають у навчанні моделей штучного інтелекту, є нездатність використовувати різноманітний набір даних. Це може призвести до необ’єктивних результатів. Щоб уникнути цього, організації повинні переконатися, що дані, які використовуються для навчання моделей штучного інтелекту, є репрезентативними та різноманітними, відображаючи різноманітні точки зору та досвід. Крім того, постійний моніторинг і тестування можуть допомогти виявити та усунути будь-які потенційні упередження в моделі ШІ. – Суніл Ранка, ТОВ «Предикли».

Технологічна рада Forbes — це спільнота для ІТ-директорів, технічних директорів і технічних керівників світового рівня. Чи маю я право?

3. Недостатня кількість потрібних типів даних

Однією з поширених помилок є відсутність достатньої кількості якісних, різноманітних і репрезентативних даних для навчання моделі. Це може призвести до поганої роботи і навіть до шкідливих наслідків. Щоб уникнути цього, дані слід вибирати точно, щоб відображати реальне населення світу, щодо якого модель робитиме прогнози. – Фардад Забетян, KUDO

4. Невикористання реальних даних клієнта

Компанії, що займаються штучним інтелектом, прагнуть шукати «ідеальні дані» для навчання та вдаються до синтетичних або створених у лабораторії довідників. Насправді дані забруднені, а шум повсюди, тому справжньою проблемою є його подолання. Я виявив, що більшість успішних компаній, що займаються штучним інтелектом, навчають моделі на даних реальних клієнтів і використовують свій досвід, щоб відокремити їх від шуму. – Елірон Екстейн, Ravin AI Limited

5. Не відповідайте на правильні запитання

Часто організації не навчають свої моделі штучного інтелекту відповідати на правильні запитання або не інтегрують їх у свої процеси таким чином, щоб це було ефективним. Подібно до того, як генерування бізнес-аналітики часто призводить до інформаційної панелі, на яку рідко звертають увагу, навчені моделі штучного інтелекту корисні, лише якщо вони прогнозують те, що хвилює працівників або клієнтів. Це може бути важко визначити. – Браян Джексон, дослідницька група Info-Tech

6. Наявність упереджених даних

Упереджені дані є поширеною проблемою компаній під час навчання алгоритмів ШІ. Модель штучного інтелекту, ймовірно, посилить суспільні упередження, якщо навчальні дані будуть упередженими. Це може призвести до несправедливих або дискримінаційних результатів і значних наслідків. Компанії повинні ретельно відбирати та готувати навчальні дані та постійно контролювати та оцінювати моделі штучного інтелекту, щоб усунути упередженість. – Шеллі Брансвік, Space Foundation

7. Не судити про прогнози МЛ

Моделі машинного навчання роблять прогнози, а не судження. Результати можуть бути неправильними і виглядати правильно, або бути правильними і виглядати неправильно, і оскільки машинне навчання нелегко інтерпретувати, ви не можете знати обґрунтування відповіді. Додайте це до проблеми упередженості, і ви зрозумієте, чому важливо розглянути, як застосувати рівень судження поверх будь-якого прогнозу машинного навчання. – Джеймс Дуез, Rainbird Technologies

8. Переобладнання моделі

Є багато помилок, які роблять новачки з цією захоплюючою технологією. Один переобладнаний. Простіше кажучи, вони перенавчають модель на певному наборі вхідних даних, і модель стає вузькою та крихкою щодо будь-яких змін, які не точно віддзеркалюють навчальні дані. – Тод Луфборроу, ViralGains

9. Нездатність розробити наскрізні рішення ШІ

Організаціям зазвичай не вдається розробити наскрізне рішення ШІ. Їм потрібно розуміти, як сьогодні експерти приймають рішення, які дані потрібні для покращення прогнозів і як збирати та обробляти відгуки для керування моделлю. Їм потрібно припинити спроби побачити, де технологія штучного інтелекту може розміститися в їхній організації; натомість їм потрібно розпочати розробку архітектури ШІ, як і будь-якої іншої складної системи. – Стівен Густафсон, Noonum, Inc.

10. Відмова від курування та балансування даних навчання

Організації можуть уникнути ключової помилки в навчанні моделі штучного інтелекту, ретельно відбираючи та збалансовуючи свої навчальні дані. Упереджені дані можуть спричинити неточні або несправедливі прогнози, тому організації повинні регулярно оцінювати свої дані на наявність упереджень і пом’якшувати їх за допомогою таких методів, як надмірна вибірка, доповнення даних або усунення упереджень. Це призводить до більш етичних і ефективних моделей ШІ. – Іман Адель, Paymob

11. Нехтування визначенням цілей

Організації часто нехтують належним визначенням і перевіркою своїх цілей під час навчання моделей ШІ. Без конкретних цілей може бути складно оцінити ефективність моделі ШІ, що може призвести до низької продуктивності або непередбачуваних ефектів. – Ніліма Мангал, Spectrum North

12. Без урахування голосу клієнта

Найбільша помилка – не врахувати голос клієнта. Якщо ви залучите клієнта до тренінгів зі штучного інтелекту, це гарантовано принесе розуміння, якого ніхто у вашій організації не має. Як додаткову перевагу, включення їх може допомогти важливому клієнту відчути себе ще важливішим. – Ронда Дібачі, HeyScottie.com

13. Не очищайте дані

Організації часто пропускають належну обробку та дезінфекцію даних, які використовуються для навчання моделей ШІ, що є критичною помилкою. Низька якість даних може призвести до того, що моделі штучного інтелекту будуть упередженими, неточними та ненадійними. Це може призвести до негативних наслідків, у тому числі неправильних суджень, упущених шансів і втрати репутації. – Девід Біттон, DoorLoop

14. Непереконання, що дані представляють хорошу та погану поведінку

Якщо моделі штучного інтелекту навчені на неправильних даних, прогнози також спиратимуться на цю неправильну поведінку. Коли ви працюєте з додатками штучного інтелекту та машинного навчання для безпеки та запобігаєте витоку даних, важливо переконатися, що дані представляють хорошу та погану поведінку. Якість даних під час інтелектуального аналізу функцій — забезпечення наявності правильних міток для контрольованого навчання — важлива для організацій, які навчають моделі ШІ. – Супріт Рао, Theom, Inc

15. Не враховує зсув даних і семантичний зсув

Коли організація масштабується та переходить у нові домени, країни та бізнес-напрямки, дані, на яких навчалися її моделі, починають змінюватися на основі даних, які зараз вводять її користувачі. Навчання моделей ШІ має бути постійним процесом, і багато уваги потрібно приділяти отриманню якісних репрезентативних даних. – Ісаак Геллер, Труліон

15 ключових помилок, яких слід уникати під час навчання моделей ШІ

1. Відсутність моніторингу якості даних

2. Невикористання різноманітного набору даних

3. Недостатня кількість потрібних типів даних

4. Невикористання реальних даних клієнта

5. Не відповідайте на правильні запитання

6. Наявність упереджених даних

7. Не судити про прогнози МЛ

8. Переобладнання моделі

9. Нездатність розробити наскрізні рішення ШІ

10. Відмова від курування та балансування даних навчання

11. Нехтування визначенням цілей

12. Без урахування голосу клієнта

13. Не очищайте дані

14. Непереконання, що дані представляють хорошу та погану поведінку

15. Не враховує зсув даних і семантичний зсув

Next Up

Загальне

Захоплення та інтереси

Технології та фінанси

Я шукаю..

15 ключових помилок, яких слід уникати під час навчання моделей ШІ

1. Відсутність моніторингу якості даних

2. Невикористання різноманітного набору даних

3. Недостатня кількість потрібних типів даних

4. Невикористання реальних даних клієнта

5. Не відповідайте на правильні запитання

6. Наявність упереджених даних

7. Не судити про прогнози МЛ

8. Переобладнання моделі

9. Нездатність розробити наскрізні рішення ШІ

10. Відмова від курування та балансування даних навчання

11. Нехтування визначенням цілей

12. Без урахування голосу клієнта

13. Не очищайте дані

14. Непереконання, що дані представляють хорошу та погану поведінку

15. Не враховує зсув даних і семантичний зсув

Next Up

Загальне

Захоплення та інтереси

Технології та фінанси