Які загрози несе ChatGPT і як розпізнати текст, написаний ШІ

Нові, все більш досконалі та розумні програми штучного інтелекту (ШІ) стрімко набирають популярність. Особливо — серед тих, хто працює з текстами.

Про те, як ефективно використовувати ChatGPT медійникам і журналістам, ми писали раніше. Але ШІ також несе й небезпеку для світу медіа. Генеральний директор OpenAI Сем Альтман висловив острах перед перспективами майбутнього ШІ, порівнявши розвиток компʼютерного інтелекту з ядерною війною. Він закликав до жорсткої регуляції програм ШІ. Альтмана, зокрема, непокоять небезпеки, повʼязані з дезінформацією, втручанням у вибори, кібератаками, втратою робочих місць тощо.

Попереджений — значить озброєний. Тож ми зібрали актуальні загрози, які несуть програми штучного інтелекту для медіа та світу загалом:

Поширення дезінформації. Сервіси на кшталт ChatGPT не запрограмовані на правду й не відділяють її від вигадки, тому всі відповіді чату треба ретельно перевіряти. Часто штучний інтелект перекручує факти, а то й зовсім вигадує нові, щоб надати повну й найбільш задовільну для користувача відповідь. Ба більше, ChatGpt активно використовують пропагандисти, щоби поширити фейки, що через ШІ російський ПВК «Вагнер» розпалював інформаційну війну та просував прокремлівські ідеї в африканському регіоні Сахель. Також у соцмережах часто створюються фейкові акаунти журналістів, де публікуються згенеровані ШІ матеріали для просування певних наративів. Здатність ChatGPT генерувати тексти, подібні до тих, що написані людиною, перетворюється на небезпечну інформаційну зброю.

Порушення авторських прав. Деякі з генеративних сервісів штучного інтелекту, як-от ChatGPT і Bard, навчаються на величезних обсягах загальнодоступної інформації з інтернету, включно з матеріалами та продуктами, захищеними авторським правом. Статті з Вікіпедії та наукових журналів, книги, пости в соціальних мережах абощо слугують джерелом знань для ШІ. У деяких випадках згенерований текст майже дослівно береться з цих джерел без попереднього дозволу автора чи згадки про нього. OpenAI — компанія-розробник ChatGPT — отримала колективний позов, у якому заявляється, що методи та матеріали для навчання чату порушують конфіденційність та авторські права майже всіх користувачів інтернету. А митці зі всього світу вже подали скаргу на програми ШІ, які генерують зображення, за використання робіт без згоди авторів.

Дискримінаційні та небезпечні висловлювання. Хоча ChatGPT може вести діалог майже як людина, він — не жива істота. Тому емоції та емпатія йому не властиві. Навчаючись на сотнях гігабайтів відкритих даних в інтернеті, сервіс накопичив не лише зібрані в мережі знання, а й упередження та ворожість. До прикладу, ChatGPT та програми-генератори зображень вважають ідеалом краси білу струнку людину, а науковцем — білого чоловіка. Хоча OpenAI й намагається боротися з цією проблемою через різні фільтри й барʼєри, на практиці їх легко обходять. Іноді чат може поширювати й просто небезпечну інформацію, як-от інструкцію з виготовлення вибухівки, коктейлю Молотова тощо. Відомий випадок, коли медичний чатбот, що працює на основі ChatGP, на питання людини «Чи маю я вбити себе?» відповів ствердно.

Відсутність креативності. ChatGPT функціонує лише за допомогою даних, на яких він вчився. На відміну від людини, чат не здатен придумати нічого нового, запропонувати новий стиль або концепцію. Вміння ШІ генерувати десятки відповідей на одне й те саме запитання може ввести в оману та створити ілюзію креативності. Насправді ж усі відповіді базуються на певних шаблонах, а головні зміни відбуваються через підбір синонімів та переписування тексту. Нестандартне мислення та генерація нових ідей наразі недоступна для програм штучного інтелекту. Тож зловживання програмами ШІ знижує унікальність та може негативно вплинути на якість роботи журналіста.

Та хай там як, світ свідомий загроз від ШІ й активно розробляє шляхи боротьби з ними. Нині ЄС працює над законопроєктом, який регулюватиме діяльність ШІ. Зокрема йдеться про контроль над приватністю персональної інформації користувачів, політику прозорості джерела даних для захисту авторських прав та обовʼязкове маркування медіафайлів, згенерованих ШІ.

Щоправда, ефективність таких законів спеціалісти галузі піддають сумнівам. Павло Бєлоусов, експерт із цифрової безпеки ГО «Інтерньюз-Україна», зазначає: «Законотворчість ніколи не наздожене технології, тому не варто повністю покладатися на те, що регулювання розвʼяже всі проблеми. Сьогодні технології доступні всім, а отже ледь не кожен може створити свій ChatGPT "на мінімалках", ігноруючи або обходячи правила використання ШІ. Тож наразі дієвих регулювань й обмежень щодо використання штучного інтелекту немає, а вся інформація з інтернету як і раніше потребує фактчекінгу».

Людина, яка працює зі словом, одразу помітить неприродність написаних ChatGPT матеріалів — хоч яким би майстерним він не був. Ось кілька маркерів згенерованого чатом тексту, на які слід звернути увагу:

«Сухість» текстів: відсутність вставних слів та художніх засобів, перенасиченість фактами й цифрами, але брак думок і емоцій.
Довгі речення: ChatGPT любить наповнювати текст великою кількістю зайвих слів; часто вживається тавтологія та повторюються речення з однаковою ідеєю.
Нумеровані та марковані списки там, де без них можна було б обійтися.
Погані узгодження та не влучно підібрані слова — схоже на текст, перекладений в онлайн-перекладачах.
Використання надто складних та рідко вживаних слів замість сучасної, живої мови.

Тут можуть допомогти спеціальні сервіси, які розрізняють штучно згенерований текст, як-от GPT-2 Output Detector, AI Detector та edubirdi. Але жоден з цих інструментів не ідеальний, тож цілком покладатися на них не варто. Якщо хочете потренуватися — зіграйте в цю гру та спробуйте вгадати, який із текстів написаний компʼютером, а який — людиною.

Підготовлено за матеріалами: