Студент із Прінстона створює застосунок для ідентифікації текстів, написаних штучним інтелектом
Багато студентів вгадували неправильно. Тоді він зрозумів, що існує проблема, яка потребує вирішення. "Ця технологія буде ставати все кращою і кращою, штучний інтелект залишиться з нами. Це майбутнє, – сказав Тянь в інтерв'ю, опублікованому на англомовному сайті BBC.
"Але водночас, я вважаю, що ми повинні увійти в це майбутнє відповідально".
Ось чому 22-річний хлопець провів свої зимові канікули в кав'ярні у своєму рідному місті Торонто, працюючи над додатком, який може з високою точністю визначити, чи був текст написаний людиною, чи ботом.
Він створив його у відповідь на появу ChatGPT наприкінці минулого року – безплатного онлайн-чату, який може кваліфіковано писати майже все, – від есе англійською мовою і новинних статей до планів харчування і комп'ютерного коду. І все це – за допомогою простої підказки.
Популярність ChatGPT з моменту його запуску зустріли з тривогою, в тому числі й деякі американські школи, які заблокували його на своїх серверах, намагаючись запобігти шахрайству з боку учнів. Інші побоюються, що бот забере роботу у письменників і творчих людей або буде використаний хакерами в більш зловісних цілях для написання шкідливого програмного забезпечення.
Студент Тянь, який навчається на останньому курсі Прінстона, сказав, що розроблений ним додаток GPTZero є першим кроком до вирішення низки проблем, які можуть виникнути в міру того, як штучний інтелект стає розумнішим і більш доступним.
Додаток аналізує дві змінні в тексті – заплутаність і розривність (burstiness) – і присвоює кожній з цих змінних певну кількість балів.
По-перше, додаток вимірює, наскільки програма знайома з представленим текстом, враховуючи те, що вона бачила під час навчання. Чим менш знайомий текст, тим вища його складність, що означає, що "він, швидше за все, написаний людиною", – сказав Тянь.
Потім він вимірює розривність, скануючи текст, щоб побачити, наскільки він варіативний. Наприклад, чи є в тексті поєднання коротких і довгих речень? Або чи текст виглядає більш вирівняним і однорідним?
"Якщо ви побудуєте точний графік з плином часу, то написана людиною стаття буде сильно відрізнятися", – сказав пан Тянь.
Він все ще працює над вдосконаленням GPTZero, але вже випустив бета-версію для загального користування. У своєму твіті він продемонстрував, як додаток може успішно винюхувати різницю між есе, опублікованим в журналі New Yorker, і листом, написаним ChatGPT.
Згодом він протестував свій застосунок на статтях BBC, написаних журналістами, і таких, що написані ChatGPT, використовуючи той самий заголовок як підказку. До речі, Тянь раніше працював у відділі розслідувань BBC. За його словами, програма успішно визначила різницю між текстами з рівнем помилкових спрацьовувань менш як 2%.
З моменту запуску програмою Тяня скористалися тисячі людей. За його словами, з ним зв'язувалися викладачі та члени приймальних комісій університетів з усього світу, які цікавилися тим, як він працює.
Цікаво, як штучний інтелект робить те, що й людина. З розвитком ШІ треба бути обережними. Необхідно мати інструмент для ідентифікації, де ШІ, а де продукт людської творчості.