Специалисты из США разработали алгоритм, который может с 99%-ной вероятностью отличить научные статьи и другие публикации, написанные настоящими людьми, от текстов ChatGPT и других нейросетей. Первые результаты тестирования алгоритма были опубликованы в статье в журнале Cell Reports Physical Science.
«Мы приложили максимум усилий для создания очень простого метода, который может начать использовать даже школьник для того, чтобы выявлять творчество ИИ в различных формах письменных источников. Данная проблема стала особенно острой в последнее время и теперь для внесения посильного вклада в борьбу с ней не обязательно быть специалистом в компьютерных науках», — отметила профессор университета штата Канзас Хэзер Десейр.
Профессор Десейр и ее коллеги подготовили набор статей, опубликованных в журнале Science, и использовали их в качестве обучающего материала для созданной ими научной версии ChatGPT, способной генерировать подобные тексты.
Их внимание привлек интересный факт: люди предпочитают использовать более сложные структуры абзацев, чем это делает нейросеть, а также они очень часто используют наречия и некоторые другие слова, в частности, «но», «однако», «хотя». С другой стороны, система ИИ любит употреблять слова «исследователи» и «другие», что реальные ученые делают довольно редко. Кроме того, для людей более характерна вариативная длина и структура предложений.
По словам ученых, этот алгоритм можно адаптировать и для поисков следов творчества ChatGPT и других систем ИИ в прочих формах письменных текстов. В перспективе это позволит быстро выявлять попытки выдать творчество нейросетей за свою работу школьников и студентов.
месяц
неделя
день