Откриха следи от изкуствен интелект в милиони научни статии

Екип от американски и германски изследователи анализира над 15 млн. биомедицински статии и установи, че съдържанието, генерирано от изкуствен интелект, е проникнало незабележимо в академичните текстове, като се наблюдават характерни стилистични промени – например увеличаване на броя на цветистите глаголи и прилагателни.

„Тяхното проучване разкри, че от появата на LLM насам е налице съответно увеличение на честотата на определени стилистични избори на думи в академичната литература“, съобщава Phys.Org. „Тези данни сочат, че поне 13,5% от статиите, публикувани през 2024 г., са написани с известна степен на LLM обработка.“

От доклада:

Изследователите моделираха своето проучване въз основа на предишни изследвания в областта на общественото здраве, свързани с COVID-19, които успяха да направят изводи за въздействието на COVID-19 върху смъртността, като сравниха излишните смъртни случаи преди и след пандемията. Прилагайки същия подход „преди и след“, новото проучване анализира моделите на излишно използване на думи преди появата на LLM и след нея. Изследователите установиха, че след пускането на LLM е налице значителна промяна от излишната употреба на „съдържателни думи“ към излишна употреба на „стилистични и цветисти“ думи, като „показване“, „ключов“ и „борба“.

Чрез ръчно присвояване на части на речта на всяка излишна дума, авторите установиха, че преди 2024 г. 79,2% от излишните думи са били съществителни. През 2024 г. е налице ясно различима промяна. 66% от излишните думи са били глаголи, а 14% – прилагателни. Екипът също така е установил забележими разлики в употребата на LLM между различни области на научните изследвания, страни и места.

Информация от Slashdot

Вашият коментар

Вашият имейл адрес няма да бъде публикуван. Задължителните полета са отбелязани с *