Нейросети, используемые для проверки книжной продукции, продолжают выдавать неожиданные и порой абсурдные результаты. Как сообщили гендиректор издательства «Эксмо» Евгений Капьев и телеграм-канал «Осторожно, новости», алгоритмы блокируют фамилию классика детской литературы Виктора Драгунского из-за ее созвучности английскому слову drug («наркотик»). Аналогичная судьба постигла слово «героиня» и фамилию писателя Коноплева.
В пресс-службе издательской группы «Эксмо-АСТ» назвали это «одним из распространенных казусов, с которым сталкивается книжная отрасль». По словам инсайдеров, ошибки ИИ разнообразны: от неверной маркировки медицинской литературы о опорно-двигательном аппарате как порнографического контента до блокировки безобидных художественных произведений.
Из-за несовершенства автоматических систем редакторы вынуждены вручную проверять огромные объемы текстов, тратя дополнительное время и ресурсы на исправление ошибок нейросетей.
Список книг с маркировкой
Напомним, Российский книжный союз недавно опубликовал на своем сайте перечень произведений, которые подлежат маркировке из-за упоминания наркотиков. Список будет обновляться еженедельно.
В первую версию попали 1006 произведений, среди которых:
- романы Виктора Пелевина («Чапаев и Пустота», «Generation „П“», «Transhumanism Inc.» и другие);
- книги Владимира Сорокина («День опричника» и «Сахарный кремль»);
- две книги Маргариты Симоньян — сборник рассказов «Водоворот» и роман «В начале было Слово — в конце будет Цифра»;
- «Nirvana. Личные дневники Курта Кобейна».
Маркировка призвана информировать читателей о наличии в книгах контента, связанного с наркотическими веществами, но, как показывают случаи с классической литературой, механизмы автоматического распознавания все еще далеки от совершенства.