Бестселлеры о Гарри Поттере все чаще используются для экспериментов с технологиями ИИ из-за непреходящего влияния серии на массовую культуру, широкого спектра языковых данных и сложной игры слов на страницах книг.
В научной статье «Кто такой Гарри Поттер?» описывается методика, помогающая большим языковым моделям выборочно забывать информацию. Это важная задача для области ИИ: большие языковые модели обучаются на огромных массивах онлайн-данных, включая защищенные авторским правом материалы и прочий проблемный контент — в результате на разработчиков этих систем все чаще подают в суд, а их работы привлекают все более пристальное внимание общественности. Авторы статьи, сотрудники Microsoft, продемонстрировали, что ИИ-модели можно изменять, удаляя любую информацию о существовании книг о Гарри Поттере, включая персонажей и сюжеты, не жертвуя при этом творческими и аналитическими способностями системы. Ученые говорят, что выбрали книги о юном волшебнике из-за их известности — об элементах сюжета и персонажах знают даже те, кто их не читал.
Исследователи ИИ цитируют Гарри Поттера не менее десяти лет, и сегодня книги о нем упоминаются в работах все чаще, поскольку и ученые, и технологии все больше сосредоточены на инструментах ИИ, помогающих в обработке естественного языка и механизмов реакции на него.
Источник: 3dnews.ru