Компания Anthropic, занимающаяся разработкой генеративного искусственного интеллекта (GenAI), обратилась в суд США с заявлением, что использование авторских материалов в процессе обучения больших языковых моделей (LLM) является “добросовестным использованием”. Она утверждает, что существующие инструменты искусственного интеллекта общего назначения “просто не могли бы существовать”, если бы компаниям пришлось платить за лицензии на материалы. По законодательству США, “добросовестное использование” позволяет ограниченное использование авторских материалов без разрешения для таких целей, как критика, новостная отчетность, обучение и исследования.
В октябре 2023 года группа музыкальных издателей, включая Concord, Universal Music Group и ABKCO, начала судебное разбирательство против Anthropic, поддерживаемой Amazon и Google, требуя компенсаций за “систематическое и широкомасштабное нарушение авторских прав на их песенные тексты”. В иске, поданном в окружной суд Теннесси, утверждается, что Anthropic, создавая и эксплуатируя свои модели ИИ, “незаконно копирует и распространяет огромные объемы авторских произведений”.
Однако Anthropic возразила, что обучение ее модели ИИ Claude является “совершенно законным использованием материалов”, аргументируя, что использование авторских произведений в данных для обучения предназначено для анализа, который не связан с выражением какой-либо идеи оригинального произведения. Компания утверждает, что такое использование не препятствует продаже оригинальных работ и даже при коммерческом использовании является достаточно трансформативным.
В документе, представленном в суд 16 января 2024 года, Anthropic продолжила свою аргументацию, заявив, что “было бы невозможно собрать достаточное количество контента для обучения LLM, такого как Claude, через лицензионные сделки по любой цене”. Компания подчеркнула, что использует данные, “широко собранные из общедоступного интернета”, и на практике “нет другого способа собрать обучающий корпус с необходимым масштабом и разнообразием”.
Музыкальные издатели утверждают, что Anthropic могла бы легко исключить их авторский материал из своего обучающего корпуса, но компания ответила, что уже внедрила “широкий спектр мер предосторожности”, чтобы предотвратить такое воспроизведение. Несмотря на это, меры не являются идеальными, и “особенно для пользователя, который намеренно пытается злоупотребить Claude, чтобы заставить его выводить материальные части авторских произведений, некоторые более короткие тексты могут проскочить”.
Компания также заявила, что масштаб данных, необходимых для обучения LLM, слишком велик, чтобы эффективно работала лицензионная система. Если бы требовалось получение лицензий для обучения LLM на авторских материалах, “современные инструменты искусственного интеллекта общего назначения просто не могли бы существовать”.
Данное дело и подобные ему против других компаний, использующих генеративный ИИ, включая OpenAI и Stability AI, а также технологических гигантов Microsoft, Google и Meta, еще не рассматривались в суде. Однако будущие решения суда начнут устанавливать прецеденты для будущего технологий.