Новый протокол для лицензирования данных AI: решение проблемы авторских прав

Новый протокол для лицензирования данных AI: решение проблемы авторских прав

После крупного урегулирования авторских прав на 1,5 миллиарда долларов в одной из ведущих AI-компаний, индустрия искусственного интеллекта сталкивается с вызовом лицензирования данных для обучения. В настоящее время рассматривается множество исков, связанных с использованием данных без разрешения, что угрожает привести к лавине судебных разбирательств и серьезным последствиям для развития отрасли.

В ответ на эту проблему группа технологов и издателей запустила масштабируемую систему лицензирования данных под названием Real Simple Licensing (RSL). Система уже поддерживается крупными интернет-платформами, такими как Reddit, Quora и Yahoo. Основная идея RSL — создать машиночитаемые лицензионные соглашения, которые смогут работать по всему интернету и упростить процесс получения разрешений на использование контента.

Технически протокол RSL устанавливает конкретные условия лицензирования контента, позволяя издателям выбирать, нужен ли индивидуальный лицензий или можно использовать стандартные условия Creative Commons. Эти условия автоматически указываются в файле robots.t на сайтах, что облегчает идентификацию лицензируемых данных.

С правовой стороны, создана коллективная организация RSL Collective, которая ведет переговоры и собирает роялти, подобно тому, как это делают организации для музыкантов и киноиндустрии. Это позволяет правообладателям централизованно управлять лицензированием и получать выплаты от множества пользователей.

В коллективе уже состоят такие издатели, как Yahoo, Reddit, Medium, O’Reilly Media, Ziff Davis и другие. Многие крупные компании поддерживают стандарт, даже если не входят в коллектив.

Однако остаются технические сложности с отслеживанием использования конкретных данных в обучении моделей ИИ, особенно если обучение не фиксируется в реальном времени. Тем не менее, создатели RSL уверены, что компании смогут адаптироваться и обеспечить прозрачность, чтобы правообладатели получали оплату.

Ключевой вопрос — примут ли AI-компании этот протокол. Несмотря на традиционное использование «бесплатных» данных из интернета, растет понимание необходимости честной оплаты за качественные наборы данных. Многие лидеры отрасли уже высказываются в поддержку создания подобных систем.

Таким образом, RSL может стать первым шагом к выстраиванию справедливой и эффективной системы лицензирования данных для искусственного интеллекта, которая поможет избежать юридических рисков и поддержит развитие технологий.

Tion