Google собирается использовать весь контент в интернете для обучения ИИ Bard
Компания Google, гигант поисковой системы, в настоящее время создаёт свою собственную крупноязыковую модель искусственного интеллекта (ИИ) под названием Bard. Для её обучения она использует имеющиеся в Сети общедоступные данные.
Согласно отчёту Gizmodo, обновлённая политика конфиденциальности Google предполагает, что теперь будет использоваться вся общедоступная информация в Сети для создания, а также обучения новых продуктов и услуг, таких как возможности Google Bard, а также Translate и Cloud AI.
В отчёте также предполагается, что в соответствии с этой новой политикой весь Интернет сам по себе становится игровой площадкой ИИ для компаний, которые обучают эти большие языковые модели с использованием общедоступных данных.
Хотя этот подход поможет Google в разработке превосходных генеративных инструментов, отмечается, что он использует преимущества открытости Интернета.
Илон Маск утверждает, что ограничение на чтение в Twitter* было введено, чтобы компании не могли собирать данные с платформы для обучения своих моделей ИИ, ограничивая доступ к данным как для отдельных лиц, так и для компаний. Также говорится, что новые сборы Reddit за API предназначены для того, чтобы компании не могли свободно использовать данные из сабреддитов.
Ранее использование общедоступных данных для обучения моделей ИИ вызвало дискуссии относительно аспекта авторского права и того, как всего несколько субъектов контролируют весь Интернет.