Создатели Stable Diffusion выпустили альтернативу GPT с открытым исходным кодом
После того как OpenAI действительно разожгла дебаты об искусственном интеллекте (ИИ) в целом и больших языковых моделях в частности с помощью своего ChatGPT, в последнее время на рынок выходит всё больше и больше больших моделей ИИ, которые часто являются моделями, конкурирующими с действиями GPT-4.
За всем этим следует ещё одна компания Stability AI, которая уже сделала себе имя в отрасли благодаря Stable Diffusion.
На этот раз языковая модель публикуется под названием StableLM. В отличие от OpenAI GPT-4, эта модель выпущена полностью с открытым исходным кодом. Это имеет много преимуществ для тех, кто заинтересован: во-первых, вы можете запускать модели разных размеров на своём компьютере и опробовать их без необходимости платить за OpenAI API или иметь дело с их фильтрами. Последнее важно, поскольку позволяет независимым исследователям лучше проверять потенциальные предубеждения.
Для компаний модели с открытым исходным кодом предлагают то преимущество, что они могут запускать и адаптировать их на своих собственных серверах. Это должно решить многие проблемы защиты данных, которые, например, влияют на OpenAI.
Как сейчас принято, языковая модель публикуется в различных размерах. В самой маленькой версии StableLM имеет 3 миллиарда параметров, а самая большая версия имеет тот же размер, что и GPT-3, с 175 миллиардами параметров.
Однако в настоящее время доступны только модели с 3 и 7 миллиардами параметров. Остальные будут представлены в ближайшие дни и недели. Меньшие модели обычно имеют то преимущество, что их использование требует гораздо меньше вычислительных ресурсов. В то же время их ответы зачастую более низкого качества.
В настоящее время повсюду появляются новые стартапы, которые предлагают что-то с GPT и Ко. В среднесрочной перспективе будет интересно посмотреть, какие бизнес-модели действительно работают, а какие снова уменьшатся после нынешнего ажиотажа.