Говорите ли вы на Apertus? | Parlez-vous Apertus ?
Подтверждения этой новости мы ждали в течение последних нескольких месяцев, и вот – свершилось: Швейцария запускает Apertus, свою собственную языковую модель, лежащую в основе всех сервисов генеративного искусственного интеллекта. Один из самых мощных компьютеров на планете, десятки инженеров мирового уровня и очень большие амбиции – вот три ингредиента, которые позволили Швейцарии совершить этот важный прорыв в области искусственного интеллекта.
Эта сверхсложная компьютерная модель, названная «Apertus», была разработана специалистами из EPFL, EPFZ, а также Швейцарского центра научных вычислений, расположенного в Тичино. Ее цель, если выразить одной фразой: предложить швейцарскую, суверенную альтернативу американским, китайским и даже европейским моделям ИИ. Другими словами, амбиции чрезвычайно высоки. Швейцария, вложив миллионы из государственного бюджета, вступает в конкуренцию с такими гигантами, как OpenAI, издатель ChatGPT, Microsoft или Google. По словам его разработчиков, очень скоро каждый сможет использовать 100% швейцарское, безопасное и надежное решение в области ИИ. В то время, когда дебаты о цифровом суверенитете становятся все более интенсивными, Apertus четко позиционирует Швейцарию на мировой карте ИИ.
Возможно, еще не все наши читатели пользуются услугами искусственного интеллекта, и именно эта новость побудит их попробовать. Но для того, чтобы совершить этот собственный прорыв, надо понимать хотя бы основы того. Давайте разбираться вместе.
Что такое языковая модель?
Apertus — это языковая модель, то есть программа искусственного интеллекта, предназначенная в первую очередь для понимания и генерации текста. Она была обучена путем поглощения огромных количеств текстов, доступных в Интернете, с целью изучения языка и создания гигантской базы знаний. На основе этих моделей могут быть построены сервисы типа ChatGPT, которые представляют собой интерфейсы, позволяющие общаться с ИИ как с собеседником.
Сегодня крупнейшие языковые модели являются американскими. Среди них можно назвать ChatGPT от OpenAI, Gemini от Google, Claude от Anthropic, Llama от Meta (группа Марка Цукерберга). Отныне Apertus займет свое место рядом с ними.
Почему Швейцария решила этим заняться?
ИИ очень быстро стал использоваться повсеместно в Швейцарии — частными лицами, предприятиями и административными органами. «В некоторых областях он превосходит человеческие возможности, что говорит о его мощности. Но следует помнить, что эти сервисы, эти языковые модели разработаны горсткой технологических гигантов, которые держат в секрете их конструкцию и данные, на которых они были построены. И это огромная проблема. Мы не можем допустить, чтобы основания столь мощного ИИ находились в руках небольшой группы транснациональных корпораций», — утверждает Антуан Босселю, директор Лаборатории обработки естественного языка в EPFL и соруководитель Swiss AI Initiative, организации, созданной EPF и Конфедерацией.
Отсюда и возникла идея, выдвинутая 18 месяцев назад Swiss AI Initiative, разработать открытую, прозрачную модель, доступную для всех. Идея заключалась в том, чтобы предложить альтернативу, в частности, американским коммерческим моделям и создать модель, которую могут анализировать все – Наша Газета своевременно информировала своих читателей об этом проекте.
Как был разработан Apertus?
В масштабе Швейцарии мобилизованные ресурсы представляются очень значительными. Было задействовано около 150 инженеров и профессоров EPFL, EPFZ и Швейцарского центра научных вычислений (CSCS). Они воспользовались вычислительной мощностью Alps, суперкомпьютера CSCS, который начал свою работу в начале 2024 года в Лугано — на тот момент он был шестым по мощности в мире. Этот монстр оснащен 10 000 графических процессоров последнего поколения, в том числе от американского гиганта Nvidia, и стоил около 100 миллионов франков. (Почему предпочтение было отдано американскому продукту, мы уже объясняли.) В общей сложности, с учетом оборудования, энергии и заработной платы, швейцарская модель обошлась в сумму от 5 до 10 миллионов франков. Для обучения Apertus потребовалась энергия локомотива, работающего на 50 % своей мощности, поясняют разработчики модели доступным простым смертным языком.
«Мы использовали около 40 % мощности Alps для создания Apertus. Мы очень внимательно относились к обучению модели на открытых данных, не защищенных авторским правом, чтобы не похищать никакой контент. И у нас есть международная цель, поскольку 40% этих данных не на английском языке — русский язык составляет 20% из этих 60%, а мандаринский, крупнейший диалект китайского языка, — 15%. Мы обработали информацию на 1000 языках», — утверждает Иманол Шлаг, технический руководитель проекта и исследователь в EPFZ.
Контент, признанный «токсичным», такой как спам, тексты, содержащие ненависть или дискриминацию, был удален из базы обучения швейцарской модели. Это – очень важный момент, особенно на фоне трагедии в Америке. Родители 16-летнего подростка из Калифорнии, покончившего жизнь самоубийством, подали иск против OpenAI. Они обвинили ChatGPT в том, что он предоставил их сыну подробные инструкции по самоубийству и подтолкнул его к этому шагу. Вследствие этой драмы OpenAI внедрит механизм родительского контроля для ChatGPT. Родители скоро смогут «связать свой аккаунт с аккаунтом своего подростка» и таким образом контролировать, как ChatGPT отвечает ему, заявила американская компания OpenAI.
Как сравнить Apertus с другими моделями?
Швейцарская модель имеет две особенности по сравнению со своими основными конкурентами. Во-первых, она является открытой, то есть полностью доступной. Это означает, что любой – компания, администрация или частное лицо – может изучить ее параметры и код. Apertus распространяется по лицензии Apache 2.0, широко распространенной лицензии на свободное и открытое программное обеспечение. Она позволяет любому использовать, изменять и распространять программное обеспечение, в том числе в коммерческих проектах.
Существуют и другие модели с открытым исходным кодом, предлагающие большую или меньшую степень прозрачности. Например, широко используемая модель Llama 3, предложенная Meta, материнской компанией Instagram, Facebook и WhatsApp. Но Apertus, разработанный академическими и некоммерческими учреждениями, предлагает беспрецедентный уровень прозрачности. Добавим, что модель должна иметь высокий уровень безопасности. Таким образом, она не должна отвечать на запросы о производстве оружия для террористов или вступать в разговоры сексуального характера, например.
А как насчет качества результатов?
Разумеется, это важный вопрос. В ближайшие месяцы модель необходимо будет протестировать, чтобы составить представление о ее возможностях. Обычно мощность модели — а значит, качество ее ответов и работы — измеряется количеством ее параметров. DeepSeek, китайская модель, которая недавно произвела сенсацию, сегодня насчитывает около 700 миллиардов параметров. «Apertus имеет в десять раз меньше, что ставит его на уровень Llama 3 на момент запуска», — сравнивает Иманол Шлаг.
Швейцарская модель будет доступна в двух версиях: одна с 8 миллиардами, а другая с 70 миллиардами параметров. Более легкая версия может использоваться локально на компьютере. «Наша модель полностью конкурентоспособна по сравнению с открытыми моделями, но не будет такой же мощной, как недавняя GPT-5 от OpenAI. Мы играем в другой лиге, с моделью, которая обладает огромными качествами с точки зрения прозрачности, открытости и надежности. И мы не перестанем улучшать Apertus», — уверяет Антуан Босселю.
Следует отметить, что на начальном этапе швейцарская модель не будет способна генерировать изображения или видео, что уже несколько месяцев доступные в коммерческих моделях.
Как получить доступ к Apertus?
Как уже упоминалось выше, с одной стороны есть языковые модели, а с другой — интерфейсы типа ChatGPT, которые может использовать каждый. На данный момент Apertus является моделью, и никто пока не разработал интерфейс для частных лиц. «Но это только вопрос времени, я ожидаю, что инженеры или компании разработают и запустят такие интерфейсы в ближайшие недели», — говорит Антуан Босселю.
Компании и административные органы, в которых работают инженеры, владеющие этими моделями, смогут получить прямой доступ к Apertus через платформы, широко используемые в сфере ИИ, такие как Hugging Face. Swisscom, партнер федеральных политехнических школ в этом проекте, также предоставит швейцарскую модель.
Следует отметить, что любой желающий сможет получить доступ к Apertus, протестировать и использовать его: любые компании или административные органы, независимо от их национальности. Ограничений нет.
Какое использование ожидается в дальнейшем?
В последние недели команды, стоящие за Apertus, уже протестировали модель. Так, Федеральный суд, исторически очень заинтересованный в испытании открытых и суверенных решений, тестирует швейцарскую модель внутри организации, но данный момент не известна степень удовлетворенности судей, как и прочих «испытателей». Swisscom, скорее всего, будет использовать швейцарское решение внутри компании, а затем, возможно, и для обслуживания своих клиентов.
В то же время можно предположить, что многие швейцарские государственные учреждения заинтересуются этой моделью для развития услуг для граждан. Государственные учреждения будут уверены, что данные, на которых был обучен Apertus, «чисты», что может быть важным аспектом. Не говоря уже, конечно, о важности использования своего, отечественного решения.
Как будет развиваться Apertus?
«Мы будем очень внимательно наблюдать за тем, как эта модель будет использоваться как в государственном, так и в частном секторе, — отвечает Иманол Шлаг. — Цель в том, чтобы выявить ее сильные и слабые стороны и понять, как ее улучшить. Тот факт, что она является открытым исходным кодом, будет огромным преимуществом, поскольку мы будем получать отзывы от очень важного технологического сообщества».
Федеральные политехи начнут поиск партнеров как в государственном, так и в частном секторе — и можно с большой долей вероятности предположить, что в ближайшие месяцы они будут очень востребованы. Можно также предположить, что в скором времени Apertus должен будет предложить больше функций. Например, для чтения и распознавания изображений, что является чрезвычайно важной функцией, в частности, в медицине.
Каково будет влияние швейцарской модели?
Даже самые активные патриоты отечественной модели понимают, что акции OpenAI, Microsoft или Google не рухнут на бирже с ее появлением. Но несомненно, что это окажет небольшое давление на их деятельность, побуждая их, по-видимому, проявить большую прозрачность в отношении своих моделей. Однако американские и китайские гиганты ИИ будут по-прежнему подчеркивать прежде всего мощь и возможности своих моделей.
По всей видимости, наибольшее влияние будет ощущаться на уровне Швейцарии: администраторы и, возможно, клиенты швейцарских компаний, несомненно, будут ожидать, что государственные органы и швейцарские компании будут работать с Apertus. Но нет никакой уверенности нет и тут, поскольку мир ИИ очень изменчив, а влияние технологических гигантов очень велико.