Apple представила новые данные о производительности своих двух ИИ-моделей и открыла доступ к компактной 3-миллиардной версии для сторонних разработчиков. Тесты показали, что технологии ИИ от Apple пока уступают ведущим конкурентам.
Компания создала две модели: компактную для устройств (3 млрд параметров) и серверную. Согласно тестам Apple, устройство чуть опережает по результатам похожие модели, например Qwen-2.5-3B, и приближается к Qwen-3-4B и Gemma-3-4B. Apple объясняет это ростом эффективности, но разница в размерах моделей минимальна, что вызывает вопросы.
Серверная модель, по данным Apple, по качеству равна Llama-4-Scout. Параметры не раскрываются, но модель сопоставима с Scout от Meta, в которой 109 млрд параметров, из них 17 млрд активны. Серверная модель построена по архитектуре “parallel track mixture-of-experts” (MoE), что позволяет нескольким ИИ работать одновременно. Однако даже при этом она не может превзойти более крупные модели вроде Qwen-3-235B или GPT-4o.
Для работы на устройствах используется сильное сжатие, чтобы модель работала эффективно на iPhone и iPad, а серверная версия применяет специальное графическое сжатие.
В задачах распознавания изображений модель для устройств конкурирует с InternVL-2.5-4B, Qwen-2.5-VL-3B-Instruct и Gemma-3-4B. Apple утверждает, что её решение превосходит InternVL и Qwen, но лишь сравнимо с Gemma-3-4B. Серверная модель выигрывает у Qwen-2.5-VL-32B менее чем в половине случаев и всё ещё отстаёт от Llama-4-Scout и GPT-4o.
Каждая из моделей Apple использует разные системы распознавания: серверную поддерживает ИИ на 1 млрд параметров, устройство — 300 миллионов параметров. Обе обучались на базе из более 10 млрд пар “картинка-текст” и 175 млн документов с изображениями.
Разработчики теперь могут использовать 3-миллиардную модель через новый Foundation Models Framework. Apple подчёркивает, что эта версия подходит для задач вроде суммирования текста, извлечения информации и анализа, но не предназначена для работы в роли чат-бота. Более мощная серверная модель пока остаётся только внутри Apple и обслуживает сервисы Apple Intelligence.
В фреймворк встроены бесплатные ИИ-функции, тесно связанные с языком Swift. Разработчики могут отмечать данные для получения автоматических и релевантных результатов, а через API расширять возможности модели.
Для улучшения многоязычной работы словарь моделей расширили с 100 000 до 150 000 слов. Проведены тесты для 15 языков, чтобы обеспечить корректность ответов в разных регионах. Модели обучались на “сотнях миллиардов страниц”, собранных веб-краулером Applebot.
Компания заявляет, что Applebot учитывает запреты robots.txt и не использует личные данные пользователей для обучения. Однако, по-прежнему обсуждается вопрос, считается ли отсутствие отказа согласием на использование данных.
Последние тесты Apple подтверждают прежние опасения перед WWDC: новые ИИ-модели компании пока отстают от решений Google и OpenAI. По результатам заметно, что системы Apple не достигают показателей лидеров рынка.
*Meta — запрещённая в РФ организация.