Apple уступает лидерам — новые AI-бенчмарки компании

Apple представила новые данные о производительности своих двух ИИ-моделей и открыла доступ к компактной 3-миллиардной версии для сторонних разработчиков. Тесты показали, что технологии ИИ от Apple пока уступают ведущим конкурентам.

Компания создала две модели: компактную для устройств (3 млрд параметров) и серверную. Согласно тестам Apple, устройство чуть опережает по результатам похожие модели, например Qwen-2.5-3B, и приближается к Qwen-3-4B и Gemma-3-4B. Apple объясняет это ростом эффективности, но разница в размерах моделей минимальна, что вызывает вопросы.

Серверная модель, по данным Apple, по качеству равна Llama-4-Scout. Параметры не раскрываются, но модель сопоставима с Scout от Meta, в которой 109 млрд параметров, из них 17 млрд активны. Серверная модель построена по архитектуре “parallel track mixture-of-experts” (MoE), что позволяет нескольким ИИ работать одновременно. Однако даже при этом она не может превзойти более крупные модели вроде Qwen-3-235B или GPT-4o.

Для работы на устройствах используется сильное сжатие, чтобы модель работала эффективно на iPhone и iPad, а серверная версия применяет специальное графическое сжатие.

В задачах распознавания изображений модель для устройств конкурирует с InternVL-2.5-4B, Qwen-2.5-VL-3B-Instruct и Gemma-3-4B. Apple утверждает, что её решение превосходит InternVL и Qwen, но лишь сравнимо с Gemma-3-4B. Серверная модель выигрывает у Qwen-2.5-VL-32B менее чем в половине случаев и всё ещё отстаёт от Llama-4-Scout и GPT-4o.

Каждая из моделей Apple использует разные системы распознавания: серверную поддерживает ИИ на 1 млрд параметров, устройство — 300 миллионов параметров. Обе обучались на базе из более 10 млрд пар “картинка-текст” и 175 млн документов с изображениями.

Разработчики теперь могут использовать 3-миллиардную модель через новый Foundation Models Framework. Apple подчёркивает, что эта версия подходит для задач вроде суммирования текста, извлечения информации и анализа, но не предназначена для работы в роли чат-бота. Более мощная серверная модель пока остаётся только внутри Apple и обслуживает сервисы Apple Intelligence.

В фреймворк встроены бесплатные ИИ-функции, тесно связанные с языком Swift. Разработчики могут отмечать данные для получения автоматических и релевантных результатов, а через API расширять возможности модели.

Для улучшения многоязычной работы словарь моделей расширили с 100 000 до 150 000 слов. Проведены тесты для 15 языков, чтобы обеспечить корректность ответов в разных регионах. Модели обучались на “сотнях миллиардов страниц”, собранных веб-краулером Applebot.

Компания заявляет, что Applebot учитывает запреты robots.txt и не использует личные данные пользователей для обучения. Однако, по-прежнему обсуждается вопрос, считается ли отсутствие отказа согласием на использование данных.

Последние тесты Apple подтверждают прежние опасения перед WWDC: новые ИИ-модели компании пока отстают от решений Google и OpenAI. По результатам заметно, что системы Apple не достигают показателей лидеров рынка.

Источник

*Meta — запрещённая в РФ организация.

Оцените статью
Gimal-Ai