Исследователи предлагают полностью изменить способ хранения памяти и контекста в ИИ. Они разработали концепцию Semantic Operating System — системы, которая может хранить, обновлять и удалять информацию десятилетиями, напоминая работу человеческой памяти и превосходя сегодняшние короткие контекстные окна.
Авторы выделяют четыре этапа развития контекстных систем. В 1990-х годах были системы, требовавшие четких команд; они работали только с четко структурированной информацией. С появлением моделей типа GPT-3 в 2020 году такие системы стали понимать текст на естественном языке и полу-сохранять детали разговоров, что раньше было невозможно.
Компания Anthropic недавно снова подняла этот вопрос, возвращая термин “контекстная инженерия” в практику. Разработчик запросов Райли Гудсайд использовал этот термин еще в начале 2023 года, а летом 2025 года его обсуждали глава Shopify Тоби Лютке и бывший исследователь OpenAI Андрей Карпаты.
В новой схеме, Этап 3.0 связан с обработкой эмоций и социальных сигналов на уровне человека, а Этап 4.0 включает системы, способные понимать людей даже лучше, чем они понимают себя. Полный переход к такому уровню вызывает вопросы. Исследователи отмечают: “Мы сейчас в Эре 2.0 и переходим к Эре 3.0.”
Авторы подчёркивают важную проблему: точность моделей падает, когда растёт контекст. Память многих систем уже на половине заполнения начинает работать хуже. При этом вычислительная нагрузка увеличивается не линейно, а вчетверо с удвоением контекста. Например, для 1000 токенов требуется миллион сравнений, а для 10 000 — уже сто миллионов.
Это объясняет, почему загрузка в чат большого PDF обычно не даёт хороших ответов — модели эффективнее, если оставить только нужные страницы. Большинство интерфейсов этим не занимается, потому что обучить пользователей управлять контекстом сложно.
Некоторые компании хотят создать идеальный поиск по всем корпоративным данным на базе ИИ, но сегодня контекстная и запросная инженерия должны работать вместе. Генеративный поиск помогает найти новое, но редко выдаёт точный результат с первого раза. Чтобы понять возможности модели, важно знать, какой контекст ей доступен — это и есть суть контекстной инженерии.
Исследователи считают, что Semantic Operating System может преодолеть ограничения существующих подходов, создав устойчивое и более структурированное хранение контекста. Для этого нужны четыре ключевые функции:
- Хранение информации с сохранением порядка (например, с помощью временных меток).
- Структурирование по ролям: “цель”, “решение”, “действие”.
- Преобразование данных в пары вопрос-ответ.
- Создание иерархий от общего к частному.
Каждый способ имеет недостатки: пары “вопрос-ответ” сбивают мыслительный процесс, иерархии делают информацию яснее, но теряют связи или изменчивость со временем.
Современный ИИ должен работать не только с текстом, но ещё с изображениями, аудио, видео, кодом и датчиками. Каждая “модальность” отличается: текст — последовательный, изображения — пространственные, аудио — непрерывно. Авторы описывают три подхода:
- Всё приводится в общий “векторный” формат, где похожие идеи сближаются.
- Все типы данных подаются в один трансформер, где они обрабатываются параллельно.
- Используется “кросс-внимание”, чтобы фокусироваться на деталях одной модальности, исследуя другую.
В отличие от человеческого мозга, ИИ пока остается привязан к фиксированным связям между форматами данных. Центральный принцип Semantic Operating System — “self-baking”: превращение коротких впечатлений в устойчивые, структурированные воспоминания. Краткосрочная память хранит активные данные, долгосрочная — повторяющиеся или значимые. Обучение происходит, когда информация перемещается между ними.
Первые примеры уже есть. LeadResearcher от Anthropic способен сохранять крупные исследовательские планы при работе с объёмом свыше 200 000 токенов. Google Gemini CLI использует файловую систему как простую базу для хранения и сжатия информации об этапах и правилах проектов. Alibaba Tongyi DeepResearch сжимает накопленные данные в “состояния рассуждения”. Это позволяет проводить быстрые и эффективные запросы без обращения ко всей истории.
Авторы предполагают, что интерфейсы “мозг-компьютер” в будущем помогут фиксировать не только действия, но и внимание, эмоции, умственные усилия. Такие системы расширят память с внешних событий на внутренние мысли.
В конце работы даётся философское размышление. Ссылаясь на Карла Маркса, авторы пишут, что цифровые следы, как и соцсвязи, определяют нас: “Человеческий разум, возможно, не будет загружен, но человеческий контекст — да; контекст превращается в новую форму знаний, памяти и личности.”
Они полагают, что наши решения, стиль общения и тип мышления могут остаться и развиваться даже после нашей жизни. Контекст — это не только память, но и часть индивидуальности. Цифровые следы смогут менять жизнь после смерти человека, а Semantic Operating System станет базой для такой долговременной памяти.






















