🧠 OpenAI выпустила BrowseComp — сложный бенчмарк для ИИ-агентов с веб-доступом 📚 1 266 задач: надо искать редкие факты в интернете 🧩 GPT‑4 почти провалился
Этот сайт использует cookie для хранения данных. Продолжая использовать сайт, Вы даете свое согласие на работу с этими файлами.