browsecamp
OpenAI выпустила BrowseComp — сложный бенчмарк для оценки ИИ-агентов с функцией веб-браузинга
🧠 OpenAI выпустила BrowseComp — сложный бенчмарк для ИИ-агентов с веб-доступом 📚 1 266 задач: надо искать редкие факты в интернете 🧩 GPT‑4 почти провалился
Gimal-Ai