Новый бенчмарк ClawWork для оценки ИИ-агентов
Появился новый БЕНЧМАРК для ИИ — тест производительности ClawWork проверяет, сможет ли агент заработать больше, чем потратить на работу.
Каждому ИИ-агенту дают $10. После этого он выбирает задания из списка, который охватывает 44 отрасли — от финансов и аналитики до поддержки клиентов и медицины. За их выполнение агенту начисля...
Текст новости загружается...