Статьи с тегом: Chatbot Arena

Исследование обвиняет платформу LM Arena в помощи ведущим лабораториям искусственного интеллекта в манипулировании результатами её теста.
Скандал в мире AI: популярный бенчмарк Chatbot Arena обвиняют в предвзятости и помощи крупным компаниям в манипулировании рейтингами. Узнайте, как избранные участники могли улучшить свои позиции за счет ухудшения результатов конкурентов и что это значит для честной оценки AI-моделей.

Грок обновляет гонку ИИ
Новый продукт Илона Маска — модель ИИ Grok-3 — быстро завоевал вершину рейтинга Chatbot Arena и первое место в App Store, опередив даже ChatGPT. xAI не останавливается на достигнутом и обещает вскоре выпустить голосовые интерфейсы и десктопные приложения.