Статьи с тегом: тестирование моделей

Исследование обвиняет платформу LM Arena в помощи ведущим лабораториям искусственного интеллекта в манипулировании результатами её теста.
Скандал в мире AI: популярный бенчмарк Chatbot Arena обвиняют в предвзятости и помощи крупным компаниям в манипулировании рейтингами. Узнайте, как избранные участники могли улучшить свои позиции за счет ухудшения результатов конкурентов и что это значит для честной оценки AI-моделей.

ChatGPT 4.5 понимает подтекст, но это не кажется огромным скачком от ChatGPT-4
GPT-4.5, новая модель от OpenAI для подписчиков ChatGPT Plus, демонстрирует улучшенную эмоциональную интеллектуальность и тонкое понимание запросов, что делает ее более способной к творческим задачам, таким как написание стихов и составление рецептов.