Статьи с тегом: LiveCodeBench

Китай запускает бесплатную AI-модель Kimi K2, превосходящую GPT-4 в ключевых тестах.
Китайский стартап Moonshot AI представил Kimi K2 – новую языковую модель с триллионом параметров, которая превосходит GPT-4 в кодировании и решении математических задач, предлагая более эффективное и доступное решение для разработчиков и создания автономных агентов. Откройте для себя возможности передового ИИ, который действует, а не просто отвечает, и создавайте инновационные приложения с Kimi K2 уже сегодня!

Как медалисты олимпиад оценивают большие языковые модели в соревновательном программировании?
Новейшее исследование показывает, что хайп вокруг ИИ-программистов преждевременен: лучшие модели решают лишь половину задач средней сложности и не справляются со сложными, уступая программистам-экспертам. Узнайте, почему текущие ИИ-системы далеки от реального алгоритмического мышления и в чем их слабые места.

Модели Gemini 2.5 от Google получили возможность "глубокого анализа" и рассуждений.
Google значительно улучшила свои AI-модели Gemini 2.5, представив режим "Deep Think" для более точных ответов и Gemini 2.5 Flash для высокой эффективности. Новые модели показывают лидерские результаты в сложных тестах и кодинге, а также поддерживают аудио на 24+ языках – попробуйте Gemini 2.5 Flash уже сейчас и оцените возможности будущего!