GLM-5.1、LMArenaコードランキングでオープンソース1位、グローバル3位を獲得
- OPUS0%
- GLM0%
1M AI News の監視によると、本日、世界の権威あるAI評価プラットフォームであるLMArena(百万人のユーザーがブラインドテストに参加)がCode Arenaの特別ランキングを更新しました。GLM-5.1が世界のオープンソースモデルで1位、全体モデルで3位にランクインしました。
GLM-5.1は、前世代モデルのオープンソースSOTAコーディング能力を受け継いだだけでなく、長距離タスク(Long-Horizon Task)においてもブレークスルーを達成し、以下のことを実現しました。
1. 8時間でゼロからLinuxデスクトップを構築。
2. 655回のイテレーションでベクトルデータベースの最適化ボトルネックを打破。
3. 1000回のツール呼び出し最適化により、実際の機械学習モデルの負荷を軽減。
特筆すべきは、METRランキングの同等の評価基準において、GLM-5.1は8時間レベルの継続的な稼働を達成した唯一のオープンソースモデルであり、また、Claude Opus 4.6を除き、この能力を持つ世界でも数少ないモデルであることです。
ソース:BlockBeats
免責事項:現在のコンテンツは第三者の視点に基づくもの、または第三者の視点からAIが直接翻訳したものです。CoinExはコンテンツの信頼性、正確性、独創性を保証するものではなく、CoinExからの投資アドバイスを構成するものではありません。暗号資産の価格変動は急激に変動します。潜在的なリスクにご注意ください。
検索上位
- コインリスト価格24時間価格変動