xAI、Grok 4.1を発表

xAI は Grok 4.1 のリリースを公式に発表しました。このバージョンは現在、grok.com および iOS と Android アプリで全ユーザーに公開されています。Grok 4.1 は自動モードで直ちに利用可能で、モデルセレクターで「Grok 4.1」として明示的に選択できます。

Grok 4.1 の重要な改善点

xAI は、Grok 4.1 が実際の使いやすさにおいて顕著な改善をもたらしたと述べています。このモデルは、創造性、感情、協力的なインタラクションにおいて非常に優れた能力を持ち、微妙な意図をより鋭敏に捉え、コミュニケーションにおいてより魅力的な個性を示しつつ、前モデルの高い知性と信頼性を保持しています。これらの改善を実現するために、xAI は Grok 4 と同じ大規模な強化学習インフラを使用し、モデルのスタイル、個性、助けとなる能力、一貫性を最適化しました。

「私たちは、新しい方法を開発し、最先端の自律推論モデルを報酬モデルとして使用し、自動評価と反応の反復を可能にしました。」

xAI

段階的なリリースとユーザーの好み

xAI は 2025 年 11 月 1 日から 14 日の間に Grok 4.1 の段階的な静かなリリースを行い、徐々により大きな割合の生産トラフィックに開放しました。この 2 週間の静かなリリース期間中、xAI はリアルタイムのトラフィックで継続的な盲検評価を行いました。テスト結果によると、Grok 4.1 はユーザーの好みにおいて優れたパフォーマンスを示し、以前の生産モデルと比較して、Grok 4.1 の好まれる割合は 64.78% に達しました。

感情知能と創造的なライティング能力の向上

感情知能の面では、Grok 4.1 は EQ-Bench3 テストで優れたパフォーマンスを示しました。このテストはモデルの感情理解、洞察力、共感能力、人間関係スキルを評価します。Grok 4.1 の創造的なライティングにおけるパフォーマンスも注目に値し、さまざまなライティングプロンプトに対して高品質な応答を生成することができます。

「Grok 4.1 は感情的なプロンプトに対する応答で、感情交流における進歩を示しました。」

xAI

事実誤認の発生を減少させる

xAI は、Grok 4.1 が情報検索プロンプトにおいて事実誤認の発生率を顕著に低下させたことを強調しています。これは、生産トラフィック内の実際の情報検索クエリを評価することによって実現されました。この改善により、Grok 4.1 は正確な情報を提供する上でより信頼性が高くなりました。

資料来源:xAI 公式発表

Stein Yep
Stein Yep