Meta、初のRISC-VベースのAIトレーニングチップをテスト中

Metaは、数年前からRISC-Vベースのチップを構築し、AI推論を行うためにコストを削減し、NVIDIAへの依存を減らすことを目的としている最初の企業の一つです。ロイターの報道によると、同社は内部のAIトレーニングアクセラレーターをさらに設計しており、これはBroadcomと協力して完成した可能性があります。このチップがMetaの目標を達成できれば、大規模言語モデルのトレーニングにおける高性能NVIDIA AI GPU（H100/H200やB100/B200など）への依存を減らすことができるかもしれません。

MetaとBroadcomは、TSMC（台積電）と共に初のAIトレーニングアクセラレーターの設計を完了しました。後者はこれらのチップの最初の作業サンプルを生産し、パートナーはそのユニットを成功裏に起動しました。報道によれば、Metaは現在、このアクセラレーターを限定的に展開し、その性能を評価し、その後に生産と展開を拡大することを開始しています。Metaのエンジニアが新しいチップのベンチマークテストを行っているかどうかは不明ですが、このチップはすでに使用されており、いくつかの有用な作業を完了しています。

チップのアーキテクチャと性能

このチップの具体的な仕様は不明ですが、通常、AIトレーニングチップは「パルスアレイ」と呼ばれる設計を使用します。このアーキテクチャは、行と列の形式で配置された同一の処理ユニット（PE）の構造化ネットワークで構成されています。各ユニットは、行列またはベクトルに関連する計算を処理する責任があります。データはネットワーク内を順次流れます。このプロセッサはAIトレーニングのために設計されているため、HBM3またはHBM3Eメモリを搭載することが期待されます。これはカスタムプロセッサであるため、Metaはチップのサイズ、消費電力、性能を最適化するためにサポートするデータ形式と命令を定義しました。性能に関しては、このアクセラレーターはNVIDIAの最新のAI GPU（H200、B200、さらには次世代のB300）と競争力を維持する必要があります。

MTIA計画の課題

このチップはMetaのトレーニングと推論アクセラレーター計画（MTIA）の最新メンバーです。この計画は、内部の推論プロセッサが限られた展開テストで性能と消費電力の目標を達成できなかったため、同様の段階での開発が中止されるなど、さまざまな課題に直面してきました。この失敗により、Metaは2022年に戦略を調整し、即時のAI処理ニーズを満たすために大量のNVIDIA GPUを注文しました。それ以来、MetaはNVIDIAの最大の顧客の一つとなり、数万のGPUを購入しました。これらのユニットは、推薦、広告、Llama財団モデルシリーズのためのAIモデルのトレーニングに不可欠です。さらに、これらのグリーン企業のGPUは推論プロセスにも使用され、Metaプラットフォーム上で30億以上の毎日のユーザーインタラクションをサポートしていますと、ロイターは報じています。

未来の展望

これらの課題に直面しながらも、Metaはカスタムシリコンソリューションを推進しています。昨年、MetaはMTIAチップを使用して推論タスクを開始し、将来的には2026年までにカスタムチップを使用してAIトレーニングを行う計画を概要しました。このチップが性能と消費電力の目標を達成できれば、Metaは使用量を段階的に増加させる予定であり、これはMetaのデータセンター運営のためにより多くのカスタムハードウェアソリューションを設計するという長期目標の重要な要素です。

注目すべきは、MTIAの推論アクセラレーターがオープンソースのRISC-Vコアを使用していることです。これにより、Metaは第三者にロイヤリティを支払うことなく、自身のニーズに応じて命令セットアーキテクチャをカスタマイズできます。MTIAのトレーニングアクセラレーターもRISC-V命令セットアーキテクチャに基づいているかどうかは不明ですが、それは可能性があります。もしそうであれば、Metaは業界で最も高性能なRISC-Vベースのチップの一つを開発した可能性があります。

【教學】如何在香港申請 Google Gemini 及訂閱 Google Gemini Advanced /
【說明】4 個方法，讓你的 iPhone / Android 在香港無需 VPN 就能用 ChatGPT

チップのアーキテクチャと性能

MTIA計画の課題

未来の展望

stone