

「macOS タホ 26.2このバージョンでは、Thunderbolt 5 ポートを介して低遅延で Mac を接続する機能が追加され、AI クラスターの構築に役立つとされています。
macOS タホ 26.2 リリース ノート | Apple 開発者向けドキュメント
https://developer.apple.com/documentation/macos-release-notes/macos-26_2-release-notes#RDMA-over-Thunderbolt
Mac では、SoC に内蔵されたメモリを CPU と GPU で共有するユニファイド メモリと呼ばれるメモリ テクノロジが採用されています。これにより、GPUに大量のメモリを割り当て、大規模なAIモデルを高速に実行することが可能になります。例えば、M3 Ultraを搭載したMac Studio最大512GBのメモリを搭載でき、メモリの大部分をGPUに割り当てることで大規模なAIモデルを実行できるため、現地のAIユーザーから注目を集めている。
macOS Tahoe 26.2では新たに、Thunderbolt 5ポートを介した低遅延接続を可能にする「RDMA over Thunderbolt」と呼ばれる機能をサポートした。 Apple は RDMA over Thunderbolt を使用して複数の Mac を接続しています。MLXを用いたAI推論の性能が向上したと説明されている。
RDMA over Thunderbolt により、AI 研究者などが比較的低コストで AI クラスターを構築できるようになると期待されています。
また、AppleのAI研究部門に所属しています。アウニ・ハヌン2025 年 11 月 7 日、Mr.キミ K2 思考彼らは、1 秒あたり 15 トークンの速度で実行できたと報告しました。
新しい 1 兆パラメータの Kimi K2 Thinking モデルは、ネイティブ フォーマットで 2 台の M3 Ultra で適切に動作します – 品質を損なうことはありません。
モデルは int4 で量子化対応トレーニング (qat) されました。
ここでは、mlx-lm のパイプライン並列処理を使用して、15 トークン/秒で約 3500 個のトークンを生成しました。 pic.twitter.com/oH5DPi7kAg
— アウニ・ハヌン (@awnihannun) 2025 年 11 月 7 日
この記事のタイトルとURLをコピーします
・関連記事
AppleがM4 Max/M3 Ultra搭載、AIやコンテンツ制作を強化するGPUを搭載した「Mac Studio」を発表、価格は約33万円~約230万円 – GIGAZINE
Appleの機械学習チームがApple Silicon上で機械学習モデルをトレーニング・デプロイするためのフレームワーク「MLX」をGitHubで公開 – GIGAZINE
元マイクロソフト社のアマル・スブラマニア氏がアップルのAI責任者に就任。前任者のジョン・ジャナンドレア氏が引退へ – GIGAZINE
iPhoneやMac上で重い画像生成AIをローカル実行できる「Draw Things」を使ってみた、レビュー、Qwen Imageのような大規模なモデルも実行可能 – GIGAZINE

