200G QSFP56 モジュール: 仕様とアプリケーション

Apr 15, 2026|

前四半期には、Arista 7050CX3 スイッチを搭載した AI 推論クラスターを運用するクライアントを支援しました。彼らは、既存の 100G セットアップからの簡単なドロップイン アップグレードを期待して、200G QSFP56 モジュールを注文していました。-

 

モジュールは到着し、物理的な問題もなく QSFP ケージにきれいに装着されました。ただし、リンクは起動できませんでした。LED は暗いままで、スイッチのログには「サポートされていないトランシーバー」エラーが報告されました。プロジェクトが 3 週間遅れた後、根本原因が特定されました。これらのスイッチの Memory Technology Platform 3 ASIC は 50G PAM4 電気信号をサポートしていませんでした。単なるファームウェアのアップデートではなく、プラットフォームの交換が必要でした。

 

このシナリオは、ベンダーのマーケティングが示唆するよりも頻繁に展開されます。 200G QSFP56 フォーム ファクタは、QSFP28 と同じ物理ケージに適合し、同じ寸法、同じ 38 ピン コネクタを備えています。しかし、電気的な互換性はまったく別の問題であり、調達スケジュールが維持されるか遅れるかを決定する問題です。

200G QSFP56 optical transceiver module inserted into Arista 7050CX3 switch port showing PAM4 electrical signaling compatibility in an AI inference cluster data center

 

技術基盤: 200G QSFP56 に実際に必要なもの

 

200G QSFP56 光トランシーバは、100G QSFP28 モジュールの NRZ シグナリングではなく PAM4 変調を使用して、4 つのレーンでそれぞれ 50Gbps で動作します。 PAM4 は、シンボルごとに 1 ビットではなく 2 ビットをエンコードします。-これが、レーン数を 2 倍にすることなくスループットを 2 倍にする方法です。しかし、PAM4 の信号対ノイズマージンは NRZ より約 9dB 低いため、前方誤り訂正はオプションではありません。-。

 

実際的な意味: スイッチ ASIC とファームウェアは、50G PAM4 レーンと RS(544,514) FEC 処理を明示的にサポートする必要があります。物理的なポートの形状からは、これについては何も分かりません。シスコは、トランシーバ モジュール グループの互換性マトリックスを tmgmatrix.cisco.com で公開しています。 Arista も同様のデータベースを管理しています。注文書が発送される前にこれらを確認するかどうかが、スムーズな展開とこの記事の最初のシナリオの違いとなります。

 

パラメータ SR4 FR4 DR4
データレート 200 Gbps (4×50G PAM4) 200Gbps 200Gbps
ファイバーの種類 OM3/OM4 マルチモード シングル-モード シングル-モード
到着 70m(OM3) / 100m(OM4) 2km 500m
コネクタ MPO-12 デュプレックスLC MPO-12
3.3–4.5W 5–7W 4–5W

 

Comparison of 200G QSFP56 SR4, FR4, and DR4 optical transceivers showing MPO-12 and Duplex LC connectors for multimode and single-mode fiber infrastructure

 

これらの仕様は、IEEE 802.3bs およびメーカーのデータシートに基づいています。しかし、この表ではわかりません。純粋に距離の評価だけで選択すると、インフラストラクチャの問題が見逃されます。 FR4 のシングルモード光学系には、異なるクリーニング プロトコル、より厳しい損失バジェットが必要で、多くの場合、マルチモード SR4 リンクで実行しているものとは異なるパッチ パネル インベントリが必要です。 500m を超えるキャンパス バックボーンに FR4 を仕様すると、ファイバー プラントの変換だけで、モジュールのコスト差自体を超えてプロジェクト BOM に 15 ~ 25% 追加されます。

 

誰も文書にしたくないコストの問題

 

現在のカタログ価格に基づいて、FB-LINK の200G QSFP56 光トランシーバ モジュールCisco、Arista、Juniper の同等の OEM 定価より 50 ~ 70% 安くなります。これは、品質の違いではなく利益構造を反映しています。{{3}OEM の価格設定では、ブランド プレミアム、サポート契約、ベンダー ロックが単価に組み込まれており、{4}}経済性が考慮されています。

 

問題は互換性の検証です。主要なスイッチ ベンダーは、ベンダー固有のコードで事前にプログラムされていない限り、サードパーティ製トランシーバーを拒否できる EEPROM- ベースのモジュール識別を実装しています。-シスコのアプローチは特に厳格です。互換性マトリックスにないモジュールは、「サポートされていない」という警告を表示したり、リンクを完全に拒否したりする可能性があります。

 

ここでサプライヤーの選択が重要になります。 EEPROM のカスタマイズができないサードパーティ モジュール ベンダーは、あなたに賭けを売りつけています。-プラットフォーム固有のコーディング、スイッチ モデルに対する出荷前テスト、互換性保証を提供する人は、ソリューションを販売しています。{3}過去 2 年間の Cisco Nexus および Arista 7000- シリーズの導入を通じて、当社の事前検証済みモジュールを使用しているお客様は、プラットフォーム検証を行わずに以前にサードパーティから購入した場合と比較して、導入関連のサポート チケットが 80% 削減されました。{9}

 

サプライヤーの評価:EEPROM プログラミング機能に関するドキュメントと、出荷前に特定のスイッチ プラットフォームに対してテストを行うかどうかを問い合わせてください。

 

200G QSFP56 導入がビジネスに意味のある場合

 

InfiniBand HDR を実行する AI/HPC クラスター

 

InfiniBand HDR は 200Gbps で標準化されており、QSFP56 SR4 マルチモード トランシーバーNVIDIA ConnectX-6 アダプターと Quantum スイッチ間のデフォルトの相互接続。 600 ナノ秒未満のポート-対-のレイテンシーと 1 秒あたり 2 億オペレーションを超えるメッセージ レート(NVIDIA Quantum InfiniBand スイッチ仕様による)は、分散トレーニング ワークロードにおける GPU{7}} 対-の GPU 通信のベースラインを提供します。 NCCL all Reduce テストで確認できる実際のスループットは、-トポロジに大きく依存します。-ファットツリー構成とトンボ構成では、モジュールの選択よりも実効帯域幅が大きく変動する可能性があります。インフラストラクチャが大規模な言語モデルのトレーニングをサポートしている場合、200G をデプロイするかどうかを選択する必要はありません。どのサプライヤーから調達するかを選択しているのです。

 

AI inference cluster and HPC data center using InfiniBand HDR 200Gbps QSFP56 SR4 interconnects for GPU-to-GPU communication and large language model training

スパイン-リーフ データセンターが 100G 飽和に達している

リーフ-から-スパインへのリンク-の平均使用率 65% またはピーク使用率 85%。これらは、アプリケーションのモニタリングでレイテンシ ジッターが現れ始めるしきい値です。これらの数値を下回ると、200G は使用しないヘッドルームの料金を支払うことになります。これらを超えると、アップグレードの計算が簡単になります。まだエッジで 10G または 25G を実行している組織の場合、-ステップバイ-ネットワーク移行ガイド中断を最小限に抑える段階的なアプローチをカバーします。
 
 
200G QSFP56 SR4 を実行する 32- ポート スイッチは、トラフィックの増大がまだ 400G の熱オーバーヘッドに見合っていない組織にとって、6.4 Tbps の総容量-という意味のある密度を提供します。 QSFP-DD モジュールは、IEEE 802.3ck 仕様に従ってそれぞれ 12 ~ 15 W を消費します。これは 200G の電力エンベロープの約 3 倍であり、ラックごとの冷却方程式が大幅に変わります。

200G 対. 400G の決定

過去 18 か月にわたってこの決定に向けて協力してきたデータセンター クライアントの中で、あるパターンが明らかになりました。インフラストラクチャの更新が 18 か月以内に計画されており、トラフィックの増加が年間 40% を超えている組織は、一貫して QSFP-DD プラットフォームに QSFP56 モジュールを搭載-下位互換性のあるポート-が両方に対応しているため、後でフォークリフト アップグレードを行わずに移行パスを提供できることを選択しています。これらのフォームファクターの詳細な技術的比較については、次の資料を参照してください。QSFP28 と QSFP-DD テクニカル ガイド.
 
 
3+ 年後の更新サイクルでは、通常、スタンドアロン 200G 導入の方が TCO が優れています。 400G エコシステムのプレミアム価格はまだ完全に正規化されていないため、何年もアクティブ化しない機能に対して料金を支払う必要はありません。 100G- から 400G への移行計画に関するガイドでは、この移行をよりスムーズにするブレイクアウト構成について説明しています。

データシートに記載されない故障モード

MPO ケーブルの極性

200G SR4 トランシーバ-対-トランシーバ接続の場合、タイプ B 極性ケーブル-キー-がキー{6}}方向-にあることが必須です。タイプ A ケーブルは物理的に接続しますが、リンク障害を保証する Tx{9}}to- マッピングを作成します。これは TIA-568 で定義されていますが、極性管理がより簡単なデュプレックス LC 接続に慣れているチームにとっては問題となります。この質問はほぼすべての SR4 導入で発生するため、当社では技術リソースに極性決定表を保管しています。

FEC 構成の不一致

200G リンクの両端は、FEC 設定の有効化と無効化、および特定の FEC タイプ(RS{2}}FEC と FC-FEC)に同意する必要があります。-不一致があっても明らかなエラーはスローされません。リンクは単にトレーニングに失敗します。私たちは、金融サービス クライアントの導入における数日にわたるトラブルシューティング サイクルを追跡しました。-この問題は、一方の端が KP4 FEC 用に構成され、もう一方の端が FEC を完全に無効にしていました。{8}}症状としては、リンクが断続的に接続され、すぐに障害が発生するというものでした。{11}}構成を 1 行ずつ比較し始めるまで、ログには FEC を直接示すものはありませんでした。

汚染に対する感度

PAM4 のノイズ マージンの低下は、100G で合格したコネクタの清浄度規格が 200G では不十分になる可能性があることを意味します。 1.5dB を超える挿入損失-は、肉眼検査では見えない汚染によって引き起こされることが多く、-断続的な CRC エラーが発生する可能性があります-。 IEC 61300-3-35 クラス B の洗浄基準は、ベスト プラクティスではなく-交渉の余地のないもの-になります。ファイバーのクリーニングが現実的ではない、短距離のラック間接続の場合、-直接接続銅線ケーブル光学的汚染の懸念を完全に排除します。

次のステップ


 

200G の展開を検討していて、上記の互換性と構成の問題を回避したい場合は、次の手順を実行します。

 

  1. QSFP56 互換性検証チェックリストをダウンロード- は、主要なスイッチ プラットフォームの ASIC 要件、ファームウェア バージョン、EEPROM コーディングをカバーしています
     
  2. 特定のスイッチコーディングを含むサンプルモジュールをリクエストする- 出荷前に事前にプログラミングし、お客様のプラットフォームに対してテストします。{1}
     
  3. 弊社の技術チームにご相談くださいトポロジとタイムラインについて - FB にお問い合わせください-LINK Engineering

 

 

FB-LINK Technology は、ISO 9001- 認定の光トランシーバー メーカーであり、北米、ヨーロッパ、アジア太平洋地域のデータセンター、通信事業者、システム インテグレーターに製品を供給しています。-当社の 200G QSFP56 モジュールは、出荷前に 100% の機能テストと拡張バーンインを受けています。当社は、Cisco Nexus、Arista 7000 シリーズ、および Juniper QFX プラットフォーム用の専用テスト環境を維持し、出荷前に互換性を確実に検証します。

お問い合わせを送る