1.6 t 光トランシーバーを選ぶ理由?
Oct 28, 2025|
光トランシーバー市場は、2025 年から 2029 年の間に 6,000 万台から 1 億 2,000 万台以上に倍増しますが、生産エンジニアはすでに知っていることです。1 台の 1.6T 光トランシーバーに障害が発生すると、AI トレーニング クラスター全体が停止し、1 時間あたり数万ドルの無駄なコンピューティングが消費される可能性があります。 1.6 テラビット/秒への飛躍は、より大きな数字を追い求めることではありません。-重要なのは、ネットワーク アーキテクチャが、ゼロから再構築することなく、今後 3 年間の AI ワークロードの増大に耐えられるかどうかです。
1.6T トランシーバはわずか 4 年で年間出荷数 1,000 万個に達しますが、100G モジュールがそのマイルストーンに達するには 10 年かかります。この圧縮は重要なことを示しています。業界はもはや 1.6T を実験的な技術として扱っていないということです。大手ハイパースケーラーはすでに概念実証を経て、本番環境の検証に移行しています。--
しかし、導入のスピードとシンプルさはイコールではありません。 224 Gb/s PAM4 レーンをテストすると、厳しいジッター、ノイズ、分散バジェットによるシグナル インテグリティの課題が発生し、タイミング、電圧、または信号拡散のわずかな変動がビット エラーやアイ ダイアグラムの閉鎖につながる可能性があります。技術的な限界は劇的に上昇しており、問題は単に「なぜ 1.6T なのか」ではなく、「いつ 1.6T が運用上および財務上意味があるのか?」ということです。

1.6T が実際に解決する帯域幅のボトルネック
1.6T の説明のほとんどは、容量の数字から始まります。別の質問から始めます。現在のインフラストラクチャで最初に問題が発生するのは何ですか?
AI コンピューティングの壁
NVIDIA の GB200 NVL72 アーキテクチャは、GPU-対-1.6T 光トランシーバの比率が 2 層 InfiniBand ネットワークでは 1:2、3 層ネットワークでは 1:3 となり、サーバーとスイッチのポート速度を 2 倍にします。-これは理論上の将来計画ではなく、2025 年にハードウェアを出荷するというものです。
計算は容赦がありません。1 つの GB200 ラックは、H100 システムよりも 30 倍高速な推論パフォーマンスを生成します。しかし、データが GPU 間で十分に高速に移動できない場合、その計算能力は役に立ちません。実際の制限となるのはシリコンではなく、ネットワークです。
特にムーアの法則が減速し、半導体が物理的限界に達しているため、I/O 速度は計算能力の増加に追いつくのに苦労しています。コンピューティングの拡張が接続性よりも速いという壁にぶつかっています。. 800G トランシーバーは、昨日のクラスター アーキテクチャ向けに設計されています。次の四半期の導入にはすでに不十分です。-
データセンターアーキテクチャの変化
ハイパースケール データセンターは、より高速で、よりフラットで、よりスケーラブルなネットワーク アーキテクチャに移行しており、より高い帯域幅と効率的な長距離接続に対する強い需要があります。-ここでのキーワードは「フラット」です。
複数の集約レイヤーを備えた従来の階層型ネットワークでは、遅延と複雑さが増加します。最新の AI クラスタには、より多くのエンドポイントを直接接続する低レイテンシ、高基数のスイッチが必要です。{{1}このアーキテクチャの変更必要-ポートあたりの帯域幅-が高いと、ケーブルとスイッチ ポートに圧倒されずに 400G リンクを備えたフラットな 50,000 エンドポイント ファブリックを構築することはできません。
1.6T により根本的な簡素化が可能になります。レイヤー、スイッチ、トランシーバーの数が減り、遅延が減少します。代表的な北米の全国ネットワークでの分析によると、200GBaud 1.6T は 800G の 2 倍のカバレッジを提供しながら、必要なトランシーバーの数が 25% 減り、結果としてエネルギー消費が 25% 削減されることが示されています。
ハードウェア数と消費電力の両方が 25% 削減されるということは、マーケティング上のスピンではありません。-ラック スペース、冷却要件、ケーブル管理、障害点、運用の複雑さなど、データセンター運用のあらゆる側面に影響を及ぼします。
1.6T 対応マトリックス: いつ意味があるのでしょうか?
すべての組織が 1.6T の導入を急いで行う必要はありません。実際の展開パターンを分析して私が開発したフレームワークを次に示します。
組織の能力軸
次元 1: 技術インフラストラクチャの成熟度
現在実稼働環境で 800G を実行していますか?まだ主に 400G 以下である場合、1.6T にジャンプすると重要な運用学習がスキップされます。 224 Gb/s レーン レートへの移行により、ジッター、ノイズ、分散バジェットが厳しくなり、わずかな変動でもエラーが発生する可能性があります。チームには、これらのシグナル インテグリティの課題を大規模に管理する経験が必要です。
次元 2: テストと検証の能力
メーカーは複数の 224 Gb/s PAM4 光レーンを同時に分析する必要があるため、1.6T トランシーバーの 8 レーンすべてをテストすることは、適切に最適化されていない限り生産性のボトルネックになります。現在のテスト インフラストラクチャが 800G 検証に問題がある場合、1.6T はあらゆる弱点を増幅します。
必要な機能:
高帯域幅サンプリング オシロスコープ(-<15 µW noise, <90 fs jitter)
自動TDECQ測定システム
並列マルチレーンテストインフラストラクチャ
動作範囲にわたる温度上昇テスト
次元 3: 電力および冷却インフラストラクチャ
レーザーダイオードに依存する光トランシーバーは温度変化に敏感であり、信号の劣化や信頼性の低下につながる可能性があります。速度が速いほど、電力密度が高くなり、熱管理の要求が厳しくなります。
液体冷却インフラはありますか?高度な熱電冷却器 (TEC) システム? TEC は、熱を効率的に除去し、安定した熱環境を維持することで信頼性の高い温度安定化を実現し、信号の完全性を向上させ、動作寿命を延長します。
ユースケースの緊急性の軸
緊急性の高いシナリオ:
大規模な言語モデルのトレーニング (100B 以上のパラメーター)
LLM トレーニング ワークロードは、GPU 間で膨大な東西トラフィックを生成します。{0} NVIDIA GB200 NVL72 は、30 倍高速なリアルタイム-兆-パラメータ LLM 推論パフォーマンスと 4 倍高いトレーニング効率を実現します。ただし、このパフォーマンスには、データ速度を処理できるネットワーク バックボーンが必要です。. 800G は即座にボトルネックを引き起こします。これらの環境に 1.6T 光トランシーバーを導入すると、次世代 AI インフラストラクチャの帯域幅要件に対処できます。-
ラック-スケールのコンピューティング アーキテクチャ
GB200 NVL72 ラック-スケール システムには 1.6T OSFP DAC ケーブルが必要で、内部通信は完全に銅線相互接続に依存します。次世代 GPU クラスタをデプロイしている場合、1.6T はオプションではありません。-これは指定された相互接続です。
>51.2T スイッチの導入
最初の 51.2T スイッチ シリコンは 2022 年にリリースされ、64 800G ポートが可能になり、102.4T スイッチング容量を実現するには、波長あたり 200G に達する 1.6T 光モジュールが必要になると予想されます。スイッチのアーキテクチャによってトランシーバーの要件が決まります。 102.4T スイッチに投資している場合、その全容量を解放するには 1.6T 光学系が必要です。
中程度の緊急度のシナリオ:
データセンター相互接続 (DCI) の拡張
WL6e 1.6T は、ネットワーク パスの 97% 以上で 800 Gb/s 以上の波長速度をサポートし、大部分のリンクは 1T 以上の速度で動作します。長距離コヒーレント 1.6T は、複数の 800G チャネルが必要となるメトロや地域の DCI リンクを構築する場合に経済的に合理的です。
-ビットあたりのコスト-を大規模に最適化
現在のイーサネット レート モジュールと、800 Gb 8x100G Lambda を利用する次世代 1.6Tb 8x200G Lambda モジュールを比較すると、同じコンポーネント数、同じ数のレーザー、変調器、終端、コネクタを共有しており、ビットあたりのコストが大幅に削減されていることがわかります。{0}{7}レーンあたり 200G の部品表は、レーンあたり 100G よりも劇的に高価ではありません。つまり、1.6T は 2 倍の 800G モジュールを導入するよりも優れた経済性を実現できます。
緊急性の低いシナリオ:
エンタープライズ キャンパス ネットワーク
ピーク トラフィックがテラビット未満で、増加率が年間 10{4}15% である場合、800G、さらには 400G トランシーバーのほうが費用対効果が高くなります。{0}{4} 1.6T のプレミアムは、一般的なエンタープライズ ハードウェアの更新サイクル内では回収できません。
エッジ コンピューティングの導入
スペース、電力、または予算に制約があるエッジ ロケーションでは、1.6T が正当化されることはほとんどありません。このテクノロジーは、分散エッジ フットプリントではなく、ハイパースケール向けに最適化されています。
意思決定の枠組み
組織を両方の軸にプロットします。
高能力 + 高緊急性 → 今すぐ採用
インフラストラクチャ、専門知識、ビジネス ニーズを備えています。遅延は、パフォーマンスとコストの利点を逃すことを意味します。
中程度の能力 + 緊急性が高い → 加速された開発パス
今すぐテストインフラストラクチャとスタッフのトレーニングに投資してください。 12 ~ 18 か月以内に実稼働環境の導入を計画します。ベンダーと提携して検証をサポートします。
高い能力 + 中程度の緊急性 → 戦略的評価
パイロット プログラムを実行します。ベンダーの主張を検証します。専門知識を構築します。ビジネス上の正当性が強化された場合 (おそらく 2026 年) に本番環境に移行します。
中/低能力 + 低緊急度 → 監視して待つ
現在のインフラストラクチャの最適化に重点を置く. 1.6テクノロジーが成熟し、コストが低下し、ニーズが進化するにつれて、2027 ~ 2028 年に導入することがより合理的になります。
重要な技術アーキテクチャの違い
1.6T が-速いだけではなく{2}}根本的に異なる点を理解することは、ベンダーの主張と実装の複雑さを評価するのに役立ちます。
レーンあたり 200 Gb/秒の PAM4 シグナリング
業界をリードする 3nm DSP チップの採用により、最大 200 Gbps の PAM-4 信号処理がサポートされ、データ転送速度と帯域幅密度が向上し、消費電力と熱パフォーマンスが最適化されます。
PAM4 (4- レベルのパルス振幅変調) は、シンボルごとに 1 ビットではなく 2 ビットをエンコードします。レーンあたり 200G では、PAM4 を実用的な限界まで押し上げています。これは漸進的な改善ではなく、現在の物理学と材料が許容する限界で動作しています。
これが重要な理由: 1.6 Tb/s のデータ レートにより、PAM4 シグナリングが物理的な境界に達します。そこで生じる高速シリアル設計の課題の克服には通常、数か月かかります。-信号整合性の問題は、レーンあたり 100G では管理可能でしたが、200G では重大になります。ジッター耐性が低下します。分散補償が必須となります。熱ドリフトの下ではアイ ダイアグラムがより速く閉じます。
フォーム ファクターの進化: OSFP と OSFP-XD
1.6T OSFP トランシーバーは 200G 電気レーンを備えた将来のスイッチ シリコンをサポートしていますが、100G 電気レーン エコシステムを備えた 1.6T トランシーバーにも幅広い関心があり、OSFP-XD (「超高密度」) フォーム ファクターにつながります。
OSFP(8レーン×200G):ネイティブ 200G SerDes を備えたスイッチの標準アプローチ
OSFP-XD (16 レーン × 100G):既存の 100G スイッチ インフラストラクチャとの下位互換性-
OSFP-XD は、現在入手可能な最も高密度のプラガブル光ソリューションを提供し、100G から 200G までの Lambda およびコヒーレントのテクノロジーをサポートしながら、1U フロント パネル ベースで将来のスイッチ シリコン密度に効果的に適合します。
このアーキテクチャの選択は、アップグレード パスに影響します。現在のスイッチが 100G SerDes を使用している場合、OSFP-XD はブリッジ テクノロジーを提供します。 200G- ネイティブ スイッチを備えたグリーンフィールド インフラストラクチャを導入する場合、標準 OSFP によりレーン数と複雑さが軽減されます。
シリコンフォトニクスの統合
NADDOD の 1.6T シリコン フォトニクス トランシーバは、Broadcom 3nm DSP と自社開発のシリコン フォトニクス チップを活用し、エネルギー効率と伝送性能の両方で画期的な進歩を達成し、同じチップ上にレーザー、変調器、検出器を統合しています。
シリコン フォトニクスは新しいものではありませんが、1.6T の速度でのアプリケーションは成熟のしきい値を表しています。光学コンポーネントをシリコン基板に統合することにより、メーカーは次のことを達成します。
従来のハイブリッドパッケージと比較して体積を 30% 削減
ビットあたりの消費電力の低減 (ラックスケールでは重要)
より優れた熱特性
製造の拡張性の向上
シリコン フォトニクス技術を使用した 1.6T 光トランシーバーは、光コンポーネントと電子コンポーネントを単一チップに統合し、サイズとコストを削減しながら性能を向上させます。この統合により、1.6T が経済的に実行可能になります。-これがなければ、電力とスペースの要件が法外なものになります。
共同パッケージ光学系 (CPO) の質問-
-共同パッケージ化された光学系はまだ実証されていないため、業界は 800G システムでプラガブル光学系を引き続き使用する可能性があり、800G または 1.6T 標準の新しいバージョンでは共同パッケージ化された光学系が使用される可能性があります。-
CPO は、トランシーバーをスイッチ ASIC に直接統合し、電力を削減し、遅延を改善すると約束しています。しかし、CPO にはビジネス モデルの複雑さだけでなく、信頼性、保守性、製造性、テスト容易性に関連する課題があり、現在の CPO ソリューションではプラガブル オプティクスに比べて省電力が実現できません。
現在の現実:1.6T の導入はプラグ可能です。 CPO は、生産が完了してから 3 ~ 5 年かかります。前方互換性を念頭に置いて、プラグイン可能なモジュールを中心にインフラストラクチャを設計しますが、CPO が実現するまで待つ必要はありません。
誰も語らない隠れたコスト
トランシーバーの購入価格はあくまで出発点です。費用の全体像は次のとおりです。
テストと検証のオーバーヘッド
メーカーは複数の 224 Gb/s PAM4 光レーンを同時に分析する必要があり、テスト最適化ソフトウェア、高帯域幅 DCA- オシロスコープ、光スイッチを通じて適切に最適化されていない限り、テストのボトルネックが発生します。
完全な 1.6T テスト ステーションの費用は 150,000 ドル -300,000 ドルです。これに、実稼働または検証ボリュームに必要なステーションの数を掛けます。 1,000+ トランシーバーを導入する場合は、専用のテスト インフラストラクチャが必要です。数万台を導入する場合は、製造グレードの自動テスト システムが必要です。
オシロスコープは、調整段階や温度上昇段階ではアイドル状態になる場合があるため、高収率の生産規模のスケーリングでは、ダウンタイムを最小限に抑えてスループットを最大化するために、複数のデバイス レーンを一度に測定することが重要です。{0}}
最適化戦略には、{0}}並列テスト、自動 TDECQ 測定、インテリジェントなスケジューリング-がありますが、ソフトウェアへの投資とプロセス エンジニアリングが必要です。 6 ~ 12 か月の学習曲線を考慮に入れてください。
熱管理インフラストラクチャ
光トランシーバ モジュールが進化するにつれて、TEC サプライヤーは、特定のホットスポットのオンチップ冷却用のマイクロ TEC など、パフォーマンスを犠牲にすることなく狭い形状に適合する、より小さく、より薄く、形状に適応可能なモジュールを設計しています。{0}{1}{2}
標準的な空冷では大規模な処理はできません。要件には次のものが含まれます。
精密な熱制御:±0.1度のレーザー安定性
ホットスワップ可能な冷却インターフェース:{0}使用中に熱性能を維持する
ラック-レベルの冷却分布:高密度の 1.6T 導入のための液体冷却インフラストラクチャ
温度が上昇すると、DFB レーザー ダイオードのピーク波長が約 0.1 nm/度シフトするため、信号の完全性を向上させ、動作寿命を延ばすために信頼性の高い温度安定化が必要です。
高密度導入では、熱管理によって総所有コストが 15{1}}30% 増加する可能性があります。-これはオプションのオーバーヘッドではなく、信頼性を保証するものです。
ファイバーインフラストラクチャの互換性
1.6T トランシーバー ソリューションを統合する前に、ネットワーク コンポーネントと構成の整合性チェックを実施し、信号損失を避けるための高度なハイブリッド光ファイバーやコネクタなどのインフラストラクチャが新しいソリューションと一致していることを確認します。
すべてのファイバー プラントが 1.6T をサポートしているわけではありません。
MPO-12/MPO-16 コネクタ平行光学系に必要
低損失ファイバー (< 0.35 dB/km at 1310nm) for DR8 applications
研磨されたコネクタ端面後方反射を最小限に抑えるため-
古いファイバー設備では、再終端または交換が必要になる場合があります。コネクタのアップグレードと工賃に、ファイバー ストランドあたり 20 ~ 50 ドルの予算を用意します。
運用の複雑さ
トランシーバー設計の複雑化により、テスト時間、コスト、消費電力が増加し、デバイスが 16 レーンまたは 32 レーンにスケールアップするにつれてテスト マージンが縮小し、検証にリソースが集中するようになります。{0}}
レーンが増えると、故障モードも増えます。
車線調整の問題
レーンごとの電力調整
レーン間の温度係数の変動
ファームウェア管理の複雑さ (CMIS 5.0+)
運用チームにはトレーニングが必要です。監視システムをアップグレードする必要があります。スペアパーツの在庫戦略を修正する必要があります。それぞれにソフトコストが追加され、時間の経過とともに増加します。
製造のリアリティチェック
生産上の課題を理解すると、現実的な期待を設定するのに役立ちます。
精度要件
オプトエレクトロニクスチップとコンポーネントの正確な配置と位置合わせは、低ノイズと低歪みを達成するために非常に重要であり、接着精度は光トランシーバの性能と信頼性に直接影響します。
レーンあたり 200G では、許容誤差が大幅に厳しくなります。 ASMPT MEGA シリーズの全自動マルチチップ ボンディング マシンは、±1.5μm の高精度ボンディング技術と特許取得済みのダイナミック アライメント技術を備えています。-
製造におけるミクロン{0}}レベルの精度は、コストの上昇、歩留まりの低下(初期)、リードタイムの延長につながります。初期の 1.6T 生産では、成熟した 800G 製品の歩留まりが 85 ~ 90% であるのに対し、60 ~ 75% が示されています。
サプライチェーンの制約
最新のハイパースケール データ センターには、両端に光トランシーバーを備えた 50,000 本以上のファイバーが収容されており、トランシーバーの設計が完成すると、メーカーは AI データ センターからの激しい需要に応えるために、大量生産を迅速に開始する必要があります。
サプライチェーンは即座に柔軟に対応することはできません。主要コンポーネントのリードタイム:
200G EML レーザー:16~20週間
3nm DSPチップ:12 ~ 16 週間 (鋳造工場によって異なります)
シリコンフォトニクスウェーハ:12~14週間
カスタム光学フィルター:8~12週間
大規模な導入を計画している場合は、6 ~ 9 か月前に注文してください。 1.6T トランシーバーのスポット市場購入には、契約価格より 40 ~ 60% のプレミアムがかかります。
品質保証の負担
1 つのトランシーバーに障害が発生したり最適化されていないと、AI ワークロード全体が中断され、かなりの時間と費用が無駄になる可能性があるため、メーカーは物理層とプロトコル / ネットワーク層の両方で厳格なテストを通じて高品質のデバイスを確保する必要があります。{0}
品質障害のコストは、展開の規模に応じて指数関数的に増加します。 10Gb ネットワーク内の単一の不良トランシーバーにより、局所的な問題が発生します。 1.6T AI クラスタ ファブリック内のトランシーバが不良であると、クラスタ全体のトレーニング ジョブの失敗に連鎖し、インシデントごとに 6 桁の損害が発生する可能性があります。{4}}
これにより、長時間のバーンイン テスト(48-72 時間対 800G の場合は 24 時間)と、より包括的な認定(全温度範囲、拡張 BERT 実行、加速寿命テスト)が推進されます。-これらの品質対策により、製造コストが 15 ~ 25% 増加しますが、ハイパースケール展開では交渉の余地がありません。

リニアプラガブルオプティクス (LPO): ダークホースの代替手段
デジタル信号処理(DSP)-ベースの 1.6T に取り組む前に、コスト モデルを再構築する新たな代替案を検討してください。
AI-による低レイテンシの需要の高まりにより、-DSP を排除し、リニア ドライバ/TIA チップをスイッチ ASIC と直接統合することで、破壊的な代替手段として LPO が推進されています。LPO モジュールは消費電力を 40~50% 削減します(例: 従来のモジュールの 12 W に対して 6.5 W)。
LPO と DSP: トレードオフ-
DSP- ベースの 1.6T:
高度な信号補償
より長い到達距離 (DR8+ の場合は最大 2km)
消費電力が高い (通常 14 ~ 18 W)
コストが高い (モジュールあたり 8,000 ~ 15,000 ドル)
LPO 1.6T:
DSPイコライゼーションなし
到達距離が限られている (DR8 では通常 500 メートル)
低消費電力 (通常 6 ~ 9 W)
コストの削減 (DSP と比較して 30 ~ 40% の削減が予測)
距離が 500 m 未満のデータセンター内リーフスパイン アーキテクチャの場合、LPO は半分の電力と大幅に低いコストで同じ帯域幅を提供します。アーキテクチャは、熱の問題に対処するためにエネルギー消費を削減するのに役立つリニア プラガブル オプティクス(LPO)などの低電力ソリューションをサポートするように設計する必要があります。{4}
LPO が意味をなす場合
理想的なシナリオ:
Single data center campus (no inter-building links >500m)
電力に制約のある環境-
CapEx プレミアムを支払うコスト重視の導入
適合度が低いシナリオ:
長距離またはメトロ DCI リンク-
困難な EMI またはファイバー品質の問題がある環境
最大のリンクマージンを必要とするアプリケーション
LPO 技術を採用した 800G/1.6T 光モジュールは、Meta や Google などの海外大手企業のデータセンターに大規模に導入されています。これらは実験的なデプロイメントではなく、-大規模な本番環境です。
ハイブリッド戦略を検討してください。つまり、短距離の DC 内リンクには LPO、{0}{1}}長距離の場合は DSP{2}} ベースのモジュールを使用します。これにより、コストと電力の両方が最適化されます。
市場の軌道とタイミング戦略
現在の市場動向
1.6T 光トランシーバ市場は 2025 年に 20 億ドルと推定され、2025 年から 2033 年にかけて 25% の CAGR を示します。ちなみに、光トランシーバ市場全体は 2025 年に 135 億 7000 万ドルに達し、2030 年までに 257 億 4000 万ドルに達すると予想されています。
1.6T は市場全体より 2 倍の速さで成長しています-これはニッチなテクノロジーではなく、ハイパースケールの次の主流の標準です。
価格軌跡モデリング
100G および 400G 移行の過去のパターンは、次の指針を提供します。
1 年目 (2024 ~ 2025 年):プレミアム価格、数量限定
1.6T は、成熟した 800G と比較してビットあたり 3 ~ 4 倍のコストがかかります
製造能力による供給の制約
2 年目 (2025 ~ 2026 年):増産、競争激化
量が増えると価格が 30 ~ 40% 下がります
マルチソーシングが可能になる-
年間出荷台数 1,000 万台に達するまでの 4 年間のスケジュールは、積極的な生産規模の拡大を示唆しています
3 ~ 4 年目 (2026 ~ 2028 年):コモディティ化が始まる
ビットあたりのコストは 800G パリティに近づく
テクノロジーの改善 (歩留まりの向上、2nm DSP、冷却の改善) により BOM が削減
800G がレガシー テクノロジーになるにつれて価格圧力が高まる
タイミングへの影響:
2025 年に導入する場合-2026 年: 競争上の優位性とインフラストラクチャの将来性を確保するためのコストとしてプレミアム価格を受け入れます。競合他社が 2027 ~ 2028 年に追いついたとき、同じ経済状況に直面することになりますが、運用面では成熟した状態になるでしょう。
2027 年まで延期できる場合: 40 ~ 50% のコスト削減、成熟したベンダー エコシステム、実証済みの運用パターンによるメリットが得られます。リスク: 競合他社が経験を通じて市場シェアを獲得したり、運用コストの削減を達成したりしている可能性があります。
テクノロジー成熟度曲線
検証は 2022 年に最初の 800G トランシーバーで開始され、IEEE 802.3 と OIF-CEI-112G/-224G 電気規格が進化し続けています。今後 2 年間で、IEEE と OIF は物理層標準を最終決定し、1.6T トランシーバーと 224 Gb/s SerDes スイッチ シリコンに関するニュースが最終検証の準備を整えます。
標準の成熟スケジュール:
2024-2025: マルチソース契約(MSA)が完成し、初期基準が公開
2025 ~ 2026 年: コンプライアンス テスト プログラムが確立され、相互運用性が検証される
2026-2027: 完全なエコシステムの成熟度 - 複数のベンダー、実証済みの設計、確立されたベスト プラクティス
戦略的なタイミング:早期導入者 (2025 年) は、競争上の優位性のために検証と統合のリスクを受け入れます。ファストフォロワー (2026) は、実証済みのテクノロジーを低コストで活用できます。レイトマジョリティ(2027~2028年)はコモディティ価格の恩恵を受けるが、差別化のメリットはない。
ベンダーの選択基準
すべての 1.6T トランシーバーが同等であるわけではありません。サプライヤーを評価する方法は次のとおりです。
技術的な差別化要因
1. DSP アーキテクチャ
業界をリードする 3nm DSP チップは、最大 200 Gbps の PAM-4 信号処理をサポートします。-確認する:
プロセスノード (3nm vs 5nm vs 7nm)
FEC 機能とレイテンシー
電力効率の指標
動作温度範囲
2. 光学エンジンの設計
垂直統合された光学エンジンは、CMIS 5.0 以降のバージョンをサポートするトランシーバーにより、最高のパフォーマンスと電力効率を保証します。
ベンダーに尋ねてください:
光学エンジンは社内で製造していますか、それとも購入していますか?{0}
温度範囲全体にわたる TDECQ のパフォーマンスはどのようなものですか?
シリコンフォトニクスですか、それとも従来のディスクリート光学ですか?
3. フォームファクターのオプション
利用可能な構成には OSFP、OSFP-XD、OSFP224 が含まれ、DR8、DR8+、2xFR4、4xFR2 などのインターフェースをサポートします。
フォームファクタをインフラストラクチャに一致させます。
OSFP-100G SerDes スイッチをお持ちの場合は XD
デュアル-ポート 2x800G アプリケーション用の OSFP224
グリーンフィールド 200G SerDes 導入向けの標準 OSFP
運用上の考慮事項
テストと認証
FS 高速モジュール(400G、800G、1.6T)は、品質と信頼性を確保するために、信号強度、エラー率、信号安定性などの重要なパフォーマンス指標をカバーする厳格な包括的なテストを受けています。
以下の証拠を要求します:
IEEE/OIF規格準拠
NVIDIA/Broadcom チップセット認定 (該当する場合)
拡張温度試験 (-5 度~75 度)
Accelerated life testing (MTBF >200万時間)
サプライチェーンの回復力
現在の地政学的な不確実性とコンポーネントの制約を考慮して、以下を評価します。
製造拠点と多様化
部品調達戦略
在庫の配置とリードタイムの保証
代替サプライヤーのオプション
サポートインフラストラクチャ
1.6T の速度では、テクニカル サポートの品質が重要になります。
統合中に検証サポートを提供しますか?
RMA プロセスと所要時間はどのくらいですか?
TDECQ の測定と最適化を支援できますか?
大規模導入に対するフィールド エンジニアリング サポートは提供されますか?
コスト構造の透明性
詳細な内訳をリクエストします:
単価とボリューム階層の比較
サポートと保証の費用
24 か月にわたる予想価格推移
電力、冷却、スペースを含む総所有コスト モデル
評判の良いベンダーは、自社のモジュールと競合他社のモジュール間の消費電力の違いを考慮した TCO 計算ツールを提供します。単価のみを提示している場合は、さらに深く掘り下げてください。
実装ロードマップ
フェーズ 1: 検証と計画 (1 ~ 3 か月目)
技術的な検証:
最終候補に残ったベンダーから 2 ~ 4 個のサンプル モジュールを入手する
本番条件に合わせたテスト環境を構築
BERT テストをモジュールごとに 72+ 時間実行します
既存のスイッチやファイバープラントとの互換性を検証
実際の消費電力と熱特性を測定
運用計画:
最初の導入ターゲットを特定する(リスクの低い環境){0}}
成功基準とモニタリングアプローチを定義する
インストール、構成、トラブルシューティングのためのランブックを作成する
運用スタッフに 1.6T- 特有の手順を指導する
財務モデリング:
ビルドの詳細な TCO 比較: 1.6T、複数の 800G、待機中
モデル障害の影響シナリオと MTR 戦略
損益分岐点スケジュールを計算する-
フェーズ 2: パイロット導入 (4 ~ 6 か月目)
限定生産のご紹介:
20-50 モジュールを非クリティカル パスにデプロイする
包括的なモニタリングの実装 (BER、温度、電力、遅延)
検証のために既存のインフラストラクチャと並行して実行する
学習内容を文書化し、手順を改善する
ベンダーとの関係構築:
直接の技術連絡先を確立する
ボリューム価格と配送スケジュールの交渉
RMA プロセスとスペアパーツ戦略を設定する
大規模な導入へのベンダーの参加を手配する
フェーズ 3: 生産規模の拡大 (7 ~ 18 か月目)
段階的ロールアウト:
追加のクラスター/建物に拡張する
自信が高まるにつれてクリティカルパスに移行する
観察された故障率に基づいてスペア戦略を最適化する
実績のある構成とベンダーに基づいて標準化する
継続的な最適化:
現実世界のデータに基づいて熱管理を改善する-
テレメトリを使用した予知保全の実装
配電と冷却効率を最適化
コスト削減とパフォーマンスの向上を文書化する
フェーズ 4: 成熟と最適化 (月 18+)
優れた運用:
Achieve >1.6T インフラストラクチャで 99.9% の稼働率
洗練されたトラブルシューティング手順により MTTR を削減
自動化されたヘルスモニタリングとアラートを実装する
一般的な問題に対処するための第 1 層サポートをトレーニングする
戦略的進化:
次世代テクノロジーを評価する(CPO、3.2T)-
ベンダーとの関係と価格設定を更新する
適切なユースケースについては LPO を検討してください
レガシーインフラストラクチャの移行を計画する
リスク軽減戦略
技術的なリスク
リスク: 時間の経過とともに信号の完全性が低下する
1.6T リンクは、マージンが狭いため、温度変化、コネクタの汚れ、ファイバのストレスにより、低速接続よりも早く劣化する可能性があります。-。
緩和:
クリティカルなリンクに対して四半期ごとの TDECQ 測定を実施する
自動ファイバー検査システムを使用する
厳格な環境管理(温度、湿度)を維持する
パフォーマンスの傾向に基づいて先制的な交換を導入します。{0}
リスク: ベンダー間の相互運用性の問題
標準は存在しますが、特に初期の製造段階では、ベンダーの実装に微妙な非互換性が存在する可能性があります。
緩和:
本番環境に導入する前に、複数のベンダーの組み合わせをテストします。{0}
最初はクリティカル パスを単一ベンダーで標準化する
詳細な互換性マトリックスのドキュメントを維持する
ベンダーのエンジニアリング チームと直接エスカレーション パスを確立する
リスク: ファームウェアのバグと安定性の問題
1.6T 速度の複雑な DSP ファームウェアには、特定の条件下でのみ現れるエッジ ケースが含まれる場合があります。
緩和:
ベンダーが検証したファームウェア バージョンのみを導入する-
ロールバック機能を備えた段階的なファームウェアのロールアウトを実装する
業界フォーラムとベンダー勧告を監視する
ファームウェア検証のために本番環境をミラーリングするテスト環境を維持する
運営上のリスク
リスク: 不適切なスペア戦略により、停止時間が長くなる
重要なコンポーネントのリードタイムが 16 ~ 20 週間であることを考慮すると、在庫切れによりサービスが長期にわたって中断される可能性があります。
緩和:
実稼働展開用に 5 ~ 10% の予備在庫を維持する
ベンダーとの迅速な RMA プロセスを確立する-
大規模な導入にはベンダー管理のインベントリ プログラムを検討してください。{0}
故障率を保守的にモデル化します (最初は年間故障率を 3 ~ 5% と仮定します)
リスク: 技術的専門知識が不十分
1.6T のトラブルシューティングには、チームが 400G/800G システムでは開発していない可能性のあるスキルが必要です。
緩和:
ベンダーが提供するトレーニング プログラムに投資する-
光ネットワーキングの専門家を雇うか相談してください
パイロット段階で詳細なトラブルシューティング文書を作成する
複雑な問題に対するベンダー サポートのエスカレーション手順を確立する
財務リスク
リスク: 急激な価格下落により早期購入が非経済的になる
1.6T の価格が 18 か月以内に 40 ~ 50% 下落した場合、早期導入者は待っている競合他社と比較して経済的に不利な状況に直面する可能性があります。
緩和:
ハードウェアコストだけでなく、運用上のメリットに基づいてビジネスケースを構築する
価格保護条項を使用して数量契約を交渉する
市場投入までの時間の価値を計算する--
リースまたは従量制の料金モデルを検討してください。{0}
リスク: テクノロジーが変化した場合に投資が行き詰まる (例: CPO の採用)
テクノロジーの移行により、購入した機器が予想よりも早く陳腐化する可能性があります。
緩和:
モジュール性とアップグレードパスを備えたインフラストラクチャの設計
CPO と代替テクノロジーの成熟度を注意深く監視する
初期導入を 12 ~ 24 か月の計画期間に制限する
テクノロジー更新条項を備えたベンダー契約を構築する
1.6T 対 800G の経済分析
財務上の決定を定量化するために、具体的なシナリオに取り組んでみましょう。
シナリオ: 5,000 ポート AI クラスター ファブリック
要件:
5,000 GPU エンドポイントをサポート
全二分帯域幅
低遅延 (<500ns network contribution)
5 年間の計画期間
オプション A: 800G アーキテクチャ
インフラストラクチャー:
800G トランシーバーの 10,000 ポート (2:1 オーバーサブスクリプションの最小化を想定)
容量を確保するには追加のアグリゲーション レイヤーが必要
より多くのスイッチが必要です
コスト (5 年間の TCO):
トランシーバー: 10,000 × 4 ドル、000=4,000 万ドル
スイッチ: 2,500 万ドル (追加の層が必要)
電力: 10,000 × 12W × 0.10 ドル/kWh × 43,800 時間=530 万ドル
冷却: 320 万ドル (1.3 PUE を想定)
スペース: 120 ラック × 2,000 ドル/月 × 60 か月=1,440 万ドル
オペレーション: 複雑性が高い=200 万ドル追加
5 年間の合計 TCO: 8,990 万ドル
オプション B: 1.6T アーキテクチャ (DSP- ベース)
インフラストラクチャー:
5,000 ポートの 1.6T トランシーバー
よりフラットなトポロジ、より少ないスイッチ層
ハードウェア数の 25% 削減
コスト (5 年間の TCO):
トランシーバー: 5,000 × 10 ドル、000=5,000 万ドル (現在の価格)
スイッチ: 1,800 万ドル (ユニット数が少なく、トポロジーがシンプル)
電力: 5,000 × 15W × 0.10 ドル/kWh × 43,800 時間=330 万ドル
冷却: 200 万ドル (25% 削減)
スペース: 90 ラック × 2,000 ドル/月 × 60 か月=1,080 万ドル
オペレーション: 複雑さの軽減=ベースライン
5 年間の合計 TCO: 8,410 万ドル
純節約額: 580 万ドル (6.5%)
オプション C: 1.6T アーキテクチャ (LPO- ベース)
インフラストラクチャー:
5,000 ポートの 1.6T LPO トランシーバー
オプション B と同じトポロジの利点
電力を大幅に削減
コスト (5 年間の TCO):
トランシーバー: 5,000 × 7 ドル、000=3,500 万ドル (予想価格)
スイッチ: 1,800 万ドル
電力: 5,000 × 8W × 0.10 ドル/kWh × 43,800 時間=180 万ドル
冷却: 110 万ドル (50% 削減)
スペース: 90 ラック × 2,000 ドル/月 × 60 か月=1,080 万ドル
オペレーション: ベースライン
5 年間の合計 TCO: 6,670 万ドル
純節約額: 2,320 万ドル (26%)
重要な仮定と敏感さ
上記の分析では、次のことを前提としています。
1.6T の価格は安定 (保守的)
大きな故障や交換は必要ありません
電力コストは 0.10 ドル/kWh (実際のハイパースケール料金は異なります)
すべてのリンク (距離) に適した LPO<500m)
感度分析:
1.6T の価格が 2 年目までに 30% 下がる場合:
DSP- ベースの TCO は 7,700 万ドルに低下(800G と比較して 14% 節約)
LPO- ベースの TCO は 5,600 万ドルに低下(800G と比較して 37% 節約)
電力コストが 0.15 ドル/kWh に上昇した場合:
800G の TCO は 9,400 万ドルに上昇
DSP 1.6T TCO が $86M ドルに上昇
LPO 1.6T TCO が 6,800 万ドルに上昇
LPO の優位性が 28% に増加
損益分岐点分析:-
DSP- ベースの 1.6T が 800G と採算が合うようにするには、トランシーバーの価格を 12,000 ドル未満に抑える必要があります。現在の軌道は、2026 年までに 8,000 ~ 9,000 ドルになることを示唆しており、時間の経過とともにビジネスケースはより強力になります。
よくある質問
1.6T トランシーバーと 800G トランシーバーの実際の到達距離の違いは何ですか?
到達範囲は特定のモジュール タイプによって異なります。 DR8 構成の 1.6T 光トランシーバーは、800G DR8 と同様に、OM4 マルチモード ファイバーで最大 500 m をサポートします。長距離の場合、1.6T FR4 モジュールはシングルモード ファイバで 2km まで到達できます。一方、コヒーレント 1.6T モジュールは高度な変調形式で 100km を超える超長距離アプリケーションをサポートします。-主な違いは最大距離ではありませんが、リンク マージン 1.6T は物理的限界に近い状態で動作するため、距離にわたる信頼性を維持するには、より優れたファイバー品質、よりクリーンなコネクタ、より厳格な環境制御が必要です。
同じネットワーク内に 1.6T トランシーバーと 800G トランシーバーを混在させることはできますか?
はい、ただし重要な注意点があります。マルチレート ポート サポートを備えたスイッチは、異なる速度で同時に動作できるため、段階的な移行が可能です。ただし、1.6T トランシーバーを 800G トランシーバーに直接接続することはできません。{{5}両方のレートをサポートするスイッチで終端する必要があります。実際的なアプローチは、リーフ レイヤで 800 G を維持しながら、新しいスパイン レイヤまたは高帯域幅パスに 1.6 T をデプロイし、ビジネス ニーズに応じてリーフを移行することです。{8}}混合速度のアーキテクチャでは、モニタリング、トラブルシューティング、容量計画の運用が複雑になるため、トポロジを注意深く文書化し、明確な移行ロードマップを維持してください。
800G と比較して、1.6T はネットワーク遅延にどのような影響を与えますか?
1.6T では、アーキテクチャの簡素化によりネットワーク全体の遅延を実際に削減できます。ホップあたりのシリアル化レイテンシはわずかに減少しますが(同じデータ量を 2 倍の速度で送信すると、半分の時間がかかります)、より大きな影響は集約レイヤを排除することによってもたらされます。ポート速度の向上によりフラットなトポロジが可能になり、1-2 スイッチホップが削減され、レイテンシが 500-1000 ナノ秒減少します。ただし、DSP- ベースの 1.6T モジュールでは、信号処理に約 100 ~ 200ns の内部レイテンシが追加されます。 LPO モジュールはこの DSP 遅延を排除し、超低遅延アプリケーションに最適です。 AI トレーニング ワークロードの場合、ネットワーク ホップの削減と帯域幅の増加を組み合わせることで、通常、全体的な通信パフォーマンスが 15 ~ 25% 向上します。
1.6T トランシーバーで 1 つのレーンに障害が発生した場合はどうなりますか?
最新の 1.6T トランシーバーはグレースフル デグラデーションを実装しています。-8 つの 200G レーンのうち 1 つに障害が発生した場合、モジュールは低下した容量で動作を継続できます(7 つの機能レーンで 1.4T、または 6 レーンで 1.2T)。ただし、この動作は設定に依存します。-一部のスイッチ プラットフォームでは、レーン数がしきい値を下回った場合にポート全体が無効になる場合がありますが、他のスイッチ プラットフォームでは動的レート適応がサポートされます。主な懸念は検出です。ハード障害が発生する前に、レーンごとの健全性指標(TDECQ、FEC 修正率、BER)を追跡するモニタリング システムが必要です。-、劣化しているレーンを特定します。単一レーンの障害は、多くの場合、より広範な問題(コネクタの汚染、熱の問題、製造上の欠陥)を示しているため、動作の低下に頼るのではなく、ただちに調査を開始する必要があります。
ファイバー インフラストラクチャを 1.6T にアップグレードする必要がありますか?
おそらく。マルチモード アプリケーション(DR8)の場合、850nm の波長で 400{6}}500m の定格を持つ OM4 または OM5 ファイバーが必要です-古い OM3 を使用している場合は、到達距離の制限に直面します。シングルモード インフラストラクチャは通常、交換なしで 1.6T をサポートしますが、コネクタの品質が重要になります。レーンあたり 200G では、軽微な汚れや研磨の欠陥でもリンク障害が発生する可能性があります。既存の MPO コネクタが低損失であることを確認する必要があります (<0.5 dB) and properly cleaned. For new installations, consider MPO-16 connectors with premium low-loss ratings. The hidden cost is often termination and testing labor-every fiber must be verified to tighter specifications than 400G/800G networks required. Budget $30-75 per connection point for professional cleaning, inspection, and certification.
エンタープライズデータセンターにとって 1.6T は過剰ですか?
ほとんどのエンタープライズ ワークロードでは、そうです。企業は通常、100G または 400G アップリンクを備えた 10G、25G、または 100G サーバー接続を導入しています。{6}}1.6T のバックボーン容量が飽和することはほとんどありません。例外は、AI/ML ワークロードを大規模に実行している企業です。数百のアクセラレータを備えた GPU クラスターを展開している場合、スパイン レイヤーでは 1.6T の経済性が意味を持ち始めます。もう 1 つの考慮事項は将来性です。インフラストラクチャのライフサイクルが 10 年であるということは、今日の 1.6 兆の投資が 2030 年代半ばの成長をサポートすることを意味します。-ただし、ほとんどの企業は、既存の 100G/400G インフラストラクチャを最適化し、1.6T がコモディティ価格に達する 2027 ~ 2028 年まで待つ方がよいでしょう。オーバーサブスクリプションの問題とボトルネックの修正に重点を置きます。最初の帯域幅だけでは、アーキテクチャを変更せずにパフォーマンスの問題を解決することはほとんどありません。
第一世代の 1.6T モジュールは、成熟した 800G と比較してどの程度信頼性がありますか?{0}
初期の 1.6T モジュールの故障率は高く、-現在、年間 3{6}}5% ですが、成熟した 800G 設計の故障率は 1-2% です。メーカーがプロセスを最適化し、コンポーネント サプライヤーが品質を向上させるため、これは最先端のテクノロジーでは一般的です。{20}}この障害は、熱ストレス (TEC 障害、レーザー劣化)、信号整合性の問題 (PAM4 イコライゼーションの問題)、およびファームウェアのバグを中心に発生する傾向があります。ただし、ベンダーの品質は大きく異なります。垂直統合を行っているティア 1 メーカーは、購入した光学エンジンを使用しているメーカーよりも高い信頼性を示しています。製造の成熟に伴い、2025 年末から 2026 年初めまでに 1.6T の信頼性が 800G レベルに近づくと予想されます。リスクを軽減するには、冗長性が存在するパスに 1.6T を導入し、10% の予備在庫を維持し、迅速な RMA プロセスを確立します。信頼性の高いベンダーのプレミアムコストは、多くの場合、運用中断の削減を通じて回収されます。
1.6T トランシーバーは既存の 800G スイッチ インフラストラクチャで使用できますか?
通常、ネイティブ 1.6T ポートをサポートするスイッチは必要ありません。{0}電気インターフェイスは根本的に異なります。800G は 8×100G SerDes レーンを使用しますが、標準の 1.6T は 8×200G SerDes を使用します。ただし、OSFP-XD フォーム ファクタは、16×100G SerDes を使用して 1.6T の速度を実現することでこのギャップを埋め、現行世代のスイッチ ASIC での導入を可能にします。-}。これにより、アップグレード パスが作成されます。OSFP-XD 1.6T モジュールを既存の 800G スイッチに導入し、次の更新サイクル中にネイティブ 200G SerDes スイッチ(および標準 OSFP モジュール)に移行します。一部のベンダーは、1.6T モジュールが 800G に自動ネゴシエートする下位互換性モードも提供しています。{21}これにより、帯域幅の利点が犠牲になります。{23}特定のスイッチ モデルの互換性マトリックスを確認してください-マルチレート動作をサポートするものもありますが、固定速度のものもあります-。
本当の決断: 容量だけではなく能力
1.6T を選択するということは、現時点で帯域幅が必要かどうかということではありません。-インフラストラクチャが運用の複雑さを吸収できるかどうか、組織にインフラストラクチャを管理するための技術的な深さがあるかどうか、そして総所有コストが計画期間内の投資に見合うかどうかが重要です。
このテクノロジーは本物であり、すぐに本番環境に対応できます。{0}大手ハイパースケーラーはすでにパイロットを超えて大規模な導入に移行しています。-サプライチェーンは拡大しています。標準化団体は収束しつつあります。これは蒸気ではありません-ハイパースケール インフラストラクチャの新しいベースラインです。
ただし、「ハイパースケールの準備ができている」ということは、「すべての人に準備ができている」という意味ではありません。帯域幅の増加が緩やかな 5,000 人規模の企業には、2025 年に 1.6T を導入するビジネスはありません。10,000 個の GPU を備えた AI トレーニング クラスタを構築するスタートアップなら、間違いなくそうなります。ユースケースの緊急性に対して組織の能力をプロットするという私が概説した意思決定フレームワークは、実際にその範囲のどこに該当するかを評価するための構造化された方法を提供します。{9}}
次の 3 つの具体的なステップ:
初め、準備マトリックスに対して特定の要件をマッピングします。自分の技術的能力について正直になり、成長の軌道について現実的になってください。 「監視して待つ」象限にいる場合、それは有効な戦略です。-2025 年に最先端のテクノロジーを導入するのではなく、2027 年に実証済みのテクノロジーを採用してもペナルティはありません。-
2番, 「今すぐ採用」または「開発の加速」の象限にいる場合は、小規模から始めてください。 2 ~ 3 社のベンダーに 10 ~ 20 個のサンプル モジュールを注文します。テスト環境を構築します。ベンダーの主張を検証します。実際の消費電力と熱特性を測定します。ほとんどの失敗は、組織が検証をスキップして実稼働環境への展開に直接移行するために発生します。
三番目テスト インフラストラクチャ、熱管理、ファイバー プラントのアップグレード、運用の複雑さ、予備戦略など、すべての隠れたコストを含む実際の TCO を計算します。{0}私が提供したフレームワークを使用しますが、電力コスト、人件費、スペースの制約などの実際の数字を代入します。損益分岐点の方程式は、これらの変数に基づいて劇的に変化します。-
1.6T に移行するハイパースケール事業者は、それが流行だからやっているのではなく、-特定の状況において経済的および技術的なケースが圧倒的であるため、そうしているのです。コンテキストは異なる場合があります。業界の勢いではなく、証拠に基づいて評価します。


