デジタル光モジュールは最新のシステムで動作します

Dec 17, 2025|

 

 

光トランシーバーは、エレガントな物理学と残酷な実用主義が出会うネットワーキングにおける奇妙な交差点の 1 つに位置しています。すべてのモジュール内では、-余剰ビンから取り出した 30 ドルの SFP であっても、メトロ DCI 向けの 12,000 ドルのコヒーレント ZR+ ユニットであっても-同じ基本的な変換が発生します。つまり、光子が電子になり、電子が光子になります。実装の詳細は大きく異なります。故障モードはさらに大きく異なります。そして、何十年にもわたる標準化の取り組みにもかかわらず、どういうわけか、異なるベンダーの 2 つのモジュールをうまく連携させるのは冒険のままです。

b41ff83b-2e3b-4a0a-b39c-0e65b915abb0

 

物の中に実際に何が入っているのか

 

トランシーバーを割って開けると (実際に開けないでください。レーザーにさらされるだけでは危険です)、1990 年代後半から基本的にアーキテクチャが変わっていないコンポーネントが驚くほど高密度に配置されていることがわかります。送信機セクションには光源が収納されています。-通常は、短距離マルチモード アプリケーション用の VCSEL、-シングルモード ファイバーを介した本格的なアプリケーション用の DFB レーザーです。-受信機側にはフォトダイオードとトランスインピーダンスアンプが含まれています。それらの間には、データ レートが要求するあらゆる信号調整が配置されます。

VCSEL は、データセンター光学系の英雄であると同時に悪役でもあるため、特別な言及に値します。垂直-キャビティ面-レーザーは、端面発光デバイスを悩ませていた製造上の問題を解決しました。-ダイシングする前にウェーハ上でテストできるため、実際に何を出荷するかを把握できます。安いですよ。彼らは十分に信頼できます。彼らはクールに走ります。

しかし、VCSEL には重要な距離制限があります。

マルチモード ファイバーを通過する 850nm の光は、どんなに賢い DSP を使っても完全には克服できないモード分散の壁にぶつかります。アイ ダイアグラムが現代アートのように見えるようになるまで、25G でおそらく 100 メートル移動します。フリーアクセスフロアの OM4 ファイバーは、私たちが求めていることを目的として設計されていません。また、私がこれまで見てきたほとんどのエンタープライズ展開では、OM5 の導入は依然として「有望」と「理論的」の間のどこかにあります。

 

誰も正しく尋ねていない波長の質問

2
 

光ネットワーキングを初めて使用する人は、850nm と 1310nm が価格だけが異なる交換可能なオプションであるかのように、波長の選択については無視して、フォーム ファクタ{0}}QSFP と SFP、DD と OSFP-にこだわる傾向があります。そうではありません。

850nm はマルチモードの世界に属します。この波長でのファイバーの減衰は約 2.5 dB/km ですが、マルチモードの実行はキロメートルではなく数十メートルで測定されることを思い出すまでは、これはひどいことのように聞こえます。 VCSEL はエッジエミッタよりも製造コストが安く、ファイバ自体は多少のアライメントを許容するため、経済的に機能します。{4}}ラック間の接続には十分です。{6}}-

1310nm では、シングルモードで減衰が約 0.4 dB/km に低下します。-。これは O- 帯域で、波長分散が適切な最小値に達し、信号を増幅せずに 10km まで送信できます。ほとんどの LR モジュールはここにあります。

1550nm では、通信業界の誰もが崇拝する C バンドの「ゼロ損失ウィンドウ」-、-} 0.3 dB/km まで下がります。- DWDM システムは、エルビウム-ドープのファイバーアンプがこの帯域で美しく動作するため、この帯域に数十のチャネルを詰め込みます。しかし、これらの EDFA には費用がかかり、距離が 40 km 未満の場合、追加の出費が意味を持つことはほとんどありません。

私が繰り返し目にする間違いは、「損失が低い方が良いに違いない」という理由で、誰かが 2 km のキャンパス リンクに 1550nm モジュールを仕様するというものです。それは良くありません。メリットもないのにコストが高くなり、必要のなかった在庫の複雑さが発生します。

 

シグナルインテグリティとクロックリカバリの問題

 

ここが、物事が本当に興味深いところであり、また、若手エンジニアが高くつく間違いを犯し始めるところでもあります。

高速シリアル データはクロック信号とともに送信されません。-タイミング情報はデータ ストリーム自体から復元する必要があります-これをクロックおよびデータ復元回路が行います。モジュール内の位相ロック ループは、受信ビットストリームの遷移を監視し、それらの遷移からローカル クロックを生成し、その回復されたクロックを使用してアイの最適なポイントで後続のビットをサンプリングします。

これは、そうでない限り、非常にうまく機能します。

CDR ロックには、データ内の十分な遷移が必要です。 10G イーサネットで使用される 64B/66B エンコーディングは、PLL を満足させるのに十分なエッジを保証します。しかし、誰かが病的なパターンを送信した場合、-、またはさらに悪いことに、動作を誤った上流のデバイスから同じシンボルが長時間実行されると、CDR がロックを失う可能性があります。-ロックが失われると、LOL (ロック喪失) アラームが発生し、リンクが切断され、何が問題になったのかエラー カウンターを見つめることになります。

イライラする部分: CDR の動作はベンダーによって異なります。メーカー A のモジュールが、メーカー B のモジュールを即座に強制終了するパターン シーケンスを通じてロックを維持しているのを見たことがあります。どちらも仕様を満たしていました。どちらもコンプライアンステストに合格しました。 1 つは顧客の実際の交通環境で機能し、もう 1 つは機能しませんでした。

 

DDM はトラブルシューティングを永久に変更しました (機能する場合)

 

デジタル診断モニタリングが標準になる前は、ファイバー リンクのトラブルシューティングを行うには、モジュールを取り外し、ケーブルを交換し、変更管理プロセスを司る神に祈る必要がありました。リンクがダウンしていれば、何かが間違っていることがわかります。何が何だか分かりませんでした。

DDM は-業界では冗長な頭字語が好まれているため、DOM とも呼ばれます。-その考えが変わりました。最新のトランシーバーはすべて、温度、供給電圧、レーザー バイアス電流、TX 電力、RX 電力などのリアルタイム テレメトリを I²C インターフェースを通じて報告します。- SFF-8472 仕様ではメモリ マップが定義されています。スイッチはそれを自動的に読み取ります。

これは純粋に良い方向のように聞こえますが、ほとんどがその通りです。しかし、私は DDM データに何度も悩まされてきたため、健全な懐疑論を抱くようになりました。

TX 電力の読み取り値は?これは、レーザー出力の一部をサンプリングするモニター フォトダイオードから得られます。レーザーと MPD 間の結合効率は温度によって変化します。モジュールの EEPROM に焼き付けられた校正データは、深センのどこかのベンチで 25 度で測定されました。このモジュールはフル負荷のスイッチ内の他の 2 つのホット トランシーバーの間に配置されているため、実際の動作環境は 47 度になります。-

画面上の数値はおおよその値です。通常、これは適切な近似値です。しかし、私は正常に見える DDM の測定値だけに基づいて勝利を宣言してはいけないことを学びました。光パワーメーターを手に取ります。ファイバーに当たる実際の光を測定します。

 

3

 

温度がすべて

 

温度が光モジュールの動作にどれだけ影響を与えるかは、いくら強調してもしすぎることはありません。重要なすべてのパラメーターは温度とともに変化します。

モジュールが加熱すると、レーザーのしきい値電流が増加します。{0}同じ光出力を達成するには、デバイスがより多くの駆動電流を必要とします。スロープ効率が低下することは、バイアスがミリアンペア追加されるたびに生成される光が減少することを意味します。波長ドリフトは、チャネル間隔が狭い CWDM および DWDM システムでは非常に重要です。フォトダイオードの応答性が変化します。監視回路内の基準電圧もドリフトします。

メーカーは動作範囲を指定しています。-通常、商用グレードの場合は 0 度~70 度、産業グレードの場合は -40 度~85 度です。それらが適切に伝えていないのは、その範囲の端でモジュールのパフォーマンスが中央と比べてどれだけ劣るかということです。

現場でモジュールを測定したところ、スイッチの周囲温度レポートに示されている温度よりも 15 度高くなりました。トランシーバーのケース温度センサーは 63 度を示しましたが、スイッチ シャーシは環境モニタリングで「エアフローは正常」および「温度は 38 度」と報告しました。この不一致が存在するのは、スイッチが吸気口で気温を測定している一方で、トランシーバーが 14 ワットでコヒーレント光学系を実行している隣接する QSFP-DD の熱影の中で調理されていたためです。

誰もアラートを受け取りませんでした。リンクは依然として-かろうじて{2}}機能していましたが、pre{3}} エラーが発生し、フレーム損失につながることもありました。その特定のリンクがファブリック内の他の場所にある同一のリンクよりも再送信率が高い理由を解明するのに 3 か月かかりました。

 

第三者からの質問-

 

誰もがサードパーティ製トランシーバーについて知りたがっています。-価格差は無視するのが難しく、表面上は同じ仕様の OEM モジュールよりも 3 倍から 5 倍安いです。

マルチソース契約は、特に相互運用性を実現するために存在します。- X 社の準拠 SFP-10G-LR は、Y 社のものと機能的に同等である必要があります。光パラメータが定義されています。機械寸法が標準化されています。電気インターフェイスは、業界コンソーシアムによって発行された仕様に従っています。

いつものように、現実は仕様とは異なります。

スイッチ ベンダーは、ベンダー ID 文字列を使用してトランシーバー EEPROM をエンコードします。シスコはこれらの文字列をチェックし、承認リストに一致しないポートをエラー無効にします。{1}ジュニパーの新しいプラットフォームは警告をログに記録し、サポートへの電話を拒否します。 HPE は、製品ラインとファームウェアのバージョンに応じて施行を行ったり来たりしています。

回避策は存在します。シスコのサービス非サポート-トランシーバー コマンドにより、数え切れないほどの導入スケジュールが節約されてきました。サードパーティ ベンダーは、互換性のあるベンダー コードを報告するように EEPROM をプログラムします。 FS Box のようなデバイスを使用すると、現場でモジュールを再プログラムできます。

しかし、これは誰も教えてくれないことです。物事がうまくいかなくなると、-最終的にはサポートが敵対的なものになります。-リンクの問題について TAC に電話し、サードパーティの光学機器について言及し、会話が終わるのを見てください。- 「サポートされているトランシーバーと交換し、問題が解決しない場合は折り返し電話してください。」サポートの観点からすれば、彼らは間違っていません。また、生地が劣化している午前 2 時には役に立ちません。

厳しい経験から生まれた私の個人的なルール: ラボではサードパーティ、本番パスでは OEM が重要です。{0}}トランシーバー、ファイバー、ファームウェアの可能性があり、何も除外できない断続的な CRC エラーのトラブルシューティングを自分が行う場合、コスト削減の説得力は薄れます。

 

 

汚染があなたを見つける

 

光リンクの問題の最大の原因は、モジュール自体とは何の関係もありません。汚れですよ。

ファイバの端面に塵が付着すると、リンクがエラーしきい値を超えてしまうほど信号が減衰する可能性があります。 100G 以上では、マージンは以前ほどではありません。受信機の感度限界に近い状態で動作しています。 1G イーサネットでは見えなかった塵埃が、400G ではパケット損失を引き起こします。

シングルモード ファイバーのコアの直径は 9 マイクロメートルです。-人間の髪の毛は約70マイクロメートルです。拡大せずに見ることができるものよりも小さな汚染粒子は、光路を完全に遮断する可能性があります。

接続する前に点検してください。いつも。目視チェックではなく、ファイバースコープを使用してください。パッチコードが 5 秒前に密封された袋から出たかどうかは気にしません。-袋が汚れているか、指が何かに触れたか、データセンター内の空気に粒子が含まれているかなど。検査し、必要に応じて清掃し、再度検査してから接続します。

掃除自体にリスクが伴います。乾拭きすると静電気が発生し、より多くの汚れを引き寄せます。イソプロピル アルコールを使用したウェット クリーニングでは、すぐに拭き取らずに蒸発させた場合、残留物が残ることがあります。ワンクリック クリーナーは、使い果たされるまで効果があり、誰かがとにかくクリックし続け、フェルール全体に汚染物質を再分配します。

私は、技術者が断続的なリンクのトラブルシューティングに 4 時間を費やしているのを見ました。モジュールを2回交換しました。ケーブルの配線を確認しました。構成を見直しました。最後に検査範囲を調べたところ、バルクヘッドアダプターに指紋の残留物のようなものが発見されました。きちんと掃除しました。リンクは正常に起動し、起動したままになりました。

4時間。指紋用。

 

モジュールを選択する際に実際に重要なこと

 

技術的な詳細をすべて考慮した後、選択プロセスは通常、どのデータシートにも記載されていないいくつかの実用的な考慮事項に帰着します。

スイッチのプラットフォームは何ですか? Cisco ショップであれば、フォーム ファクタに関する質問のほとんどは解決されます。 Arista または Juniper をリーフで実行し、他のものをスパインで実行している場合は、オプションがある可能性があります。-しかし、それらのオプションを実行すると、インベントリが複雑になります。一貫性には価値があります。

実際にどれくらいの距離をカバーする必要がありますか?ケーブルの配線を測定します。パッチパネルとスプライスのマージンを追加します。次に、その距離要件を満たし、余裕を持った最も安価なモジュール タイプを選択します。 「後でリーチが必要になるかもしれないから」という理由で 50 メートルのランニングに LR モジュールを指定するのはお金の無駄です。

あなたの繊維植物は何ですか?建物内ではマルチモード、-建物間ではシングルモード-が一般的なパターンです。そのパターンと戦うことは、それに取り組むよりもコストがかかります。

設置品質をどの程度信頼しますか? 400G は 100G よりも余裕が少なくなります。低速では正常に動作していたコネクタが汚れていると、問題が発生します。 Cat5e が将来性があると考えられていた時代に構造化されたケーブル配線を行っている場合は、問題が発生することが予想されます。-

退屈なアドバイスはたいてい正しいです。テクノロジーを実際の要件に合わせ、故障したときにサポートしてくれるベンダーから購入し、コネクタに触れるたびにすべてのコネクタを掃除します。モジュール自体の信頼性は非常に高くなりました。問題はほとんどの場合、別の場所にあります。

 

お問い合わせを送る