東証の10/9のトラブルは証券会社側の設定ミス


23:05 追記

メリルリンチ日本証券と判明

「証券会社から1千倍超のデータ」…東証ダウン・読売新聞

https://www.yomiuri.co.jp/economy/20181009-OYT1T50048.html


東証システム障害、証券会社側の設定ミスが原因か・朝日新聞

https://www.asahi.com/articles/ASLB95F4XLB9ULFA024.html

抜粋

・システム障害について、「特定の証券会社から通信経路を確認するための大量の電文があり、障害を起こした」(横山隆介・最高情報責任者〈CIO〉)と明らかに

・JPXによると、9日午前7時32分、東証のシステムへ電文が「極めて短い時間に大量に送られてきた」という。売買注文ではなく通信経路を確認する電文で、通常の1千倍の量だったという。それが原因でシステム障害が起き、証券会社が売買注文を出す4回線のうち1回線が使えなくなった。電文を送った証券会社名は公表していない

証券会社側が一部設定を変更したとみられるという


私見

「通信経路を確認する電文」・・・あくまでも推論ですが、人による簡易なコマンドだとpingやtracertになるのでしょうが、結局、ルータのような機器が、外部のネットワークにつなぐ時に「どのルートが最短か?空いているか?」といったルートを決めるための処理を長時間実行したのではないかと思います。

 

通常は数回で停止、そのルートをルータが覚えて終わりなのでしょうが、今回はその処理を永遠と行ってしまい、相手のサーバーに負荷がかかったのではないかと。

 

証券会社Aのサーバーとルータ*(A) → 東証のサーバーとルータ*(Z) に接続するのに

*ルータあるいはルータに近い機器

 

仮に最短ルート

A-外部ネットワーク(B)-Z

だとしても、回線の混雑状況によっては別のルートや複数の経路を経由した方が「時間的に早い」とネットワーク機器が判断する場合もあり

 

A-ネットワーク(C)-Z

A-ネットワーク(B)-ネットワーク(D)-Z

 

と証券会社Aと東証Zとの間には、様々なルートや、もっと複雑なルートも想定されます。

いずれにせよ、本来、謝罪すべきなのは東証ではなく、その証券会社のネットワーク管理者かその委託業者だと思います