2021年1月31日 l 研究成果 遠隔地のデータの存在がすぐに分かるデータ所在情報サービスとは?
image
ITER等におけるデータ利用の形態と複製サイトの関係:データ所在一覧DBが唯一の場合、障害により複製サイトまで全停止を余儀なくされます。データ所在一覧の複製DBが、主体の所在一覧DBとは独立に運用できれば、何らかの障害等でリアルタイム同期が一時的に失われても、遠隔サイトの継続運用性を向上できます。各々のデータ所在登録DBは、サイト外との双方向複製が途絶した際も、常にサイト内のデータ登録は受付ける必要があります。
日本のITER遠隔実験センターでは、1万km以上離れたフランスにあるITERから全データを高速複製する計画です。複数の複製所在からデータを効率良く探すのに、データ所在データベースが重要な役割を果たします。通信遅延を考慮すると、データベース同士は「マルチマスター・非同期複製」を行う必要があります。本研究では、Postgres BDR が同機能を有し、約1千km離れた国内ネットワークで実験を行って日仏間複製に十分な性能を持つ事を確認しました。

現在の核融合実験研究では、国内外の共同研究で、遠隔地からのデータアクセスが広く一般的に行われています。日本の核融合データ交換プラットフォーム「SNET」は、1千km以上の距離を隔てた、LHD、QUEST、GAMMA10、TST-2、の4つの核融合実験サイトを相互接続しています。SNETによって遠隔地の共同研究者は、あたかも実験サイトにいるかのように各実験データにアクセスできます。

同じく、日本の六ヶ所村にある遠隔実験センター(REC)では、1万km以上遠く離れたITER全実験データを複製してくることが計画され、RECにはITER計測データをオフサイト解析するための高性能計算機も準備されています。本研究グループでは、ITERとRECサイトの間で大陸間大規模データ複製実験をすでに行ってきています。

こうした複数サイトのデータ集積サイトがある状況で、ユーザーが効率的にデータを取得できる最適なデータサーバーを見つけるには、データの所在を知らせる「ロケータ(=所在情報)」サービスが不可欠となります。大陸間のネットワーク応答には100ミリ秒以上の通信遅延が生じることを考慮すると、データ集積サイトのみならず所在情報サーバも各サイトに分散している必要があります。データ所在情報は、PostgreSQLやMySQLなどの関係データベース(RDB)で管理されるため、世界中で一貫したデータ所在サービスを提供するには、分散するRDB同士がリアルタイム同期する必要があります。

また、SNETリモートサイトの長年の運用経験から、実験サイトの予期せぬネットワーク停止や計画的なサービス停止に対して、遠隔側の運用独立性が非常に重要であることがわかりました。典型的な例は、年に一度、法令で定められた電気設備の年次点検のために実験サイト全体が停電することですが、遠隔サイトでのデータ解析業務とは本来無関係であり、遠隔側作業の継続に影響を与えるべきではありません。

広域にデータ集積サイトが分散した環境下で、遠隔データ解析を可能にするためには、各サイトでデータ位置情報サービスを稼動させ、他サイトで偶発的または予定されたサービス停止があっても、各々で自律的な継続運用が可能でなければなりません。こうしたサイト独立性とデータ相互同期という相反する2つの要求を同時に満足するには、データ所在情報を提供するRDB間で、非同期マルチマスターの、すなわち双方向の複製を行う必要があります。

本研究では、LHDデータシステムとSNETを用いて、複数マスター構成の所在RDB間で双方向複製を実証実験しました。SNETの分散データシステムでは、これまでマスター/スレーブ方式のRDB複製を採用してきたため、マルチマスター双方向複製を適用するには、システム構造を再設計する必要があります。こうした分散データベースの構造修正は、SNETの複数サイト化運用だけでなく、ITER-REC間の双方向複製にも共通の課題です。

一般的なオープンソースおよび商用のRDBMSソフトウェアを調査した結果、ITER-REC間、およびLHD-SNETの複数サイトDB複製には、PostgreSQLが有望な選択肢の一つであることがわかりました。ITER CODACとLHDはすでに標準RDBとしてPostgreSQLを採用しており、PostgreSQLの双方向複製用拡張モジュールを用いれば、互換性の問題がより起こりにくいと考えられます。OracleやMySQLといった他RDB製品は、より密結合なクラスタ構成志向で、ここで検討している共同研究用途よりも、ミッション・クリティカルなケースで使われることを想定しているようです。

上記を踏まえ、本研究ではPostgreSQLバージョン9.4と同双方向複製(BDR)拡張モジュール(Postgres BDR)を使用して、いくつかの性能テストを行いました。実際の性能試験の前に、他のRDB複製法についても技術調査を行い、機能比較と検討を行っています。

複製性能を検証するために、LHD所在データベースを用いて、SNET上でPostgres BDRの複製速度を測定しました。その結果、ネットワークの往復応答時間と比較して、RDB複製速度は十分速いことが確かめられました。このように、Postgres BDRは、機能・性能の両面において、核融合実験における複数サイト間のデータ所在DB複製に、非常に実用的な選択肢であると結論付けることができました。

なお今回の実証実験で使用した BDR 1.x は PostgreSQL 9.4 をベースにしたフリーソフトでしたが、残念ながら後継となるBDR 2.0はPostgreSQL 9.6、BDR 3.0はPostgreSQL 11と12をベースにして、有償ライセンスのソフトウェアとなりました。しかし、フリーである PostgreSQL の論理レプリケーション標準機能には、BDR 開発者が貢献を続けており、今後の開発が期待されます。本研究グループは、この件について今後も調査を継続する予定です。

また今後、3つ以上のサイトを中継して複製を行う実証実験も計画しています。こうした条件下では、最も効率的なデータ集積サイトと所在情報サーバを選択するための更なる仕組みが必要になってきます。

本研究は、核融合科学研究所の中西秀哉、中島徳嘉、江本雅彦らの研究グループと国立情報学研究所の山中顕次郎、量子科学技術研究開発機構六ヶ所核融合研究所の德永晋介、石井康友らとの協力によって進められ、この研究成果は,H. Nakanishi et al., "Design for the distributed data locator service for multi-site data repositories", Fusion Engineering and Design165 (2021) 112197.として、国際的な核融合工学論文誌「フュージョン・エンジニアリング・アンド・デザイン」に2021年1月31日付けで掲載されました。