研究成果 2021年6月

機械学習を用いたプラズマ実験中の異常発光の予測

大型ヘリカル装置（LHD）のプラズマ実験では異常な発光が観測されることがあります。この異常発光の原因である装置内面の異常な過熱により、装置が損傷することがありますので、発光を事前に予測したいという要求があります。今回、機械学習の一手法であるサポートベクトルマシン^※1を用いて異常発光を高精度で予測できることを示しました。この成果により、異常発光を回避できる可能性が得られました。

プラズマ発光の様子を撮影した動画のシーン。左は正常な発光で、右が本研究で異常としている発光が含まれるシーン。右のシーンでは、画面の右上に金色の線上の発光が見られる。これが本研究で異常発光としている発光である。

本研究では、プラズマ実験中に生じる異常発光の発生を、機械学習の一手法であるサポートベクトルマシンを用いて予測する手法について検討しました。

予測に使用する特徴量として、動画を構成する画像（フレーム）の輝度値を使用しました。フレームのサイズは、幅352画素、高さ240画素ですが、図に示したように、フレームの上部および下部には実験番号や経過時間等の発光現象に関係のない情報が表示されているため、その部分を切り取り、256x128画素の画像にしました。その画像を白黒濃淡画像に変換し、64x64の区画に分割し、各区画を区画中の輝度値の平均値で表しました。この結果、64x64画素の画像が得られますが、この画素の輝度値を１次元に並べた4096個の輝度値からなるベクトルをサポートベクトルマシンの入力としました。なお、各輝度値を最大値の255で割ることにより、0から1の範囲の値にしました。

今回は、核融合科学研究所の大型ヘリカル装置（LHD）における第10サイクルのプラズマ実験の様子を収めた動画の中から、199本の異常発光動画と254本の異常発光なしの動画を使用しました。また、予測性能のテスト用に異常発光動画と異常発光なしの動画をおのおの６本ずつ用意しました。動画は、数秒～数十秒のものを用いました。ここで、プラズマが写っていない画像は学習データとして適切ではないと考えました。本研究で用いた動画のフレームの平均輝度値が40未満のものはプラズマが写っていないものがほとんどでしたので、フレームの平均輝度値が40未満のものは使用しないことにしました。この結果、前記のプラズマ発光動画から27,681枚の画像が得られました。このうち、異常発光を有する（正例）画像は7,968枚、異常発光を有しない（負例）画像は19,713枚でした。また、今回、学習に用いる訓練データと評価データの割合は8:2としました。

サポートベクトルマシンの実現には、プログラミング言語Pythonの機械学習ライブラリscikit-learnを使用しました。

予測性能を評価するために、学習済みモデルにより異常発光である確率を求めて異常発光の判定を行いました。これは、予測性能のテスト用動画の異常発光の1フレーム前までのデータに対して行いました。

予測の結果、異常発光の前に異常発光の予測ができており、また、異常発光ではない動画では異常発光と予測する回数は明らかに少なくなっていました。また、96％以上の正解率^※2、93％以上の精度^※3と再現率^※4という非常に高い予測性能が得られました。これにより、サポートベクトルマシンが異常発光予測において有効であることが確認できました。ただ、異常発光を異常発光ではないと判定する場合が存在しますので、今後、さらなる精度の向上を図る必要があります。

本研究は、京都工芸繊維大学の中川翔太、寶珍輝尚、野宮浩揮の研究グループと核融合科学研究所の中西秀哉、庄司主の協力によって進められ、この研究成果は、核融合工学に関する国際的な学術論文誌「フュージョン・エンジニアリング・アンド・デザイン」に2021年6月付けで掲載されました。

論文情報

S. Nakagawa et al., "Prediction of unusual plasma discharge by using Support Vector Machine", Fusion Engineering and Design 167 (2021) 112360. [NIFS Repository]

用語解説

※1 サポートベクトルマシン：識別を行う、教師あり学習の一手法。学習データ（２クラス分類では正例データと負例データ）をもとに学習して正か負かを識別するモデルを作成し、そのモデルを使用して未知のデータが正か負かを判別する。サポートベクトルマシンでは、学習データの正例データの集まりと負例データの集まりがなるべく離れるような識別面を求め、その識別面をもとに未知のデータの判別を行う。

※2 正解率：どの程度正解しているかを表す指標であり、全データ数に対する（正例を正例と予測した数＋負例を負例と予測した数）の割合のこと。

※3 精度：予測にどのくらい誤りがないかを示す指標で、正例と予測した中で、実際に正しかった割合のこと。

※4 再現率：予測がどのくらい正解を網羅できているかを示す指標で、実際に正例であるものの中で、正例と予測した割合のこと。