研究シーズ集

情報通信

広域分散コンピューティングシステムの安定的運用法の開発  ~ 運用状況の可視化・自動診断・自動復旧 ~

理学部 物理学プログラム

高エネルギー物理学研究室

自然科学系 教授

早坂 圭司 HAYASAKA Kiyoshi

関連URL:
http://www.hep.sc.niigata-u.ac.jp/

専門分野 素粒子物理学、広域分散コンピューティング
キーワード 素粒子実験、広域分散コンピューティングシステムの開発・運用

研究の目的、概要、期待される効果

 素粒子実験分野では実験の高度化に伴いデータ量の増大、それを処理するために必要とされる計算資源、それを保存する記憶領域の増大が問題となっており、この問題を解決するために現代的な実験では広域分散コンピューティングシステムの導入が必須となっています。
 広域分散コンピューティングシステムとは、利用者から見るとあたかも1つの巨大なコンピュータのように見え、その実、世界中に分散して存在する計算機資源を管理し効率よく活用するシステムのことです。計算機資源の管理状況は管理者によってさまざまで計算機に問題があっても気づかない管理者も多くいるため、問題がある場合はいち早く問題点を発見し可能な限り状況を分析する必要があります。そのためには運転状況を自動的に把握、可視化し、その状況から問題を浮き彫りにし、原因へと迫るというシステムが必要となります。現在のところそのようなものは存在せず、自分たちで開発する必要があります。
 今後、広域分散コンピューティングは社会インフラとして標準化していく可能性が高く効率的安定的運用の技術は需要が高まると期待されます。我々は、初めて日本がホストとなった国際共同実験Belle IIに参加し、広域分散コンピューティングシステムの開発・運用を行っています。

   
関連する知的財産論文等

Computing system at Belle II experiment( PoS KMI2013 (2015) 008)

Monitoring system for the Belle II distributed computing( J.Phys.Conf.Ser. 664 (2015) 6, 062020 )

Job monitoring on DIRAC for Belle II distributed computing( J.Phys.Conf.Ser. 664 (2015) 6, 062023)

アピールポイント

 EUや北米が中心の広域分散コンピューティングシステムは地域の偏りが大きく、日本が中心となって初めて世界を巻き込んだものとなりました。200PB, 50,000CPUの世界です。

つながりたい分野

・広域分散コンピューティングシステムの開発・運用に関心のある方


お問い合わせは
新潟大学社会連携推進機構
ワンストップカウンター まで 
onestop@adm.niigata-u.ac.jp

トップへ戻る