Home >

news ヘルプ

論文・著書情報


タイトル
和文:増分データとErasure Coding を利用した高速なチェックポイント手法 
英文:The Efficient Checkpoint based on Erasure Coding with Incremental Method 
著者
和文: 實本英之, 中村俊介, 遠藤敏夫, 松岡聡.  
英文: HIDEYUKI JITSUMOTO, Shunsuke Nakamura, Toshio Endo, SATOSHI MATSUOKA.  
言語 Japanese 
掲載誌/書名
和文:情報処理学会研究報告 
英文:IPSJ SIG Technical Reports 
巻, 号, ページ Vol. 2009-HPC-122    No. 9    pp. 1--6
出版年月 2009年10月 
出版者
和文:情報処理学会 
英文:Information Processing Society of Japan 
会議名称
和文:HPC研究会 
英文:SIG HPC 
開催地
和文:東京 
英文:Tokyo 
アブストラクト チェックポイント/リスタート手法は多くの大規模 HPC システムで利用されている耐故障機能である。しかし、近年の大規模 HPC システムのメモリサイズの急速な増大に比べ、並列ファイルシステムの I/O 帯域の増大は相対的に低いため、チェックポイント時間が増加してしまう問題がある。本研究では、チェックポイントのオーバヘッドを低く抑えつつ多重故障に対応することを目的とし、Erasure Coding を採用する。処理のボトルネックを避けるために Erasure Coding の符号演算処理を並列化し、かつ並列ファイルシステムの代わりにノードのローカルストレージにプロセスイメージを格納する。さらにプロセスイメージの大きさを削減するために、Incremental Checkpoint 手法を採用する。この手法はチェックポイント時に前回のプロセスイメージとの差分部分を記憶するものである。並列環境において行列積演算および NPB LU ベンチマークを用いた実験の結果、Incremental Checkpoint を用いたときに 28-84% の性能向上を確認した。

©2007 Institute of Science Tokyo All rights reserved.