我々は既に MPI 3.0 において規格化される予定の非ブロッキング集団通信を高速に実行する手法 KACC を提案した.KACC は集団通信の進捗処理を OS カーネル上に実装することによって,従来手法では問題となっていたオーバヘッドの問題と実行タイミングの問題を解決している.本報告では,KACC が OS カーネル上に進捗処理を実装することに起因する負荷分散に関する問題点と,その解決法を示す.KACC のテスト実装において CPU 時間の消費および通信アルゴリズムの実行時間の 2 点について従来手法と比較し,解決法の妥当性を評価する.We have proposed a new method, called KACC, to execute non-blocking collective communications, which will be introduced in MPI 3.0, efficiently. KACC resolves overhead and timing problems in former methods by implementing progression of collective communications in the OS kernel. In this paper, we describe the load-balancing problem, which is caused by implementing progression in OS kernel, and its solution. We evaluate CPU time consumption and execution time of collective communications among several implementations.