Home >

news ヘルプ

論文・著書情報


タイトル
和文:音声強調のための拡散モデルにおける計算量の削減 
英文: 
著者
和文: 西 悠希, 岩野 公司, 篠田 浩一.  
英文: Yuki Nishi, 岩野 公司, Koichi Shinoda.  
言語 Japanese 
掲載誌/書名
和文:日本音響学会第151回(2024年春季)研究発表会 講演論文集 
英文: 
巻, 号, ページ        
出版年月 2024年3月 
出版者
和文:一般社団法人日本音響学会 
英文:Acoustical Society of Japan 
会議名称
和文:日本音響学会第151回(2024年春季)研究発表会 
英文: 
開催地
和文:東京都文京区 
英文: 
ファイル
公式リンク chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://acoustics.jp/cms/wp_asj/wp-content/uploads/004_2024spring_program.pdf
 
アブストラクト 雑音除去を目的とした音声強調で近年はニューラルネットワークを用いた技術が広く使われるようになり, より高い精度が実現されている. 一方で, 近年は拡散モデルと呼ばれる手法が, データの生成に関し高精度かつ訓練が安定しているということで注目されている. 音声強調においても, この拡散モデルを用いる研究がなされている. しかしこの手法は, 生成段階で繰り返しデータをネットワークに通す必要があるために計算量が多いという欠点を持つ.  本研究は, 拡散モデルにおける生成段階の計算コストを, なるべく精度を落とさずに削減することを目指す. AutoEncoderにより, 入力される音声データを圧縮し, その中で拡散モデルの生成処理プロセスを実行することで, 計算コストの削減を精度を落とさずに実現した.

©2007 Institute of Science Tokyo All rights reserved.