Home >

news ヘルプ

論文・著書情報


タイトル
和文:拡散モデルを用いた音声強調の計算量削減 
英文: 
著者
和文: 西 悠希, 岩野 広司, 篠田 浩一.  
英文: Yuki Nishi, 岩野 広司, Koichi Shinoda.  
言語 Japanese 
掲載誌/書名
和文:電子情報通信学会技術研究報告 
英文:IEICE technical report 
巻, 号, ページ vol. 123    no. 292    pp. 1-6
出版年月 2023年11月25日 
出版者
和文:一般社団法人電子情報通信学会 
英文:The Institute of Electronics, Information and Communication Engineers 
会議名称
和文:第25回音声言語および第10回自然言語処理シンポジウム 
英文: 
開催地
和文:東京都港区 
英文: 
ファイル
アブストラクト 近年拡散モデルと呼ばれる生成モデルが注目されている. GANと比べ、拡散モデルは安定に学習できるが、生成段階の計算コストが大きいという問題点がある.この傾向は音声強調への拡散モデルの応用に関しても同様である. 本稿では, 音声強調のための拡散モデルにおいて, Encoder,Decoderを用いることによる潜在空間にて音声信号を圧縮し, 圧縮された信号から拡散モデルにより雑音を除去することで, 精度を保ちつつ計算コストの削減することが可能なことを示す. 雑音と音声を同時に用いる訓練でEncoder, Decoderを学習した結果, PESQを低下させずに生成時間を50% 以上減少させることに成功した.

©2007 Institute of Science Tokyo All rights reserved.