English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
拡散モデルを用いた音声強調の計算量削減
英文:
著者
和文:
西 悠希
, 岩野 広司,
篠田 浩一
.
英文:
Yuki Nishi
, 岩野 広司,
Koichi Shinoda
.
言語
Japanese
掲載誌/書名
和文:
電子情報通信学会技術研究報告
英文:
IEICE technical report
巻, 号, ページ
vol. 123 no. 292 pp. 1-6
出版年月
2023年11月25日
出版者
和文:
一般社団法人電子情報通信学会
英文:
The Institute of Electronics, Information and Communication Engineers
会議名称
和文:
第25回音声言語および第10回自然言語処理シンポジウム
英文:
開催地
和文:
東京都港区
英文:
ファイル
アブストラクト
近年拡散モデルと呼ばれる生成モデルが注目されている. GANと比べ、拡散モデルは安定に学習できるが、生成段階の計算コストが大きいという問題点がある.この傾向は音声強調への拡散モデルの応用に関しても同様である. 本稿では, 音声強調のための拡散モデルにおいて, Encoder,Decoderを用いることによる潜在空間にて音声信号を圧縮し, 圧縮された信号から拡散モデルにより雑音を除去することで, 精度を保ちつつ計算コストの削減することが可能なことを示す. 雑音と音声を同時に用いる訓練でEncoder, Decoderを学習した結果, PESQを低下させずに生成時間を50% 以上減少させることに成功した.
©2007
Institute of Science Tokyo All rights reserved.