English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
マルチモーダルi-vectorを用いた話者ダイアライゼーション
英文:
Multimodal i-vectors for speaker diarization
著者
和文:
西 史人
,
井上 中順
,
篠田 浩一
.
英文:
Fumito Nishi
,
Nakamasa Inoue
,
Koichi Shinoda
.
言語
Japanese
掲載誌/書名
和文:
情報処理学会研究報告 SLP
英文:
巻, 号, ページ
vol. 107 no. 4 pp. 1-6
出版年月
2015年7月17日
出版者
和文:
英文:
会議名称
和文:
平成27年度 第107回情報処理学会音声言語情報処理研究会
英文:
開催地
和文:
長野県諏訪市
英文:
Suwa-shi, Nagano Pref.
ファイル
アブストラクト
映画を対象とするマルチモーダル話者ダイアライゼーションにおいて,マルチモーダル i-vector を用 いる手法を提案する. i-vector とは話者認識において使われている特徴量であり,発話者の情報を表した 低次元ベクトルである.音声の i-vector に,動画中の話者の顔画像から抽出した i-vector を結合すること で作られたマルチモーダル i-vector に対して教師無しクラスタリングを行う.評価実験は映画「ハンナと その姉妹」のデータセットで行い,Diarization Error Rate (DER) は音声のみを用いた場合比べ,68.3%か ら 65.5%に改善された.
©2007
Institute of Science Tokyo All rights reserved.