English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
ユーザプロファイルの共有によるベイジアンスパムフィルタの大規模サポート
英文:
著者
和文:
吉田悦郎
,
佐藤一道
,
脇田建
.
英文:
Etsurou Yoshida
,
Kazumichi Sato
,
KEN WAKITA
.
言語
Japanese
掲載誌/書名
和文:
英文:
巻, 号, ページ
出版年月
2008年9月
出版者
和文:
英文:
会議名称
和文:
日本ソフトウェア科学会 第25回大会
英文:
開催地
和文:
英文:
公式リンク
http://www.itpro.titech.ac.jp/jssst2008/program.html#4B
アブストラクト
現在、様々なスパムフィルタが開発されている。本論文ではその中で最も分類精度が高いと言われているベイジアンスパムフィルタを大規模化する手法を提案する。大規模スパムフィルタを構築する際に問題となる点は、計算機の資源不足の問題である。フィルタリングの際に各ユーザに必要となるプロファイルのサイズが数MB であるので、メモリ上で表現できるのは数千人程度である。そこで、まずユーザをプロファイルの類似性に基づいていくつかのグループに分類した。その後グループ毎に一つのプロファイルを共有するという手法を提案する。効果的なグループの分類によって、個人の特徴を消さずに大規模化することを可能にした。また、長期運用を視野に入れた検証も行った。提案手法を実装し1,000,000 人規模の実験を行った結果、ほとんどのユーザの精度を維持したままプロファイルサイズを86MB まで削減し、メモリ上で計算可能になった。
©2007
Institute of Science Tokyo All rights reserved.