文献の詳細
論文の言語 | 日本語 |
---|---|
著者 | 上田 敬介, 黄瀬 浩一 |
論文名 | カメラを用いたレイアウトフリー文書画像検索 |
書名 | 電子情報通信学会技術研究報告 |
Vol. | 111 |
No. | 430 |
発表番号 | PRMU2011-227 |
ページ | pp.185-190 |
査読の有無 | 無 |
年月 | 2012年2月 |
要約 | 本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法 (従来手法と呼ぶ) を提案した.すなわち,(1) 単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2) メッシュ特徴による特徴抽出,(3) 単語クラスタ ID の n-gram による索引付け,の 3 つである.しかし,従来手法には 3 つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gram の特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像 320 枚をクエリ画像とし,データベースの画像 2,500 枚に対して検索実験を行ったところ,検索精度88.1%,処理時間 671[ms] を得た.検索精度については,従来手法の 42.8%,OCR を用いた手法の 70.3%から大幅に改善しており,処理時間についても,OCR を用いた手法の 1/5 であったことから,有効性が実証された. |
- 次のファイルが利用可能です.
- BibTeX用エントリー
@InCollection{上田2012, author = {上田 敬介 and 黄瀬 浩一}, title = {カメラを用いたレイアウトフリー文書画像検索}, book_title = {電子情報通信学会技術研究報告, PRMU2011-227}, year = 2012, month = feb, volume = {111}, number = {430}, presenID = {PRMU2011-227}, pages = {185--190} }