Detail of Publication
Text Language | Japanese |
---|---|
Authors | 上田 敬介, 黄瀬 浩一 |
Title | カメラを用いたレイアウトフリー文書画像検索 |
Book_Title | 電子情報通信学会技術研究報告 |
Vol. | 111 |
No. | 430 |
Presentation number | PRMU2011-227 |
Pages | pp.185-190 |
Reviewed or not | Not reviewed |
Month & Year | February 2012 |
Abstract | 本稿では,我々が構築している,コンテンツ一致を基準としたカメラベースの文書画像検索手法における検索精度の向上法を提案する.我々はこれまでに,次のような特徴を持つ手法 (従来手法と呼ぶ) を提案した.すなわち,(1) 単語ごとの特徴抽出とクラスタリングを用いた単語画像の簡易コード化,(2) メッシュ特徴による特徴抽出,(3) 単語クラスタ ID の n-gram による索引付け,の 3 つである.しかし,従来手法には 3 つの問題点がある.単語の回転を考慮していないこと,フォントの変化に弱いこと,n-gram の特定性を考慮していないことである.これら対して,提案手法では回転処理を加えた単語の形状から特徴抽出を行い,更に,データベース文書を複数のフォントで登録するとともに,重み付けを加える.その結果,従来手法よりも精度の向上が見られた.レイアウトや撮影方法の異なる文書画像 320 枚をクエリ画像とし,データベースの画像 2,500 枚に対して検索実験を行ったところ,検索精度88.1%,処理時間 671[ms] を得た.検索精度については,従来手法の 42.8%,OCR を用いた手法の 70.3%から大幅に改善しており,処理時間についても,OCR を用いた手法の 1/5 であったことから,有効性が実証された. |
- Following file is available.
- Entry for BibTeX
@InCollection{上田2012, author = {上田 敬介 and 黄瀬 浩一}, title = {カメラを用いたレイアウトフリー文書画像検索}, book_title = {電子情報通信学会技術研究報告, PRMU2011-227}, year = 2012, month = feb, volume = {111}, number = {430}, presenID = {PRMU2011-227}, pages = {185--190} }