@article{oai:tsukuba-tech.repo.nii.ac.jp:00001364, author = {金堀, 利洋 and Kanahori, Toshihiro and 鈴木, 昌和 and Suzuki, Masakazu}, journal = {電子情報通信学会論文誌. D, 情報・システム}, month = {Mar}, note = {Webアクセシビリティの意識が浸透しつつある一方で,電子図書など情報がPDF文書として提供される流れが加速している.配布されているPDF文書には文字情報が,人が読む順序と異なる順番に埋め込まれていて,視覚障害者がその内容を読み取ることが困難であるといった問題が指摘されている.また,数式の情報が読み取れる形で入っていることは少ない.更に,印刷文書をOCRを用いて認識し,その認識結果をPDF文書として生成した場合,数式がその周辺に文字認識のエラーを引き起こし,数式中以外の文字を読むことも困難になる場合も多い.今回,特に数式を含んだ科学技術文書を対象とし,PDF文書から抽出した文字情報と,PDF文書を画像として認識した結果を統合することで,質の高い,アクセシブルな文書情報をPDF文書から取り出すシステムを示す., 電子情報通信学会論文誌. D, 情報・システム J90-D(3)}, pages = {706--714}, title = {PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム}, volume = {J90-D(3)}, year = {2007}, yomi = {カナホリ, トシヒロ and スズキ, マサカズ} }