WEKO3
アイテム
{"_buckets": {"deposit": "9bfb45d6-f11c-434d-849d-2409b3b4f80b"}, "_deposit": {"created_by": 1, "id": "1364", "owners": [1], "pid": {"revision_id": 0, "type": "depid", "value": "1364"}, "status": "published"}, "_oai": {"id": "oai:tsukuba-tech.repo.nii.ac.jp:00001364", "sets": ["64"]}, "author_link": ["14169", "19604"], "control_number": "1364", "item_1693536256228": {"attribute_name": "ファイル情報", "attribute_type": "file", "attribute_value_mlt": [{"accessrole": "open_access", "date": [{"dateType": "Available", "dateValue": "2024-03-06"}], "displaytype": "detail", "download_preview_message": "", "file_order": 0, "filename": "gakuju007_kanahori_001.pdf", "filesize": [{"value": "843 KB"}], "format": "application/pdf", "future_date_message": "", "is_thumbnail": false, "mimetype": "application/pdf", "size": 843000.0, "url": {"label": "gakuju007_kanahori_001.pdf", "url": "https://tsukuba-tech.repo.nii.ac.jp/record/1364/files/gakuju007_kanahori_001.pdf"}, "version_id": "bd45908e-ab6c-40c8-a049-36ccc0ae4dbc"}]}, "item_3_alternative_title_21": {"attribute_name": "タイトルヨミ", "attribute_value_mlt": [{"subitem_alternative_title": "PDF チュウ ノ テキスト ジョウホウ オ リヨウシタ シカク ショウガイシャ ノ タメノ エイブン PDF カガク ギジュツ ブンショ ヨミトリ システム", "subitem_alternative_title_language": "ja"}]}, "item_3_alternative_title_22": {"attribute_name": "その他のタイトル", "attribute_value_mlt": [{"subitem_alternative_title": "Scientific English PDF Document Reader for Visually Impaired People Utilizing Embedded Text Information"}]}, "item_3_biblio_info_8": {"attribute_name": "書誌情報", "attribute_value_mlt": [{"bibliographicIssueDates": {"bibliographicIssueDate": "2007-03-01", "bibliographicIssueDateType": "Issued"}, "bibliographicPageEnd": "714", "bibliographicPageStart": "706", "bibliographicVolumeNumber": "J90-D(3)", "bibliographic_titles": [{"bibliographic_title": "電子情報通信学会論文誌. D, 情報・システム"}]}]}, "item_3_date_64": {"attribute_name": "最初の登録日", "attribute_value_mlt": [{"subitem_date_issued_datetime": "2011-08-24"}]}, "item_3_description_5": {"attribute_name": "抄録", "attribute_value_mlt": [{"subitem_description": "Webアクセシビリティの意識が浸透しつつある一方で,電子図書など情報がPDF文書として提供される流れが加速している.配布されているPDF文書には文字情報が,人が読む順序と異なる順番に埋め込まれていて,視覚障害者がその内容を読み取ることが困難であるといった問題が指摘されている.また,数式の情報が読み取れる形で入っていることは少ない.更に,印刷文書をOCRを用いて認識し,その認識結果をPDF文書として生成した場合,数式がその周辺に文字認識のエラーを引き起こし,数式中以外の文字を読むことも困難になる場合も多い.今回,特に数式を含んだ科学技術文書を対象とし,PDF文書から抽出した文字情報と,PDF文書を画像として認識した結果を統合することで,質の高い,アクセシブルな文書情報をPDF文書から取り出すシステムを示す.", "subitem_description_type": "Abstract"}]}, "item_3_description_7": {"attribute_name": "引用", "attribute_value_mlt": [{"subitem_description": "電子情報通信学会論文誌. D, 情報・システム J90-D(3)", "subitem_description_type": "Other"}]}, "item_3_publisher_36": {"attribute_name": "出版者", "attribute_value_mlt": [{"subitem_publisher": "社団法人電子情報通信学会"}]}, "item_3_relation_45": {"attribute_name": "関係URI", "attribute_value_mlt": [{"subitem_relation_name": [{"subitem_relation_name_text": "http://search.ieice.org/bin/summary.php?id=j90-d_3_706\u0026category=D\u0026lang=J\u0026year=2007"}], "subitem_relation_type_id": {"subitem_relation_type_id_text": "http://search.ieice.org/bin/summary.php?id=j90-d_3_706\u0026category=D\u0026lang=J\u0026year=2007", "subitem_relation_type_select": "URI"}}]}, "item_3_rights_14": {"attribute_name": "権利", "attribute_value_mlt": [{"subitem_rights": "copyright(c)2007 IEICE"}]}, "item_3_source_id_11": {"attribute_name": "書誌レコードID", "attribute_value_mlt": [{"subitem_source_identifier": "AA12099634", "subitem_source_identifier_type": "NCID"}]}, "item_3_source_id_9": {"attribute_name": "ISSN", "attribute_value_mlt": [{"subitem_source_identifier": "1880-4535", "subitem_source_identifier_type": "PISSN"}]}, "item_3_text_4": {"attribute_name": "著者所属", "attribute_value_mlt": [{"subitem_text_value": "障害者高等教育研究支援センター障害者支援研究部"}, {"subitem_text_value": "九州大学大学院数理学研究院"}]}, "item_3_version_type_18": {"attribute_name": "著者版フラグ", "attribute_value_mlt": [{"subitem_version_resource": "http://purl.org/coar/version/c_970fb48d4fbd8a85", "subitem_version_type": "VoR"}]}, "item_creator": {"attribute_name": "著者", "attribute_type": "creator", "attribute_value_mlt": [{"creatorNames": [{"creatorName": "金堀, 利洋", "creatorNameLang": "ja"}, {"creatorName": "カナホリ, トシヒロ", "creatorNameLang": "ja-Kana"}, {"creatorName": "Kanahori, Toshihiro", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "14169", "nameIdentifierScheme": "WEKO"}, {"nameIdentifier": "00352568", "nameIdentifierScheme": "e-Rad", "nameIdentifierURI": "https://nrid.nii.ac.jp/nrid/1000000352568"}]}, {"creatorNames": [{"creatorName": "鈴木, 昌和", "creatorNameLang": "ja"}, {"creatorName": "スズキ, マサカズ", "creatorNameLang": "ja-Kana"}, {"creatorName": "Suzuki, Masakazu", "creatorNameLang": "en"}], "nameIdentifiers": [{"nameIdentifier": "19604", "nameIdentifierScheme": "WEKO"}]}]}, "item_keyword": {"attribute_name": "キーワード", "attribute_value_mlt": [{"subitem_subject": "視覚障害者", "subitem_subject_scheme": "Other"}]}, "item_language": {"attribute_name": "言語", "attribute_value_mlt": [{"subitem_language": "jpn"}]}, "item_resource_type": {"attribute_name": "資源タイプ", "attribute_value_mlt": [{"resourcetype": "journal article", "resourceuri": "http://purl.org/coar/resource_type/c_6501"}]}, "item_title": "PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム", "item_titles": {"attribute_name": "タイトル", "attribute_value_mlt": [{"subitem_title": "PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム", "subitem_title_language": "ja"}]}, "item_type_id": "3", "owner": "1", "path": ["64"], "permalink_uri": "http://hdl.handle.net/10460/969", "pubdate": {"attribute_name": "PubDate", "attribute_value": "2011-08-24"}, "publish_date": "2011-08-24", "publish_status": "0", "recid": "1364", "relation": {}, "relation_version_is_last": true, "title": ["PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム"], "weko_shared_id": -1}
PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム
http://hdl.handle.net/10460/969
http://hdl.handle.net/10460/9697854459c-dfd7-4204-a8ab-659124117898
名前 / ファイル | ライセンス | アクション |
---|---|---|
gakuju007_kanahori_001.pdf (843 KB)
|
|
Item type | 学術雑誌論文 / Journal Article(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2011-08-24 | |||||
タイトル | ||||||
言語 | ja | |||||
タイトル | PDF中のテキスト情報を利用した視覚障害者のための英文PDF科学技術文書読取りシステム | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
主題Scheme | Other | |||||
主題 | 視覚障害者 | |||||
著者 |
金堀, 利洋
× 金堀, 利洋× 鈴木, 昌和 |
|||||
著者所属 | ||||||
障害者高等教育研究支援センター障害者支援研究部 | ||||||
著者所属 | ||||||
九州大学大学院数理学研究院 | ||||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | Webアクセシビリティの意識が浸透しつつある一方で,電子図書など情報がPDF文書として提供される流れが加速している.配布されているPDF文書には文字情報が,人が読む順序と異なる順番に埋め込まれていて,視覚障害者がその内容を読み取ることが困難であるといった問題が指摘されている.また,数式の情報が読み取れる形で入っていることは少ない.更に,印刷文書をOCRを用いて認識し,その認識結果をPDF文書として生成した場合,数式がその周辺に文字認識のエラーを引き起こし,数式中以外の文字を読むことも困難になる場合も多い.今回,特に数式を含んだ科学技術文書を対象とし,PDF文書から抽出した文字情報と,PDF文書を画像として認識した結果を統合することで,質の高い,アクセシブルな文書情報をPDF文書から取り出すシステムを示す. | |||||
引用 | ||||||
内容記述タイプ | Other | |||||
内容記述 | 電子情報通信学会論文誌. D, 情報・システム J90-D(3) | |||||
書誌情報 |
電子情報通信学会論文誌. D, 情報・システム 巻 J90-D(3), p. 706-714, 発行日 2007-03-01 |
|||||
ISSN | ||||||
収録物識別子タイプ | PISSN | |||||
収録物識別子 | 1880-4535 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AA12099634 | |||||
権利 | ||||||
権利情報 | copyright(c)2007 IEICE | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||
タイトルヨミ | ||||||
その他のタイトル | PDF チュウ ノ テキスト ジョウホウ オ リヨウシタ シカク ショウガイシャ ノ タメノ エイブン PDF カガク ギジュツ ブンショ ヨミトリ システム | |||||
言語 | ja | |||||
出版者 | ||||||
出版者 | 社団法人電子情報通信学会 | |||||
関係URI | ||||||
識別子タイプ | URI | |||||
関連識別子 | http://search.ieice.org/bin/summary.php?id=j90-d_3_706&category=D&lang=J&year=2007 | |||||
関連名称 | http://search.ieice.org/bin/summary.php?id=j90-d_3_706&category=D&lang=J&year=2007 | |||||
最初の登録日 | ||||||
日付 | 2011-08-24 | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | journal article |