메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터

주제분류

정기구독(개인)

소속 기관이 없으신 경우, 개인 정기구독을 하시면 저렴하게
논문을 무제한 열람 이용할 수 있어요.

회원혜택

로그인 회원이 가져갈 수 있는 혜택들을 확인하고 이용하세요.

아카루트

학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.

영문교정

영문 논문 작성에 도움을 드리기 위해, 영문 교정 서비스를
지원하고 있어요.

고객센터 제휴문의

...

저널정보

저자정보

표지
이용수
내서재
3
내서재에 추가
되었습니다.
내서재에서
삭제되었습니다.

내서재에 추가
되었습니다.
내서재에서
삭제되었습니다.

초록·키워드

오류제보하기
최근 공공기관, 금융기관, 기업 등에 문서 제출 시, 스캔하거나 사진을 찍어 만든 PDF나 이미지 파일을 사용하는 경우가 많다. 이러한 문서를 수집, 저장, 관리하는 기관과 기업은, 개인정보 유출 방지를 위하여, 문서상의 개인정보 부분을 검출하여 블러링(blurring)하거나, 개인정보들은 추출하여 별도로 관리하고 문서는 암호화하여 저장하는 등의 조치를 취한다. 하지만, 문서 이미지의 양이 많고 종류가 다양하며 이미지의 품질이 낮은 경우가 많아, 문서의 종류를 분류하고 개인정보를 추출하는데 많은 노력이 필요하다. 본 논문에서는, 이미지 내 문서의 종류를 자동으로 분류하는 방법을 소개한다. 문서가 포함되어 있는 전체 이미지에서, 이미지의 인식 범위를 추출하는 이미지 샘플링 단계와 이미지의 인식 범위를 조절하는 제목 좌표 추론 단계의 반복적 피드백 학습을 통해 인식문서의 제목이 있는 영역의 위치를 찾아감으로써 사전에 학습하지 않은 다양한 배경의 문서 이미지도 분류할 수 있도록 하였다. 실험을 통하여 제안하는 기법의 제목 검출 성능을 확인하고, 기존의 이미지 분류를 위한 딥러닝 기법들과의 비교를 통하여 문서 분류 정확도를 평가한다.

Recently, many public organizations, financial institutions, and companies often collect documents in PDF/image formats instead of text files. Those institutions and companies that manage document files try to prevent personal information leakage by detecting personal information from the document images and 1) blurring the personal information area or 2) extracting the each personal information and separately managing them. However, it requires a lot of time and effort to classify types of documents and extract personal information because the volume of document images are too big, document types are various, and the qualities of some images taken by cameras are not good enough to apply image processing/recognition techniques. In this paper, we introduce how to automatically classify the type of the document in a document image. Our proposed deep learning based technique performs iterative feedback training between image sampling and title coordinates inference, which extracts and adjusts image recognition range, in document images so that the title positions can be found even in document images with background images that have not been learned. The experiment verifies the title detection performance of the proposed method, and evaluates the document type classification accuracy by comparing it with the existing deep learning methods for image classification.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 본론
Ⅳ. 실험
Ⅴ. 결론
REFERENCES

참고문헌 (36)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0