광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용
By Fouad Sabry
()
About this ebook
광학 문자 인식이란 무엇입니까
광학 문자 인식 또는 광학 문자 판독기(OCR)는 입력, 손으로 쓰거나 인쇄된 텍스트의 이미지를 전자 또는 기계로 변환하는 것입니다. 스캔한 문서, 문서 사진, 장면 사진 또는 이미지에 겹쳐진 자막 텍스트 등 인코딩된 텍스트.
혜택
(I) 다음 주제에 대한 통찰 및 검증:
1장: 광학 문자 인식
2장: 서체
3장: 필기 인식
4장: 이미지 스캐너
5장: 광학 표시 인식
6장: 지능형 문자 인식
7장: 테서렉트(소프트웨어)
8장: 오크로푸스
9장: 설형 문자(소프트웨어)
10장: 광학 문자 인식 소프트웨어 비교
(II) 광학 문자 인식에 관한 대중의 주요 질문에 답합니다.
(III) 다양한 분야에서 광학 문자 인식을 사용하는 실제 사례.
이 책의 저자
전문가, 학부 및 대학원생, 매니아, 취미생활자, 모든 종류의 광학 문자 인식에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들을 위한 것입니다.
Related to 광학 문자 인식
Titles in the series (100)
히스토그램 균등화: 향상된 시각적 인식을 위한 이미지 대비 향상 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings소음 감소: 선명도 향상, 컴퓨터 비전의 노이즈 감소를 위한 고급 기술 Rating: 0 out of 5 stars0 ratings라돈 변환: 시각적 데이터에 숨겨진 패턴 밝히기 Rating: 0 out of 5 stars0 ratings톤 매핑: 톤 매핑: 컴퓨터 비전의 관점 밝히기 Rating: 0 out of 5 stars0 ratings이방성 확산: 이방성 확산을 통한 이미지 분석 향상 Rating: 0 out of 5 stars0 ratings레티넥스: 레티넥스 를 통해 컴퓨팅 비전의 비밀을 밝히다 Rating: 0 out of 5 stars0 ratings허프 변환: 컴퓨터 비전에서 Hough 변환의 마법 공개 Rating: 0 out of 5 stars0 ratings색상 외관 모델: 컴퓨터 비전의 인식 및 표현 이해 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings감마 보정: 컴퓨터 비전의 시각적 선명도 향상: 감마 보정 기술 Rating: 0 out of 5 stars0 ratings색 공간: 컴퓨터 비전의 스펙트럼 탐색 Rating: 0 out of 5 stars0 ratings호모그래피: 호모그래피: 컴퓨터 비전의 변화 Rating: 0 out of 5 stars0 ratings컴퓨터 스테레오 비전: 컴퓨터 비전의 깊이 인식 탐구 Rating: 0 out of 5 stars0 ratings입자 필터: 컴퓨터 비전의 입자 필터 탐색 Rating: 0 out of 5 stars0 ratings공동 사진 전문가 그룹: JPEG 표준으로 시각적 데이터의 힘 활용 Rating: 0 out of 5 stars0 ratings인간 시각 시스템 모델: 인식 및 처리 이해 Rating: 0 out of 5 stars0 ratings인페인팅: 컴퓨터 비전의 격차 해소 Rating: 0 out of 5 stars0 ratings이미지 히스토그램: 시각적 통찰력 공개, 컴퓨터 비전의 이미지 히스토그램 깊이 탐색 Rating: 0 out of 5 stars0 ratings지향성 그라디언트 히스토그램: 시각적 영역 공개: 컴퓨터 비전에서 지향성 그라데이션 히스토그램 탐색 Rating: 0 out of 5 stars0 ratings얼룩 감지: 시각적 데이터의 패턴 공개 Rating: 0 out of 5 stars0 ratings색상 매핑: 컴퓨터 비전의 시각적 인식 및 분석 탐구 Rating: 0 out of 5 stars0 ratings컬러 매칭 기능: 컴퓨터 비전의 스펙트럼 감도 이해 Rating: 0 out of 5 stars0 ratings번들 조정: 정확한 재구성을 위한 시각적 데이터 최적화 Rating: 0 out of 5 stars0 ratings색상 관리 시스템: 디지털 환경에서 시각적 인식 최적화 Rating: 0 out of 5 stars0 ratings가장자리 감지: 컴퓨터 비전의 경계 탐색 Rating: 0 out of 5 stars0 ratings활성 윤곽: 능동 윤곽 기술을 통한 컴퓨터 비전의 발전 Rating: 0 out of 5 stars0 ratings이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술 Rating: 0 out of 5 stars0 ratings컬러 모델: 컴퓨터 비전의 스펙트럼 이해: 색상 모델 탐색 Rating: 0 out of 5 stars0 ratings아핀 변환: 시각적 관점 잠금 해제: 컴퓨터 비전의 아핀 변환 탐색 Rating: 0 out of 5 stars0 ratings
Related ebooks
지능형 문자 인식: 컴퓨터 비전의 기계 인식 향상 Rating: 0 out of 5 stars0 ratings시각적 단어: 이미지 이해의 힘 활용 Rating: 0 out of 5 stars0 ratings자동 타겟 인식: 표적 인식을 위한 컴퓨터 비전 기술의 발전 Rating: 0 out of 5 stars0 ratings광학 점자 인식: 시각적 지능을 통한 접근성 강화 Rating: 0 out of 5 stars0 ratings벡터 그래픽 편집기: 고급 알고리즘으로 시각적 창작 능력 강화 Rating: 0 out of 5 stars0 ratings스마트 카메라: 컴퓨터 비전을 통한 시각적 인식의 혁명 Rating: 0 out of 5 stars0 ratings디지털 래스터 그래픽: 컴퓨터 비전에서 디지털 래스터 그래픽의 강력한 성능 공개 Rating: 0 out of 5 stars0 ratings머신비전: 컴퓨터 비전의 세계에 대한 통찰력 Rating: 0 out of 5 stars0 ratings인간 시각 시스템 모델: 인식 및 처리 이해 Rating: 0 out of 5 stars0 ratings이미지 수집 탐색: 컴퓨터 비전의 시각적 풍경 공개 Rating: 0 out of 5 stars0 ratings객체 감지: 발전, 응용, 알고리즘 Rating: 0 out of 5 stars0 ratings소프트웨어 제품군: 최고의 소프트웨어 제품군으로 컴퓨터 비전을 혁신하다 Rating: 0 out of 5 stars0 ratings볼륨 렌더링: 컴퓨터 비전의 시각적 현실감 탐구 Rating: 0 out of 5 stars0 ratings벡터 그래픽: 컴퓨터 비전의 벡터 그래픽 마스터하기 Rating: 0 out of 5 stars0 ratings컴퓨터 그래픽: 컴퓨터 그래픽과 컴퓨터 비전의 교차점 탐색 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings데이터 압축: 데이터 압축을 통해 컴퓨터 비전의 효율성 극대화 Rating: 0 out of 5 stars0 ratings시각 센서 네트워크: 컴퓨터 비전에서 시각 센서 네트워크의 힘 탐구 Rating: 0 out of 5 stars0 ratings콘텐츠 기반 이미지 검색: 시각적 데이터베이스 잠금 해제 Rating: 0 out of 5 stars0 ratings디지털 우편실: 컴퓨터 비전을 통해 효율성 극대화 Rating: 0 out of 5 stars0 ratings역방향 이미지 검색: 시각적 인식의 비밀을 풀다 Rating: 0 out of 5 stars0 ratings색상 프로필: 컴퓨터 비전의 시각적 인식 및 분석 탐구 Rating: 0 out of 5 stars0 ratings래스터 그래픽 편집기: 시각적 현실의 변화: 컴퓨터 비전에서 래스터 그래픽 편집기 마스터하기 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings홍채인식: 컴퓨터 비전의 홍채 인식에 대한 관점 조명 Rating: 0 out of 5 stars0 ratings색상 관리 시스템: 디지털 환경에서 시각적 인식 최적화 Rating: 0 out of 5 stars0 ratings관절 신체 자세 추정: 컴퓨터 비전에서 인간의 움직임 잠금 해제 Rating: 0 out of 5 stars0 ratings모바일 매핑: 컴퓨터 비전으로 공간 지능 잠금 해제 Rating: 0 out of 5 stars0 ratings제스처 인식: 모션 언어의 잠금 해제 Rating: 0 out of 5 stars0 ratings이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술 Rating: 0 out of 5 stars0 ratings
Reviews for 광학 문자 인식
0 ratings0 reviews
Book preview
광학 문자 인식 - Fouad Sabry
제 1 장: 광학 문자 인식
스캔한 문서, 문서 사진, 장면 사진(예: 가로 사진의 간판 및 광고판의 텍스트) 또는 이미지에 겹쳐진 자막 텍스트에서 광학 문자 인식(OCR)은 입력, 필기 또는 인쇄된 텍스트의 이미지를 기계로 인코딩된 텍스트(예: 텔레비전 방송)로 전자적 또는 기계적으로 변환하는 것입니다.
전자 편집, 검색, 컴팩트 스토리지, 온라인 디스플레이 및 인지 컴퓨팅, 기계 번역, (추출된) 텍스트 음성 변환 및 여권 문서, 송장, 은행 거래 내역서, 컴퓨터 영수증, 명함, 우편물, 정적 데이터 인쇄물 및 기타 적절한 문서와 같은 기타 적절한 문서와 같은 기계 프로세스에서 사용하기 위해 인쇄된 텍스트를 디지털화하는 일반적인 방법입니다. 패턴 인식, AI 및 컴퓨터 비전은 모두 OCR에 기여합니다.
이전 버전은 단일 서체만 지원했으며 각 문자의 사진으로 교육해야 했습니다. 최신 시스템은 종종 많은 디지털 그림 파일 형식을 처리하며 대부분의 서체에 대해 높은 수준의 식별 정확도를 제공할 수 있습니다. 일부 구현에서는 그래픽, 열 및 기타 비텍스트 요소와 같은 모든 서식 세부 정보가 보존된 페이지의 복사본을 생성할 수 있습니다.
전신과 시각 장애인을 위한 독서 보조 장치의 개발은 현대 광학 문자 인식의 두 가지 가능한 선행 사례입니다.
광학 코드 인식 시스템을 사용하여 마이크로필름 아카이브를 검사하기 위해 Emanuel Goldberg는 1920년대와 1930년대에 통계 기계
라고 명명한 것을 만들었습니다. 1931 년에 그는 자신의 작품에 대해 미국 특허 1,838,389를 받았습니다. IBM은 현재 특허를 소유하고 있습니다.
Ray Kurzweil은 거의 모든 서체로 작성된 텍스트를 읽을 수 있는 옴니 폰트 OCR을 개발한 후 1974년에 Kurzweil Computer Products, Inc.를 설립했습니다. (커즈와일은 종종 옴니폰트 OCR을 발명한 것으로 알려져 있지만, 1960년대 후반과 1970년대에 CompuScan을 비롯한 여러 회사에서 사용되었다.) 커즈와일은 이 기술을 최적으로 사용할 수 있는 방법은 시각 장애인을 위한 낭독 기계를 개발하여 시각 장애인이 사용자가 입력하는 모든 텍스트를 컴퓨터가 소리 내어 읽도록 하는 것이라고 생각했습니다. 이 장치가 현실이 되려면 CCD 평판 스캐너와 텍스트 음성 변환 신디사이저라는 두 가지 핵심 기술을 개발해야 했습니다. 최종 제품은 1976년 1월 13일 커즈와일과 전국 시각 장애인 연맹(National Federation of the Blind)이 의장을 맡은 기자 회견에서 소개되었습니다. 광학 문자 인식 소프트웨어의 첫 번째 상용 버전은 1978년 Kurzweil Computer Products에서 출시되었습니다. 첫 번째 채택자 중 하나인 LexisNexis는 신생 온라인 데이터베이스에 뉴스 기사와 법률 브리핑을 포함하기 위해 소프트웨어를 구입했습니다. 커즈와일은 2년 후 자신의 회사를 제록스에 매각했는데, 제록스가 종이에서 컴퓨터로 텍스트를 상용화하고자 했기 때문이었다. Xerox에 의해 분사된 Scansoft는 나중에 Nuance Communications와 합병되었습니다.
2000년대에 OCR은 클라우드, 모바일 장치, WebOCR과 같은 서비스를 통해 스마트폰을 사용하여 외국어 표지판을 실시간으로 번역할 수 있게 되었습니다. 스마트폰 및 스마트워치와 같이 인터넷에 연결된 모바일 장치가 증가함에 따라 장치의 카메라로 촬영한 이미지에서 텍스트를 가져오는 앱에서 OCR이 사용되고 있습니다. 장치에 OS에 통합된 OCR 기능이 없는 경우 OCR API를 사용하여 그림 파일을 읽고 텍스트를 추출합니다. OCR API는 추출된 텍스트를 원본 그림에서 텍스트가 인식된 위치에 대한 정보와 함께 장치의 프로그램으로 다시 전송하여 앱이 텍스트로 작업을 수행할 수 있도록 합니다(예: 음성으로 변환하거나 표시).
라틴어, 키릴 자모, 아랍어, 히브리어, 인도어, 벵골어(벵골어), 데바나가리어, 타밀어, 중국어, 일본어 및 한국어 문자는 모두 다양한 상용 및 오픈 소스 OCR 시스템에서 지원됩니다.
영수증 OCR, 송장 OCR, 수표 OCR 및 법적 청구 문서 OCR은 OCR 엔진 위에 구축된 수많은 유형의 도메인별 OCR 응용 프로그램 중 일부일 뿐입니다.
다음에서 사용할 수 있습니다.
수표, 여권, 송장, 은행 거래 내역서 및 영수증과 같은 기업 기록의 정보 입력
번호판 판독 소프트웨어
공항에서 여권 스캔 및 데이터 추출용
보험 서류에서 자동으로 주요 데이터 추출
교통 표지판을 읽을 수 있는 기능
명함에서 연락처 정보 추가
Project Gutenberg를 위해 책을 스캔하는 것과 같이 인쇄물을 텍스트로 변환하는 프로세스를 가속화합니다.
인쇄된 책과 Google 도서와 같은 잡지의 디지털 사본을 검색할 수 있도록 합니다.
실시간 필기 인식을 사용하여 컴퓨터 조작(펜 컴퓨팅)
CAPTCHA 봇 방지 시스템을 우회하는 것은 OCR을 중지하기 위한 것일지라도 마찬가지입니다. CAPTCHA 안티봇 시스템 강도 테스트는 또 다른 가능한 목표입니다.
시각 장애인을 돕기 위해 설계된 장비
차량 지침은 끊임없이 진화하는 차량 설계와 관련된 데이터베이스에서 CAD 그림을 찾아 작성됩니다.
스캔한 문서를 검색 가능한 PDF로 변환하는 과정
타이핑된 텍스트는 광학 문자 인식(OCR)이 중점을 두는 것입니다. 각 개별 글리프 또는 문자를 분석하여 이를 수행합니다.
인쇄된 텍스트의 단어 단위 스캔은 광학 단어 인식의 초점입니다(공백을 단어 구분선으로 사용하는 언어의 경우). (일반적으로 OCR
로 약칭)
손으로 쓴 인쇄 스크립트 또는 필기체는 각 개별 글리프 또는 문자에 초점을 맞춘 지능형 문자 인식(ICR)의 또 다른 대상입니다.
인쇄 스크립트 또는 필기체의 필기를 단어별로 분석하는 것은 지능형 단어 인식(IWR)의 또 다른 목표입니다. 이는 글리프를 구분하지 않고 필기체를 사용하는 언어에 특히 유용합니다.
광학 문자 인식은 보존된 문서를 평가하는 오프라인
절차인 경우가 많습니다. 온라인 OCR API는 특정 클라우드 기반 서비스에서 제공됩니다. 필기 인식 시스템에 필기 손의 움직임에 대한 데이터를 제공할 수 있습니다. 이 방법은 부분이 그려지는 순서, 취한 방향, 펜을 놓고 집는 리듬과 같은 동작을 기록할 수 있기 때문에 글리프와 단어의 형태에만