Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용
광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용
광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용
Ebook91 pages51 minutes

광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용

Rating: 0 out of 5 stars

()

Read preview

About this ebook

광학 문자 인식이란 무엇입니까


광학 문자 인식 또는 광학 문자 판독기(OCR)는 입력, 손으로 쓰거나 인쇄된 텍스트의 이미지를 전자 또는 기계로 변환하는 것입니다. 스캔한 문서, 문서 사진, 장면 사진 또는 이미지에 겹쳐진 자막 텍스트 등 인코딩된 텍스트.


혜택


(I) 다음 주제에 대한 통찰 및 검증:


1장: 광학 문자 인식


2장: 서체


3장: 필기 인식


4장: 이미지 스캐너


5장: 광학 표시 인식


6장: 지능형 문자 인식


7장: 테서렉트(소프트웨어)


8장: 오크로푸스


9장: 설형 문자(소프트웨어)


10장: 광학 문자 인식 소프트웨어 비교


(II) 광학 문자 인식에 관한 대중의 주요 질문에 답합니다.


(III) 다양한 분야에서 광학 문자 인식을 사용하는 실제 사례.


책의 저자


전문가, 학부 및 대학원생, 매니아, 취미생활자, 모든 종류의 광학 문자 인식에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들을 위한 것입니다.

Language한국어
Release dateMay 4, 2024
광학 문자 인식: 광학 문자 인식을 위한 컴퓨터 비전의 힘 활용

Related to 광학 문자 인식

Titles in the series (100)

View More

Related ebooks

Reviews for 광학 문자 인식

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    광학 문자 인식 - Fouad Sabry

    제 1 장: 광학 문자 인식

    스캔한 문서, 문서 사진, 장면 사진(예: 가로 사진의 간판 및 광고판의 텍스트) 또는 이미지에 겹쳐진 자막 텍스트에서 광학 문자 인식(OCR)은 입력, 필기 또는 인쇄된 텍스트의 이미지를 기계로 인코딩된 텍스트(예: 텔레비전 방송)로 전자적 또는 기계적으로 변환하는 것입니다.

    전자 편집, 검색, 컴팩트 스토리지, 온라인 디스플레이 및 인지 컴퓨팅, 기계 번역, (추출된) 텍스트 음성 변환 및 여권 문서, 송장, 은행 거래 내역서, 컴퓨터 영수증, 명함, 우편물, 정적 데이터 인쇄물 및 기타 적절한 문서와 같은 기타 적절한 문서와 같은 기계 프로세스에서 사용하기 위해 인쇄된 텍스트를 디지털화하는 일반적인 방법입니다. 패턴 인식, AI 및 컴퓨터 비전은 모두 OCR에 기여합니다.

    이전 버전은 단일 서체만 지원했으며 각 문자의 사진으로 교육해야 했습니다. 최신 시스템은 종종 많은 디지털 그림 파일 형식을 처리하며 대부분의 서체에 대해 높은 수준의 식별 정확도를 제공할 수 있습니다. 일부 구현에서는 그래픽, 열 및 기타 비텍스트 요소와 같은 모든 서식 세부 정보가 보존된 페이지의 복사본을 생성할 수 있습니다.

    전신과 시각 장애인을 위한 독서 보조 장치의 개발은 현대 광학 문자 인식의 두 가지 가능한 선행 사례입니다.

    광학 코드 인식 시스템을 사용하여 마이크로필름 아카이브를 검사하기 위해 Emanuel Goldberg는 1920년대와 1930년대에 통계 기계라고 명명한 것을 만들었습니다. 1931 년에 그는 자신의 작품에 대해 미국 특허 1,838,389를 받았습니다. IBM은 현재 특허를 소유하고 있습니다.

    Ray Kurzweil은 거의 모든 서체로 작성된 텍스트를 읽을 수 있는 옴니 폰트 OCR을 개발한 후 1974년에 Kurzweil Computer Products, Inc.를 설립했습니다. (커즈와일은 종종 옴니폰트 OCR을 발명한 것으로 알려져 있지만, 1960년대 후반과 1970년대에 CompuScan을 비롯한 여러 회사에서 사용되었다.) 커즈와일은 이 기술을 최적으로 사용할 수 있는 방법은 시각 장애인을 위한 낭독 기계를 개발하여 시각 장애인이 사용자가 입력하는 모든 텍스트를 컴퓨터가 소리 내어 읽도록 하는 것이라고 생각했습니다. 이 장치가 현실이 되려면 CCD 평판 스캐너와 텍스트 음성 변환 신디사이저라는 두 가지 핵심 기술을 개발해야 했습니다. 최종 제품은 1976년 1월 13일 커즈와일과 전국 시각 장애인 연맹(National Federation of the Blind)이 의장을 맡은 기자 회견에서 소개되었습니다. 광학 문자 인식 소프트웨어의 첫 번째 상용 버전은 1978년 Kurzweil Computer Products에서 출시되었습니다. 첫 번째 채택자 중 하나인 LexisNexis는 신생 온라인 데이터베이스에 뉴스 기사와 법률 브리핑을 포함하기 위해 소프트웨어를 구입했습니다. 커즈와일은 2년 후 자신의 회사를 제록스에 매각했는데, 제록스가 종이에서 컴퓨터로 텍스트를 상용화하고자 했기 때문이었다. Xerox에 의해 분사된 Scansoft는 나중에 Nuance Communications와 합병되었습니다.

    2000년대에 OCR은 클라우드, 모바일 장치, WebOCR과 같은 서비스를 통해 스마트폰을 사용하여 외국어 표지판을 실시간으로 번역할 수 있게 되었습니다. 스마트폰 및 스마트워치와 같이 인터넷에 연결된 모바일 장치가 증가함에 따라 장치의 카메라로 촬영한 이미지에서 텍스트를 가져오는 앱에서 OCR이 사용되고 있습니다. 장치에 OS에 통합된 OCR 기능이 없는 경우 OCR API를 사용하여 그림 파일을 읽고 텍스트를 추출합니다. OCR API는 추출된 텍스트를 원본 그림에서 텍스트가 인식된 위치에 대한 정보와 함께 장치의 프로그램으로 다시 전송하여 앱이 텍스트로 작업을 수행할 수 있도록 합니다(예: 음성으로 변환하거나 표시).

    라틴어, 키릴 자모, 아랍어, 히브리어, 인도어, 벵골어(벵골어), 데바나가리어, 타밀어, 중국어, 일본어 및 한국어 문자는 모두 다양한 상용 및 오픈 소스 OCR 시스템에서 지원됩니다.

    영수증 OCR, 송장 OCR, 수표 OCR 및 법적 청구 문서 OCR은 OCR 엔진 위에 구축된 수많은 유형의 도메인별 OCR 응용 프로그램 중 일부일 뿐입니다.

    다음에서 사용할 수 있습니다.

    수표, 여권, 송장, 은행 거래 내역서 및 영수증과 같은 기업 기록의 정보 입력

    번호판 판독 소프트웨어

    공항에서 여권 스캔 및 데이터 추출용

    보험 서류에서 자동으로 주요 데이터 추출

    교통 표지판을 읽을 수 있는 기능

    명함에서 연락처 정보 추가

    Project Gutenberg를 위해 책을 스캔하는 것과 같이 인쇄물을 텍스트로 변환하는 프로세스를 가속화합니다.

    인쇄된 책과 Google 도서와 같은 잡지의 디지털 사본을 검색할 수 있도록 합니다.

    실시간 필기 인식을 사용하여 컴퓨터 조작(펜 컴퓨팅)

    CAPTCHA 봇 방지 시스템을 우회하는 것은 OCR을 중지하기 위한 것일지라도 마찬가지입니다. CAPTCHA 안티봇 시스템 강도 테스트는 또 다른 가능한 목표입니다.

    시각 장애인을 돕기 위해 설계된 장비

    차량 지침은 끊임없이 진화하는 차량 설계와 관련된 데이터베이스에서 CAD 그림을 찾아 작성됩니다.

    스캔한 문서를 검색 가능한 PDF로 변환하는 과정

    타이핑된 텍스트는 광학 문자 인식(OCR)이 중점을 두는 것입니다. 각 개별 글리프 또는 문자를 분석하여 이를 수행합니다.

    인쇄된 텍스트의 단어 단위 스캔은 광학 단어 인식의 초점입니다(공백을 단어 구분선으로 사용하는 언어의 경우). (일반적으로 OCR로 약칭)

    손으로 쓴 인쇄 스크립트 또는 필기체는 각 개별 글리프 또는 문자에 초점을 맞춘 지능형 문자 인식(ICR)의 또 다른 대상입니다.

    인쇄 스크립트 또는 필기체의 필기를 단어별로 분석하는 것은 지능형 단어 인식(IWR)의 또 다른 목표입니다. 이는 글리프를 구분하지 않고 필기체를 사용하는 언어에 특히 유용합니다.

    광학 문자 인식은 보존된 문서를 평가하는 오프라인 절차인 경우가 많습니다. 온라인 OCR API는 특정 클라우드 기반 서비스에서 제공됩니다. 필기 인식 시스템에 필기 손의 움직임에 대한 데이터를 제공할 수 있습니다. 이 방법은 부분이 그려지는 순서, 취한 방향, 펜을 놓고 집는 리듬과 같은 동작을 기록할 수 있기 때문에 글리프와 단어의 형태에만

    Enjoying the preview?
    Page 1 of 1