Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술
이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술
이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술
Ebook156 pages1 hour

이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술

Rating: 0 out of 5 stars

()

Read preview

About this ebook

이미지 압축이란 무엇입니까


디지털 사진에 적용할 때 이미지 압축은 저장 또는 저장에 필요한 비용을 줄이는 데 도움이 되는 데이터 압축의 한 형태입니다. 전염. 알고리즘은 다른 유형의 디지털 데이터에 사용되는 일반적인 데이터 압축 접근 방식과 비교할 때 더 높은 결과를 제공하기 위해 시각적 인식과 사진 데이터의 통계적 측면을 활용하는 것이 가능합니다.


귀하가 얻을 있는 이점


(I) 다음 주제에 대한 통찰력 및 검증:


1장: 이미지 압축


2장: 데이터 압축


3장: 공동 사진 전문가 그룹


4장: 손실 압축


5장: 무손실 압축


6장: 휴대용 네트워크 그래픽


7장: 변환 코딩


8장: 이산 코사인 변환


9장: 공동 사진 전문가 그룹 2000


10장: 압축 아티팩트


(II) 이미지 압축에 관한 대중의 주요 질문에 답합니다.


(III) 다양한 분야에서 이미지 압축을 사용하는 실제 사례.


누가 책은


전문가, 학부생, 대학원생, 열성팬, 취미생활자, 그리고 모든 종류의 이미지 압축에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들을 위한 책입니다.


 

Language한국어
Release dateApr 29, 2024
이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술

Read more from Fouad Sabry

Related to 이미지 압축

Titles in the series (100)

View More

Related ebooks

Reviews for 이미지 압축

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    이미지 압축 - Fouad Sabry

    1 장 : 이미지 압축

    디지털 사진은 데이터 압축의 한 형태인 이미지 압축을 사용하여 압축하여 크기를 줄여 저장 및 전송 비용을 낮출 수 있습니다. 다른 디지털 데이터에 사용되는 일반적인 데이터 압축 방법보다 더 나은 결과를 얻기 위해 알고리즘은 시각적 인식 및 이미지 데이터의 통계적 특징을 활용할 수 있습니다.

    손실 및 무손실 이미지 압축이 모두 가능합니다. 대부분의 의료 이미지, 기술 도면, 클립 아트 및 만화는 장기 저장을 위해 무손실 압축의 이점을 누릴 수 있습니다. 압축 아티팩트는 손실 압축 기술에 의해 발생하며, 특히 낮은 비트 전송률로 작업할 때 발생합니다. 비트 전송률을 크게 줄여야 하지만 작은(종종 감지할 수 없는) 품질 손실이 허용되는 경우 손실 접근 방식이 이상적입니다. 사진과 같은 자연스러운 그림이 그렇습니다. 시각적 무손실 압축은 눈에 띄지 않는 품질 손실을 초래하는 손실 압축의 한 형태를 사용합니다.

    손실이 있는 압축 기술:

    가장 많이 사용되는 기술은 변환 코딩입니다.

    가장 널리 사용되는 손실 압축 유형은 DCT(Discrete Cosine Transform)입니다. 1974년 Nasir Ahmed, T. Natarajan 및 K. R. Rao가 발명한 이 변환은 푸리에 변환을 포함하는 변환 제품군에 속합니다. 이산 코사인 변환 그룹의 맥락에서 DCT는 종종 DCT-II라고 합니다(이산 코사인 변환 참조). 대부분의 경우 가장 효과적인 이미지 압축 방법입니다.

    가장 널리 사용되는 손실 형식인 JPEG는 최신 HEIF와 마찬가지로 DCT를 사용합니다.

    양자화와 엔트로피 코딩이 그 다음이며, 그 다음에는 보다 현대적인 웨이블릿 변환이 있습니다.

    색상 양자화는 이미지의 색상 팔레트를 작은 대표 색조 세트로 줄이는 프로세스입니다. 압축된 이미지의 헤더에는 이미지를 만드는 데 사용된 색을 지정하는 색상표가 포함되어 있습니다. 색상 인덱스는 단순히 각 픽셀에서 참조됩니다. 포스터화를 방지하기 위해 이 기법을 디더링과 함께 사용할 수 있습니다.

    GIF 및 PNG 파일에 일반적으로 사용되는 최대 256색의 풀 컬러 팔레트입니다.

    BTC, CCC, S2TC 및 S3TC에서는 각 4x4 픽셀 블록에 2 또는 4 색상의 블록 팔레트가 사용됩니다.

    크로마 서브샘플링에 의한 색 공간 감소. 이미지의 색차 정보 중 일부를 평균화하거나 제거함으로써 인간의 눈이 색상보다 밝기의 공간적 변화를 더 예리하게 등록한다는 사실을 활용합니다.

    프랙탈 압축.

    다층 퍼셉트론(Multilayer perceptron), 합성곱 신경망(Convolutional neural networks), 생성적 적대 신경망(Generative adversarial networks)은 모두 기계 학습 영역에서 보다 현대적인 응용 분야에서 사용되었습니다.

    무손실 압축 기술:

    PCX는 기본적으로 실행 길이 인코딩을 사용하는 반면 BMP, TGA 및 TIFF는 모두 대체 인코딩 모드로 지원합니다.

    영역 이미지 압축

    DPCM은 예측 코딩을 사용합니다.

    수학적 인코딩과 Huffman 인코딩은 엔트로피 인코딩의 가장 널리 사용되는 두 가지 형태입니다.

    GIF 및 TIFF에 널리 사용되는 적응형 사전 방법인 LZW는 PNG, MNG 및 TIFF 파일에서 DEFLATE를 사용합니다.

    체인 코드

    확산 모델

    사진 압축의 주요 목적은 주어진 압축률(또는 비트 전송률)에서 가능한 최고의 품질을 얻는 것입니다.

    대부분의 경우 확장성을 줄인다는 것은 기본 비트스트림 또는 파일을 조작하여 품질을 희생하는 것을 의미합니다(압축 해제 및 재압축 없이). 점진적 인코딩 및 임베디드 비트스트림은 확장성의 다른 이름입니다. 무손실 코덱도 확장성이 있지만 모양이 다르고(종종 거친 픽셀에서 미세한 픽셀로 스캔) 다른 용도로 사용됩니다. 다운로드하는 동안 이미지를 미리 보거나(예: 웹 브라우저에서) 리소스(예: 데이터베이스)에 대한 다양한 품질의 액세스를 제공하는 것은 모두 확장성의 이점을 크게 제공합니다. 다음과 같은 다양한 종류의 확장성이 있습니다.

    품질 또는 복잡성의 점진적 증가: 비트스트림을 반복할 때마다 재구성된 이미지의 품질이 향상됩니다.

    더 높은 품질의 이미지를 인코딩하려면 먼저 저해상도 버전을 인코딩해야 합니다.

    이전에 인코딩된 흑백 버전에서 컬러를 점진적으로 인코딩합니다.

    관심 영역별 코딩. 이미지의 다른 영역은 서로 다른 품질 수준으로 인코딩됩니다. 여기에 확장 용량을 추가할 수 있습니다(이러한 부분을 먼저 인코딩하고 다른 부분은 나중에 인코딩)합니다.

    데이터에 대한 데이터. 압축된 데이터에 있을 수 있는 메타데이터를 사용하여 이미지를 탐색, 검색 및 분류할 수 있습니다. 색상 및 질감 데이터, 미리 보기 이미지, 작성자/저작권 정보는 모두 이러한 유형의 데이터 예입니다.

    계산 용량. 압축 방법에는 다양한 인코딩 및 디코딩 계산 요구가 있습니다. 일부 높은 압축 방법을 실행하려면 많은 CPU 리소스가 필요합니다.

    피크 신호 대 잡음비는 압축 기술의 효율성을 평가하는 데 사용되는 일반적인 메트릭입니다. 이미지의 손실 압축으로 인해 생성되는 노이즈의 양을 정량화하지만 시청자의 주관적인 평가는 때때로 필수적인 것으로 간주됩니다.

    현대 엔트로피 코딩의 선구자인 Shannon-Fano 코딩은 1940년대 후반에 개발되었습니다.

    1974년 1월, IEEE Trans. Computers는 Nasir Ahmed, T. Natarajan 및 K. R. Rao의 Discrete Cosine Transform을 90-93페이지에 게재했습니다.

    ↑ Maayan, Gilad David (2021년 11월 24일). 인공 지능 기반 이미지 압축의 최첨단. 데이터 과학을 향해. 2023년 4월 6일에 추출되었습니다.

    고품질 제너레이티브 이미지 압축. 2023년 4월 6일에 추출되었습니다.

    ^ Bühlmann, Matthias (2022-09-28).

    안정적인 확산 방법을 사용하여 이미지를 압축합니다.

    중간.

    2022년 11월 2일에 확인함.

    버트, P.; Adelson, E. (1983년 4월 1일). 라플라시안 피라미드는 압축된 이미지 코드입니다. 통신, IEEE, 31(4), pp.532-540. 도:10.1109/TCOM.1983.1095851; 시테시어X:10.1.1.54.299; S2CID:8018433입니다.

    ^ Shao, Dan; Kropatsch, 월터 G.

    (2010년 2월 3일-5일).

    Špaček, 리보르; Franc, Vojtěch (eds.).

    불규칙한 라플라시안 그래프의 피라미드(PDF).

    컴퓨터 비전 겨울 워크샵 2010.

    Nové Hrady, 체코 공화국 : 체코 패턴 인식 협회.

    최초 발행일: 2013년 5월 27일(PDF).

    덕분에: 클로드 엘우드 섀넌(Claude Elwood Shannon, 1948). 알카텔-루슨트 (ed.). 대인 상호 작용의 수학적 이론(PDF). 27 (3-4) Bell System Technical Journal, 379–423, 623–656페이지. 참고 문헌: hdl:11858/00-001M-0000-002C-4314-2; doi:10.1002/j.1538-7305.1948.tb01338.x입니다. 원본(PDF)은 2011년 5월 24일부터 액세스할 수 있습니다. 액세스 날짜: 2019년 4월 21일.

    데이비드 앨버트 허프만(David Albert Huffman)의 A method for the creation of minimum-redundancy codes의 원본(PDF)은 2005년 10월 8일에 Proceedings of the IRE, vol. 40, no. 9, pp. 1098-1101 (doi:10.1109/JRPROC.1952.273898)에서 보존되었다.

    참고 문헌: Hadamard transform image coding, William K. Pratt, Julius Kane, and Harry C. Andrews, Proceedings of the IEEE 57.1 (1969), pages 58-68.

    ↑ Nasir Ahmed (1991년 1월). 이산 코사인 변환: 그 탄생 비하인드 스토리. 이 기사를 인용하려면: Digital Signal Processing 1 (January): 4-5.

    T.81: 연속톤 정지 이미지의 디지털 압축 및 코딩에 대한 요구 사항 및 지침(PDF). 1992년 9월 CCITT에 게재됨. 2000년 8월 18일 원본 (PDF)에서 확인함. 2019 년 7 월 12 일에 이것을 얻으십시오!을 클릭합니다.

    BT.com 에 JPEG 이미지 형식에 대한 설명이 있습니다. 2018년 5월 31일, BT Group. 2019년 8월 5일 기준.

    ^ JPEG : 그것은 무엇입니까? 눈에 띄지 않는 데일리 아이템 . 2013년 9월 24일 The Atlantic에 게재됨. 2019년 9월 13일에 추출되었습니다.

    ↑ Chris Baraniuk (2015년 10월 15일). BBC 뉴스에 따르면 JPEG에 복사 제한이 올 수 있습니다. 2019 년 9 월 13 일 BBC에서 검색 함.

    The GIF Debate: A Programmer's Viewpoint," 1995년 1월 27일. 2015년 5월 26일부터 획득할 수 있습니다.

    저자 : L. Peter Deutsch (1996 년 5 월). 추상적인. DOI:10.17487/RFC1951. DEFLATE 압축 데이터 형식 사양 버전 1.3. IETF입니다. 페이지 1. 섹션 초록. 이것을 얻으십시오 : 2014-04-23.

    참조: Taubman, David; 마르셀린, 마이클 (2012). JPEG2000를 사용한 이미지 압축의 기본 사항: 권장 사항 및 기술 지침. ISBN: 9781461507994, Springer Science & Business Media 발행.

    ^ a b Unser, M; 블루, T.

    (2003).

    JPEG2000 웨이블릿 필터 수학적 특성(PDF)을 참조하십시오.

    이미지 처리에 대한 IEEE 트랜잭션.

    12 (9): 1080년–1090년.

    Bibcode : 2003ITIP ... 12.1080U입니다.

    doi:10.1109/TIP.2003.812329입니다.

    PMID 18237979.

    S2CID 2765169.

    2019년 10월 13일에 원본 문서 (PDF) 에서 보존된 문서  .

    Gary Sullivan(2003년 12월 8-12일). 시간적 서브밴드 비디오 코딩 및 설계 문제의 전반적인 특징. ITU-Video T의 코딩 전문가 그룹. 2019년 9월 13일에 추출되었습니다.

    앨런 C. 보빅 (2009). 비디오 처리: 필수 가이드, Academic Press, p. 355, ISBN 9780080922508.

    Le Gall, Didier 및 Ali J. Tabatabai (1988)에서 인용. 산술 코딩 및 대칭 짧은 커널 필터를 사용한 디지털 이미지의 하위 대역 코딩. 자세한 내용은 http://dx.doi.org/10.1109/ICASSP.1988.196696 를 참조하십시오. S2CID=109186495 ICASSP-88., 음향, 음성 및 신호 처리에 관한 국제 회의: 761-764 볼륨 2.

    인용 : Swartz, Charles S. (2005). 디지털 시네마를 이해하기 위한 전문가 가이드. 147 테일러 & 프랜시스. ISBN 9780240806174.

    {챕터 1 종료}

    제 2 장: 데이터 압축

    정보 이론, 데이터 압축, 소스 코딩 및 기타 관련 분야: 일반적으로 데이터 압축 프로세스에 참여하는 장치를 인코더라고 하는 반면, 프로세스의 역(즉, 압축 해제)에 참여하는 장치를 디코더라고 합니다.

    데이터 압축은 데이터 파일의 크기를 줄이는 프로세스이며 자주 사용되는 용어입니다. 소스 코딩은 데이터가 저장되거나 전송되기 전에 원래 데이터 소스에서 수행되는 인코딩 프로세스입니다. 이 프로세스를 데이터 전송의 맥락에서 참조합니다. 소스 코딩을 오류 감지 및 수정에 사용되는 채널 코딩 또는 데이터를 신호에 매핑하는 방법인 라인 코딩과 같은 다른 유형의 코딩과 혼동하지 않는 것이 중요합니다.

    데이터 압축은 정보를 저장하고 전송하는 데 필요한 공간과 대역폭의 양을 줄이기 때문에 유용합니다. 압축 및 압축 해제 절차에는 모두 상당한 양의 계산 리소스가 필요합니다. 시공간 복잡성 트레이드 오프는 데이터를 압축하는 동안 고려해야 할 사항입니다. 예를 들어, 비디오 압축 방법은 비디오가 압축 해제되는 동안 볼 수 있을 만큼 빠르게 압축을 풀기 위해 고가의 하드웨어가 필요할 수 있습니다. 또한 비디오를 시청하기 전에 완전히 압축을 푸는 옵션은 불편하거나 추가 저장 공간이 필요할 수 있습니다. 데이터 압축 체계를 설계할 때 설계자는 여러 가지 요인 간에 균형을 맞춰야 합니다. 이러한 요소에는 달성된 압축 수준, 발생하는 왜곡의 양(손실 데이터 압축을 사용할 때) 및 데이터를 압축 및 압축 해제하는 데 필요한

    Enjoying the preview?
    Page 1 of 1