이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술
By Fouad Sabry
()
About this ebook
이미지 압축이란 무엇입니까
디지털 사진에 적용할 때 이미지 압축은 저장 또는 저장에 필요한 비용을 줄이는 데 도움이 되는 데이터 압축의 한 형태입니다. 전염. 알고리즘은 다른 유형의 디지털 데이터에 사용되는 일반적인 데이터 압축 접근 방식과 비교할 때 더 높은 결과를 제공하기 위해 시각적 인식과 사진 데이터의 통계적 측면을 활용하는 것이 가능합니다.
귀하가 얻을 수 있는 이점
(I) 다음 주제에 대한 통찰력 및 검증:
1장: 이미지 압축
2장: 데이터 압축
3장: 공동 사진 전문가 그룹
4장: 손실 압축
5장: 무손실 압축
6장: 휴대용 네트워크 그래픽
7장: 변환 코딩
8장: 이산 코사인 변환
9장: 공동 사진 전문가 그룹 2000
10장: 압축 아티팩트
(II) 이미지 압축에 관한 대중의 주요 질문에 답합니다.
(III) 다양한 분야에서 이미지 압축을 사용하는 실제 사례.
누가 이 책은
전문가, 학부생, 대학원생, 열성팬, 취미생활자, 그리고 모든 종류의 이미지 압축에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들을 위한 책입니다.
Read more from Fouad Sabry
자율 사물의 새로운 기술 [Korean]
Related to 이미지 압축
Titles in the series (100)
이미지 히스토그램: 시각적 통찰력 공개, 컴퓨터 비전의 이미지 히스토그램 깊이 탐색 Rating: 0 out of 5 stars0 ratings소음 감소: 선명도 향상, 컴퓨터 비전의 노이즈 감소를 위한 고급 기술 Rating: 0 out of 5 stars0 ratings감마 보정: 컴퓨터 비전의 시각적 선명도 향상: 감마 보정 기술 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings인간 시각 시스템 모델: 인식 및 처리 이해 Rating: 0 out of 5 stars0 ratings색 공간: 컴퓨터 비전의 스펙트럼 탐색 Rating: 0 out of 5 stars0 ratings레티넥스: 레티넥스 를 통해 컴퓨팅 비전의 비밀을 밝히다 Rating: 0 out of 5 stars0 ratings호모그래피: 호모그래피: 컴퓨터 비전의 변화 Rating: 0 out of 5 stars0 ratings인페인팅: 컴퓨터 비전의 격차 해소 Rating: 0 out of 5 stars0 ratings이방성 확산: 이방성 확산을 통한 이미지 분석 향상 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings활성 윤곽: 능동 윤곽 기술을 통한 컴퓨터 비전의 발전 Rating: 0 out of 5 stars0 ratings톤 매핑: 톤 매핑: 컴퓨터 비전의 관점 밝히기 Rating: 0 out of 5 stars0 ratings윤곽선 감지: 컴퓨터 비전의 시각적 인식 기술 공개 Rating: 0 out of 5 stars0 ratings시각적 인식: 컴퓨터 시각적 처리에 대한 통찰력 Rating: 0 out of 5 stars0 ratings적응형 필터: 적응 필터링을 통해 컴퓨터 비전 향상 Rating: 0 out of 5 stars0 ratings공동 사진 전문가 그룹: JPEG 표준으로 시각적 데이터의 힘 활용 Rating: 0 out of 5 stars0 ratings히스토그램 균등화: 향상된 시각적 인식을 위한 이미지 대비 향상 Rating: 0 out of 5 stars0 ratings라돈 변환: 시각적 데이터에 숨겨진 패턴 밝히기 Rating: 0 out of 5 stars0 ratings아핀 변환: 시각적 관점 잠금 해제: 컴퓨터 비전의 아핀 변환 탐색 Rating: 0 out of 5 stars0 ratings캐니 엣지 감지기: 시각적 인식의 예술 공개 Rating: 0 out of 5 stars0 ratings컴퓨터 스테레오 비전: 컴퓨터 비전의 깊이 인식 탐구 Rating: 0 out of 5 stars0 ratings필터 뱅크: 컴퓨터 비전의 필터 뱅크 기술에 대한 통찰력 Rating: 0 out of 5 stars0 ratings색상 외관 모델: 컴퓨터 비전의 인식 및 표현 이해 Rating: 0 out of 5 stars0 ratings허프 변환: 컴퓨터 비전에서 Hough 변환의 마법 공개 Rating: 0 out of 5 stars0 ratings컬러 매칭 기능: 컴퓨터 비전의 스펙트럼 감도 이해 Rating: 0 out of 5 stars0 ratings하다마드 변환: 컴퓨터 비전에서 아다마르 변환의 힘 공개 Rating: 0 out of 5 stars0 ratings컬러 모델: 컴퓨터 비전의 스펙트럼 이해: 색상 모델 탐색 Rating: 0 out of 5 stars0 ratings무작위 표본 합의: 컴퓨터 비전의 강력한 추정 Rating: 0 out of 5 stars0 ratings기하학적 해싱: 이미지 인식 및 매칭을 위한 효율적인 알고리즘 Rating: 0 out of 5 stars0 ratings
Related ebooks
시청각 음성 인식: 발전, 애플리케이션 및 통찰력 Rating: 0 out of 5 stars0 ratings인간 시각 시스템 모델: 인식 및 처리 이해 Rating: 0 out of 5 stars0 ratings데이터 압축: 데이터 압축을 통해 컴퓨터 비전의 효율성 극대화 Rating: 0 out of 5 stars0 ratings볼륨 렌더링: 컴퓨터 비전의 시각적 현실감 탐구 Rating: 0 out of 5 stars0 ratings디지털 래스터 그래픽: 컴퓨터 비전에서 디지털 래스터 그래픽의 강력한 성능 공개 Rating: 0 out of 5 stars0 ratings자동 타겟 인식: 표적 인식을 위한 컴퓨터 비전 기술의 발전 Rating: 0 out of 5 stars0 ratings컬러 밴딩: 컴퓨터 비전의 깊이 탐구: 컬러 밴딩의 미스터리 풀기 Rating: 0 out of 5 stars0 ratings인페인팅: 컴퓨터 비전의 격차 해소 Rating: 0 out of 5 stars0 ratings스마트 카메라: 컴퓨터 비전을 통한 시각적 인식의 혁명 Rating: 0 out of 5 stars0 ratings은선 제거: 보이지 않는 것의 공개: 컴퓨터 비전의 비밀 Rating: 0 out of 5 stars0 ratings래스터 그래픽: 컴퓨터 비전의 래스터 그래픽의 기초 이해 Rating: 0 out of 5 stars0 ratings벡터 그래픽 편집기: 고급 알고리즘으로 시각적 창작 능력 강화 Rating: 0 out of 5 stars0 ratings아펠리온 소프트웨어: 비전 잠금 해제: 아펠리온 소프트웨어의 깊이 탐구 Rating: 0 out of 5 stars0 ratings알파 합성: 컴퓨터 비전의 이미지 구성 기술 익히기 Rating: 0 out of 5 stars0 ratings컴퓨터 그래픽: 컴퓨터 그래픽과 컴퓨터 비전의 교차점 탐색 Rating: 0 out of 5 stars0 ratings스캔라인 렌더링: 스캔라인 렌더링 기법을 통한 시각적 현실감 탐구 Rating: 0 out of 5 stars0 ratings머신비전: 컴퓨터 비전의 세계에 대한 통찰력 Rating: 0 out of 5 stars0 ratings색상 프로필: 컴퓨터 비전의 시각적 인식 및 분석 탐구 Rating: 0 out of 5 stars0 ratings거리 안개: 시각적 개척지 탐험: 컴퓨터 비전의 거리 안개에 대한 통찰 Rating: 0 out of 5 stars0 ratings소음 감소: 선명도 향상, 컴퓨터 비전의 노이즈 감소를 위한 고급 기술 Rating: 0 out of 5 stars0 ratings기하학적 모델링: 컴퓨터 비전의 기하학적 모델링 탐구 Rating: 0 out of 5 stars0 ratings시각 센서 네트워크: 컴퓨터 비전에서 시각 센서 네트워크의 힘 탐구 Rating: 0 out of 5 stars0 ratings안티 앨리어싱: 컴퓨터 비전의 시각적 명확성 향상 Rating: 0 out of 5 stars0 ratings벡터 그래픽: 컴퓨터 비전의 벡터 그래픽 마스터하기 Rating: 0 out of 5 stars0 ratings광학 점자 인식: 시각적 지능을 통한 접근성 강화 Rating: 0 out of 5 stars0 ratings물리적 컴퓨팅: 물리적 컴퓨팅에서 컴퓨터 비전 탐구 Rating: 0 out of 5 stars0 ratings공동 사진 전문가 그룹: JPEG 표준으로 시각적 데이터의 힘 활용 Rating: 0 out of 5 stars0 ratings2차원 컴퓨터 그래픽: 시각적 영역 탐색: 컴퓨터 비전의 2차원 컴퓨터 그래픽 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings
Reviews for 이미지 압축
0 ratings0 reviews
Book preview
이미지 압축 - Fouad Sabry
1 장 : 이미지 압축
디지털 사진은 데이터 압축의 한 형태인 이미지 압축을 사용하여 압축하여 크기를 줄여 저장 및 전송 비용을 낮출 수 있습니다. 다른 디지털 데이터에 사용되는 일반적인 데이터 압축 방법보다 더 나은 결과를 얻기 위해 알고리즘은 시각적 인식 및 이미지 데이터의 통계적 특징을 활용할 수 있습니다.
손실 및 무손실 이미지 압축이 모두 가능합니다. 대부분의 의료 이미지, 기술 도면, 클립 아트 및 만화는 장기 저장을 위해 무손실 압축의 이점을 누릴 수 있습니다. 압축 아티팩트는 손실 압축 기술에 의해 발생하며, 특히 낮은 비트 전송률로 작업할 때 발생합니다. 비트 전송률을 크게 줄여야 하지만 작은(종종 감지할 수 없는) 품질 손실이 허용되는 경우 손실 접근 방식이 이상적입니다. 사진과 같은 자연스러운 그림이 그렇습니다. 시각적 무손실 압축은 눈에 띄지 않는 품질 손실을 초래하는 손실 압축의 한 형태를 사용합니다.
손실이 있는 압축 기술:
가장 많이 사용되는 기술은 변환 코딩입니다.
가장 널리 사용되는 손실 압축 유형은 DCT(Discrete Cosine Transform)입니다. 1974년 Nasir Ahmed, T. Natarajan 및 K. R. Rao가 발명한 이 변환은 푸리에 변환을 포함하는 변환 제품군에 속합니다. 이산 코사인 변환 그룹의 맥락에서 DCT는 종종 DCT-II
라고 합니다(이산 코사인 변환 참조). 대부분의 경우 가장 효과적인 이미지 압축 방법입니다.
가장 널리 사용되는 손실 형식인 JPEG는 최신 HEIF와 마찬가지로 DCT를 사용합니다.
양자화와 엔트로피 코딩이 그 다음이며, 그 다음에는 보다 현대적인 웨이블릿 변환이 있습니다.
색상 양자화는 이미지의 색상 팔레트를 작은 대표
색조 세트로 줄이는 프로세스입니다. 압축된 이미지의 헤더에는 이미지를 만드는 데 사용된 색을 지정하는 색상표가 포함되어 있습니다. 색상 인덱스는 단순히 각 픽셀에서 참조됩니다. 포스터화를 방지하기 위해 이 기법을 디더링과 함께 사용할 수 있습니다.
GIF 및 PNG 파일에 일반적으로 사용되는 최대 256색의 풀 컬러 팔레트입니다.
BTC, CCC, S2TC 및 S3TC에서는 각 4x4 픽셀 블록에 2 또는 4 색상의 블록 팔레트가 사용됩니다.
크로마 서브샘플링에 의한 색 공간 감소. 이미지의 색차 정보 중 일부를 평균화하거나 제거함으로써 인간의 눈이 색상보다 밝기의 공간적 변화를 더 예리하게 등록한다는 사실을 활용합니다.
프랙탈 압축.
다층 퍼셉트론(Multilayer perceptron), 합성곱 신경망(Convolutional neural networks), 생성적 적대 신경망(Generative adversarial networks)은 모두 기계 학습 영역에서 보다 현대적인 응용 분야에서 사용되었습니다.
무손실 압축 기술:
PCX는 기본적으로 실행 길이 인코딩을 사용하는 반면 BMP, TGA 및 TIFF는 모두 대체 인코딩 모드로 지원합니다.
영역 이미지 압축
DPCM은 예측 코딩을 사용합니다.
수학적 인코딩과 Huffman 인코딩은 엔트로피 인코딩의 가장 널리 사용되는 두 가지 형태입니다.
GIF 및 TIFF에 널리 사용되는 적응형 사전 방법인 LZW는 PNG, MNG 및 TIFF 파일에서 DEFLATE를 사용합니다.
체인 코드
확산 모델
사진 압축의 주요 목적은 주어진 압축률(또는 비트 전송률)에서 가능한 최고의 품질을 얻는 것입니다.
대부분의 경우 확장성을 줄인다는 것은 기본 비트스트림 또는 파일을 조작하여 품질을 희생하는 것을 의미합니다(압축 해제 및 재압축 없이). 점진적 인코딩 및 임베디드 비트스트림은 확장성의 다른 이름입니다. 무손실 코덱도 확장성이 있지만 모양이 다르고(종종 거친 픽셀에서 미세한 픽셀로 스캔) 다른 용도로 사용됩니다. 다운로드하는 동안 이미지를 미리 보거나(예: 웹 브라우저에서) 리소스(예: 데이터베이스)에 대한 다양한 품질의 액세스를 제공하는 것은 모두 확장성의 이점을 크게 제공합니다. 다음과 같은 다양한 종류의 확장성이 있습니다.
품질 또는 복잡성의 점진적 증가: 비트스트림을 반복할 때마다 재구성된 이미지의 품질이 향상됩니다.
더 높은 품질의 이미지를 인코딩하려면 먼저 저해상도 버전을 인코딩해야 합니다.
이전에 인코딩된 흑백 버전에서 컬러를 점진적으로 인코딩합니다.
관심 영역별 코딩. 이미지의 다른 영역은 서로 다른 품질 수준으로 인코딩됩니다. 여기에 확장 용량을 추가할 수 있습니다(이러한 부분을 먼저 인코딩하고 다른 부분은 나중에 인코딩)합니다.
데이터에 대한 데이터. 압축된 데이터에 있을 수 있는 메타데이터를 사용하여 이미지를 탐색, 검색 및 분류할 수 있습니다. 색상 및 질감 데이터, 미리 보기 이미지, 작성자/저작권 정보는 모두 이러한 유형의 데이터 예입니다.
계산 용량. 압축 방법에는 다양한 인코딩 및 디코딩 계산 요구가 있습니다. 일부 높은 압축 방법을 실행하려면 많은 CPU 리소스가 필요합니다.
피크 신호 대 잡음비는 압축 기술의 효율성을 평가하는 데 사용되는 일반적인 메트릭입니다. 이미지의 손실 압축으로 인해 생성되는 노이즈의 양을 정량화하지만 시청자의 주관적인 평가는 때때로 필수적인 것으로 간주됩니다.
현대 엔트로피 코딩의 선구자인 Shannon-Fano 코딩은 1940년대 후반에 개발되었습니다.
1974년 1월, IEEE Trans. Computers는 Nasir Ahmed, T. Natarajan 및 K. R. Rao의 Discrete Cosine Transform
을 90-93페이지에 게재했습니다.
↑ Maayan, Gilad David (2021년 11월 24일). 인공 지능 기반 이미지 압축의 최첨단
. 데이터 과학을 향해. 2023년 4월 6일에 추출되었습니다.
고품질 제너레이티브 이미지 압축. 2023년 4월 6일에 추출되었습니다.
^ Bühlmann, Matthias (2022-09-28).
안정적인 확산 방법을 사용하여 이미지를 압축합니다.
중간.
2022년 11월 2일에 확인함.
버트, P.; Adelson, E. (1983년 4월 1일). 라플라시안 피라미드는 압축된 이미지 코드입니다. 통신, IEEE, 31(4), pp.532-540. 도:10.1109/TCOM.1983.1095851; 시테시어X:10.1.1.54.299; S2CID:8018433입니다.
^ Shao, Dan; Kropatsch, 월터 G.
(2010년 2월 3일-5일).
Špaček, 리보르; Franc, Vojtěch (eds.).
불규칙한 라플라시안 그래프의 피라미드
(PDF).
컴퓨터 비전 겨울 워크샵 2010.
Nové Hrady, 체코 공화국 : 체코 패턴 인식 협회.
최초 발행일: 2013년 5월 27일(PDF).
덕분에: 클로드 엘우드 섀넌(Claude Elwood Shannon, 1948). 알카텔-루슨트 (ed.). 대인 상호 작용의 수학적 이론
(PDF). 27 (3-4) Bell System Technical Journal, 379–423, 623–656페이지. 참고 문헌: hdl:11858/00-001M-0000-002C-4314-2; doi:10.1002/j.1538-7305.1948.tb01338.x입니다. 원본(PDF)은 2011년 5월 24일부터 액세스할 수 있습니다. 액세스 날짜: 2019년 4월 21일.
데이비드 앨버트 허프만(David Albert Huffman)의 A method for the creation of minimum-redundancy codes
의 원본(PDF)은 2005년 10월 8일에 Proceedings of the IRE, vol. 40, no. 9, pp. 1098-1101 (doi:10.1109/JRPROC.1952.273898)에서 보존되었다.
참고 문헌: Hadamard transform image coding,
William K. Pratt, Julius Kane, and Harry C. Andrews, Proceedings of the IEEE 57.1 (1969), pages 58-68.
↑ Nasir Ahmed (1991년 1월). 이산 코사인 변환: 그 탄생 비하인드 스토리. 이 기사를 인용하려면: Digital Signal Processing 1 (January): 4-5.
T.81: 연속톤 정지 이미지의 디지털 압축 및 코딩에 대한 요구 사항 및 지침
(PDF). 1992년 9월 CCITT에 게재됨. 2000년 8월 18일 원본 (PDF)에서 확인함. 2019 년 7 월 12 일에 이것을 얻으십시오!을 클릭합니다.
BT.com 에 JPEG 이미지 형식에 대한 설명이 있습니다. 2018년 5월 31일, BT Group. 2019년 8월 5일 기준.
^ JPEG : 그것은 무엇입니까? 눈에 띄지 않는 데일리 아이템
. 2013년 9월 24일 The Atlantic에 게재됨. 2019년 9월 13일에 추출되었습니다.
↑ Chris Baraniuk (2015년 10월 15일). BBC 뉴스에 따르면 JPEG에 복사 제한이 올 수 있습니다.
2019 년 9 월 13 일 BBC에서 검색 함.
The GIF Debate: A Programmer's Viewpoint," 1995년 1월 27일. 2015년 5월 26일부터 획득할 수 있습니다.
저자 : L. Peter Deutsch (1996 년 5 월). 추상적인. DOI:10.17487/RFC1951. DEFLATE 압축 데이터 형식 사양 버전 1.3. IETF입니다. 페이지 1. 섹션 초록. 이것을 얻으십시오 : 2014-04-23.
참조: Taubman, David; 마르셀린, 마이클 (2012). JPEG2000를 사용한 이미지 압축의 기본 사항: 권장 사항 및 기술 지침. ISBN: 9781461507994, Springer Science & Business Media 발행.
^ a b Unser, M; 블루, T.
(2003).
JPEG2000 웨이블릿 필터 수학적 특성(PDF)을 참조하십시오.
이미지 처리에 대한 IEEE 트랜잭션.
12 (9): 1080년–1090년.
Bibcode : 2003ITIP ... 12.1080U입니다.
doi:10.1109/TIP.2003.812329입니다.
PMID 18237979.
S2CID 2765169.
2019년 10월 13일에 원본 문서 (PDF) 에서 보존된 문서 .
Gary Sullivan(2003년 12월 8-12일). 시간적 서브밴드 비디오 코딩 및 설계 문제의 전반적인 특징.
ITU-Video T의 코딩 전문가 그룹. 2019년 9월 13일에 추출되었습니다.
앨런 C. 보빅 (2009). 비디오 처리: 필수 가이드, Academic Press, p. 355, ISBN 9780080922508.
Le Gall, Didier 및 Ali J. Tabatabai (1988)에서 인용. 산술 코딩 및 대칭 짧은 커널 필터를 사용한 디지털 이미지의 하위 대역 코딩. 자세한 내용은 http://dx.doi.org/10.1109/ICASSP.1988.196696 를 참조하십시오. S2CID=109186495 ICASSP-88., 음향, 음성 및 신호 처리에 관한 국제 회의: 761-764 볼륨 2.
인용 : Swartz, Charles S. (2005). 디지털 시네마를 이해하기 위한 전문가 가이드. 147 테일러 & 프랜시스. ISBN 9780240806174.
{챕터 1 종료}
제 2 장: 데이터 압축
정보 이론, 데이터 압축, 소스 코딩 및 기타 관련 분야: 일반적으로 데이터 압축 프로세스에 참여하는 장치를 인코더라고 하는 반면, 프로세스의 역(즉, 압축 해제)에 참여하는 장치를 디코더라고 합니다.
데이터 압축은 데이터 파일의 크기를 줄이는 프로세스이며 자주 사용되는 용어입니다. 소스 코딩은 데이터가 저장되거나 전송되기 전에 원래 데이터 소스에서 수행되는 인코딩 프로세스입니다. 이 프로세스를 데이터 전송의 맥락에서 참조합니다. 소스 코딩을 오류 감지 및 수정에 사용되는 채널 코딩 또는 데이터를 신호에 매핑하는 방법인 라인 코딩과 같은 다른 유형의 코딩과 혼동하지 않는 것이 중요합니다.
데이터 압축은 정보를 저장하고 전송하는 데 필요한 공간과 대역폭의 양을 줄이기 때문에 유용합니다. 압축 및 압축 해제 절차에는 모두 상당한 양의 계산 리소스가 필요합니다. 시공간 복잡성 트레이드 오프는 데이터를 압축하는 동안 고려해야 할 사항입니다. 예를 들어, 비디오 압축 방법은 비디오가 압축 해제되는 동안 볼 수 있을 만큼 빠르게 압축을 풀기 위해 고가의 하드웨어가 필요할 수 있습니다. 또한 비디오를 시청하기 전에 완전히 압축을 푸는 옵션은 불편하거나 추가 저장 공간이 필요할 수 있습니다. 데이터 압축 체계를 설계할 때 설계자는 여러 가지 요인 간에 균형을 맞춰야 합니다. 이러한 요소에는 달성된 압축 수준, 발생하는 왜곡의 양(손실 데이터 압축을 사용할 때) 및 데이터를 압축 및 압축 해제하는 데 필요한