Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

얼룩 감지: 시각적 데이터의 패턴 공개
얼룩 감지: 시각적 데이터의 패턴 공개
얼룩 감지: 시각적 데이터의 패턴 공개
Ebook126 pages1 hour

얼룩 감지: 시각적 데이터의 패턴 공개

Rating: 0 out of 5 stars

()

Read preview

About this ebook

얼룩 감지란 무엇입니까


컴퓨터 비전 분야에서 얼룩 감지 알고리즘은 디지털 이미지 내에서 주변 영역과 구별되는 영역을 식별하도록 설계되었습니다. 밝기 또는 색상 특성과 같은 특성 용어. 좀 더 일반적인 의미에서 블롭은 특정 품질이 일정하거나 거의 일정하게 유지되는 그림의 영역입니다. 블롭을 구성하는 모든 포인트는 어떤 방식으로든 서로 비교할 수 있는 것으로 간주될 수 있습니다. 컨볼루션의 사용은 얼룩 감지에 가장 자주 사용되는 방법입니다.


혜택을 받는 방법


(I) 다음에 대한 통찰력 및 검증 다음 주제:


1장: 얼룩 감지


2장: 가장자리 감지


3장: 캐니 가장자리 감지기


4장 : 스케일 불변 특성 변환


5장: 스케일 공간


6장: 특성(컴퓨터 비전)


7장: 가우시안의 차이


8장: 모서리 감지


9장: 능선 감지


10장: 척도 불변 특성 연산자


(II) 공개 주요 질문에 답하기 얼룩 감지에 대해 설명합니다.


(III) 다양한 분야에서 얼룩 감지를 사용하는 실제 사례.


책의 대상 독자


전문가, 학부 및 대학원생, 매니아, 취미생활자 및 모든 종류의 얼룩 감지에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.


 


 

Language한국어
Release dateMay 1, 2024
얼룩 감지: 시각적 데이터의 패턴 공개

Read more from Fouad Sabry

Related to 얼룩 감지

Titles in the series (100)

View More

Related ebooks

Reviews for 얼룩 감지

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    얼룩 감지 - Fouad Sabry

    1장: 블롭 감지

    컴퓨터 비전에서 블롭 감지 기술의 목표는 주변 환경과 크게 다른 특성을 가진 디지털 이미지 영역을 식별하는 것입니다. 얼룩 내부의 모든 점은 서로 다소 유사한 것으로 간주 될 수 있으므로 얼룩이라는 용어는 특정 품질이 일정하거나 본질적으로 일정한 그림 영역을 설명하는 데 사용됩니다. 컨볼루션은 블롭 감지에 가장 자주 사용되는 기술입니다.

    블롭 검출기의 두 가지 기본 유형은 위치에 대한 함수의 도함수를 기반으로 하는 I 미분 접근법과 (ii) 함수의 국소 최대값과 최소값을 감지하는 데 중점을 둔 국소 극값 방법입니다. 이러한 검출기는 해당 분야의 최신 명명법에 따라 관심 포인트 연산자 또는 관심 영역 연산자라고도 합니다(관심 포인트 감지 및 모서리 감지 참조).

    Blob 탐지기를 조사하고 구체화해야 하는 몇 가지 이유가 있습니다. 주요 동기는 영역에 대한 추가 정보를 제공하여 에지 및 코너 감지기에서 제공된 데이터를 보완하는 것입니다. 이 분야의 초기 연구에서는 블롭 감지를 사용하여 관련 섹션을 분리했습니다. 이미지의 이러한 점은 물체 인식 및/또는 추적을 위해 물체 또는 물체 부분의 표시기 역할을 할 수 있습니다. 히스토그램 분석은 분할의 맥락에서 피크 식별을 위해 블롭 디스크립터를 사용할 수 있는 영역 중 하나일 뿐입니다. Blob 설명자는 텍스처 분석 및 텍스처 인식 분야의 기본 구성 요소로도 자주 사용됩니다. 최근에는 Blob 설명자가 로컬 이미지 통계를 기반으로 하는 모양 기반 개체 감지를 위한 정보 그림 기능의 존재를 나타내고 넓은 기준선 스테레오 일치를 위한 관심 지점으로 널리 사용되었습니다. 비슷한 맥락에서 능선 감지는 선형 항목의 존재를 나타내는 데 사용할 수 있습니다.

    가우스 분포의 라플라시안은 가장 초기에 가장 널리 사용되는 블롭 검출기(LoG) 중 하나의 기초였습니다.

    입력 이미지가 주어지면 f(x,y) 가우스 커널은 이 이미지를 컨볼루션하는 데 사용됩니다.

    {\displaystyle g(x,y,t)={\frac {1}{2\pi t}}e^{-{\frac {x^{2}+y^{2}}{2t}}}}

    축척 공간 표현을 제공하기 위해 t 특정 축척에서

    L(x,y;t)\ =g(x,y,t)*f(x,y)

    .

    그런 다음 라플라시안 연산의 출력

    \nabla ^{2}L=L_{xx}+L_{yy}

    가 계산되며, 일반적으로 반지름의 어두운 얼룩 {\textstyle r^{2}=2t} (2차원 이미지의 경우,  -차원 이미지의 {\textstyle r^{2}=dt} 경우 {\textstyle d} )에 대해 강한 양의 반응이 발생하고 비슷한 크기의 밝은 얼룩에 대해 강한 음성 반응이 발생합니다.

    그러나 이 연산자를 단일 스케일에서 사용할 때 근본적인 문제는 연산자의 반응이 이미지 도메인의 블롭 구조 크기와 평활화 전 커널의 가우스 크기 간의 상관 관계에 크게 의존한다는 것입니다.

    그림 도메인에서는 다양한(알 수 없는) 크기의 얼룩을 자동으로 캡처하므로 한 번에 여러 수준을 고려하는 것이 중요합니다.

    스케일 정규화된 Laplacian 연산자를 고려하는 것은 자동 스케일 선택으로 다중 스케일 블롭 감지기를 구성하는 간단한 기술입니다.

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L=t\,(L_{xx}+L_{yy})}

    또한 공간과 스케일 모두에 대해 동시에 국소 최대값 / 최소값 인 점 인 스케일 공간 극값을 식별합니다 {\displaystyle \nabla _{\mathrm {norm} }^{2}L} (Lindeberg 1994, 1998).

    따라서 이산 2차원 입력 이미지가 주어지면 f(x,y) 3차원 이산 스케일 공간 볼륨 L(x,y,t) 이 계산되고 이 점의 값이 26개 인접 항목 모두의 값보다 크면(작은) 점이 밝은(어두운) 얼룩으로 간주됩니다.

    따라서, 관심 포인트 ({\hat {x}},{\hat {y}}) 와 척도 {\hat {t}} 의 동시 선택은 다음과 같이 수행됩니다.

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxminlocal} _{(x,y;t)}((\nabla _{\mathrm {norm} }^{2}L)(x,y;t))}

    .

    이 Blob 개념은 간단하고 수학적으로 정확한 작동 방식으로 용어를 정의하므로 효과적이고 신뢰할 수 있는 Blob 식별 기술로 이어집니다.

    정규화된 라플라시안 연산자의 스케일 공간 최댓값에서 정의된 블롭은 평행 이동이 불가능한 응답, 회전 및 크기 조정을 통한 이미지 변환과 같은 몇 가지 기본 특성을 가지고 있습니다.

    따라서, 스케일-공간 최대값이 한 지점에서 가정 (x_{0},y_{0};t_{0}) 된 다음 스케일 팩터에 의해 이미지의 스케일링이 재조정될 때 s , 스케일-공간 최대 값은 {\displaystyle \left(sx_{0},sy_{0};s^{2}t_{0}\right)} 스케일링된 이미지에 있을 것이다(Lindeberg 1998).

    매우 실용적인 품질로 인해 라플라시안 블롭 검출의 주제는 스케일 정규화 분포의 국소 극단을 포함하도록 확장 될 수 있습니다 라플라시안의 다른 응용 프로그램에는 모서리를 감지 할 때, 특징의 스케일 인식 모니터링 (Bretzner 및 Lindeberg 1998), 스케일 불변 특징 변환 (Lowe, 2004) 및 기타 이미지 설명자를 사용한 이미지 매칭 및 객체 인식과 같은 스케일 선택이 포함됩니다.

    라플라시안 연산자 및 기타 유사한 스케일 공간 관심 포인트 검출기는 모두 (Lindeberg 2013a)에서 연구된 스케일 선택 기능을 가지고 있습니다. 헤세 연산자의 행렬식과 같은 다른 스케일 공간 관심 지점 검출기는 로컬 SIFT와 유사한 이미지 디스크립터를 사용하는 그림 기반 매칭과 관련하여 라플라시안 연산자 및 가우스 차이 근사치를 능가하는 것으로 입증되었습니다(Lindeberg 2013b, 2015).

    스케일 공간 표현 이 L(x,y,t) 확산 방정식을 만족한다는 사실에서

    \partial _{t}L={\frac {1}{2}}\nabla ^{2}L

    따라서 가우스 연산자의 라플라시안은 \nabla ^{2}L(x,y,t) 두 가우스 평활화 이미지(스케일 공간 표현) 간의 차이에 대한 극한 사례로 계산될 수도 있습니다

    {\displaystyle \nabla _{\mathrm {norm} }^{2}L(x,y;t)\approx {\frac {t}{\Delta t}}\left(L(x,y;t+\Delta t)-L(x,y;t)\right)}

    .

    이 방법은 컴퓨터 비전 분야에서 종종 DoG(Difference of Gaussians) 방법이라고 합니다. 몇 가지 미묘한 차이가 있지만 이 연산자는 라플라시안 연산자의 근사치로 생각할 수 있으며 많은 속성을 공유합니다. (Lindeberg 2012, 2015)에서 가우스 차이 연산자와 스케일 정규화된 라플라시안 블롭 검출기 간의 명시적 관계를 확인할 수 있습니다. 블롭은 스케일 공간에서 가우스 차이의 극한에서도 식별할 수 있습니다. SIFT 알고리즘(Scale-Invariant Feature Transform)은 이 전략의 구현 중 하나입니다. 자세한 내용은 Lowe (2004)를 참조하십시오.

    헤세 행렬식을 스케일링한 후 고려하면 Monge-Ampère 연산자라고도 할 수 있습니다.

    {\displaystyle \det H_{\mathrm {norm} }L=t^{2}\left(L_{xx}L_{yy}-L_{xy}^{2}\right)}

    여기서 HL 는 스케일 공간 표현의 헤세 행렬을 나타내 L 고 이 연산자의 스케일 공간 최대값을 감지하면 안장에도 반응하는 자동 스케일 선택 기능이 있는 또 다른 간단한 차동 블롭 검출기를 얻을 수 있습니다(Lindeberg 1994, 1998)

    {\displaystyle ({\hat {x}},{\hat {y}};{\hat {t}})=\operatorname {argmaxlocal} _{(x,y;t)}((\det H_{\mathrm {norm} }L)(x,y;t))}

    .

    얼룩 점 ({\hat {x}},{\hat {y}}) 과 배율 {\hat {t}} 은 또한 변환 및 회전 및 크기 조정을 통한 이미지 변환과 공변하는 얼룩 설명자로 이어지는 작동 차등 기하학적 정의에서 정의됩니다.

    스케일 선택과 관련하여, 비유클리드 아핀 변환에 대한 스케일 선택 품질은 헤세 행렬식(DoH)의 스케일 공간 극값에서 구성된 블롭에 대해 약간 개선되었습니다(Lindeberg 1994, 1998, 2015).

    축약된 버전인 SURF 디스크립터(Bay et al.)는 Haar 웨이블릿에서 계산된 헤세 행렬의 스케일 정규화 행렬식을 기본 관심 지점 연산자로 사용합니다.

    ) 2006년에 패턴 인식 및 사진 매칭에 사용됩니다.

    헤세 연산자의 행렬식은 (Lindeberg 2013a)에 발표된 각각의 선택 속성에 대한 전체 분석에서 볼 수 있듯이 아핀 이미지 변환에서 라플라시안 연산자보다 우수한 스케일 선택 기능을 갖습니다. 로컬 SIFT와 유사하거나 SURF와 유사한 이미지 설명자를 사용한 이미지 기반 매칭의 경우 (Lindeberg 2013b, 2015)에서 헤세 연산자의 행렬식이 라플라시안 연산자 또는 가우스 차분 근사치보다 훨씬 더 잘 수행될 뿐만 아니라 Harris 또는 Harris-Laplace 연산자보다 더 나은 성능을 발휘하여 더 높은 효율 값과 더 낮은 1 정밀도 점수로 이어집니다.

    블롭 감지를 위해 라플라시안과 헤세 행렬식 사이의 하이브리드 연산자가 개발되었으며, 여기서 헤세 행렬식은 공간 선택에 사용되고 스케일 정규화된 라플라시안은 척도 선택에 사용됩니다. (Mikolajczyk 및 Schmid 2004):

    {\displaystyle ({\hat {x}},{\hat {y}})=\operatorname {argmaxlocal} _{(x,y)}((\det HL)(x,y;t))}{\displaystyle {\hat {t}}=\operatorname {argmaxminlocal} _{t}((\nabla _{\mathrm {norm} }^{2}L)({\hat {x}},{\hat {y}};t))}

    이 연산자는 텍스처 분석, 물체 인식 및 그림 일치에 적용되었습니다.

    자동 배율 선택 기능이 있는 이러한 블롭 감지기는 변환, 회전 및 균일한 크기 조정과 같은 공간 변환에 대해 강력한 블롭 설명자를 생성합니다. 그러나 원근 왜곡은 컴퓨터 비전 시스템에 대한

    Enjoying the preview?
    Page 1 of 1