Discover millions of ebooks, audiobooks, and so much more with a free trial

Only $11.99/month after trial. Cancel anytime.

스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개
스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개
스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개
Ebook108 pages56 minutes

스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개

Rating: 0 out of 5 stars

()

Read preview

About this ebook

규모 불변 기능 변환이란 무엇입니까


S I F T(스케일 불변 특징 변환)는 데이비드 로우가 1999년에 개발한 컴퓨터 비전 방법입니다. 그 목적은 이미지의 로컬 특징을 식별, 설명 및 일치시키는 것입니다. 객체 인식, 로봇 매핑 및 내비게이션, 그림 연결, 3차원 모델링, 동작 인식, 비디오 추적, 야생 동물의 개별 식별 및 성냥 이동 등이 사용될 수 있는 응용 프로그램입니다.


당신이 얻을 수 있는 혜택


(I) 다음 주제에 대한 통찰력 및 검증:


1장: 척도 불변 특성 변환


2장: 가장자리 감지


3장: 척도 공간


4장: 가우시안 블러


5장: 기능(컴퓨터 비전)


6장: 코너 감지


7장: 아핀 모양 적응


8장: 헤시안 아핀 영역 검출기


9장: 주곡률 기반 영역 검출


10장: 지향적인 가속 세그먼트 테스트의 기능와 회전된 바이너리 강력한 독립 기본 기능


(II) 척도 불변 특성 변환에 관한 대중의 주요 질문에 답합니다.


(III) 다양한 분야에서 스케일 불변 특성 변환을 사용하는 실제 사례.


이 책은 누구를 위한 책인가


전문가, 학부생 및 대학원생, 매니아, 취미생활자 및 모든 종류의 척도 불변 특성 변환에 대한 기본 지식이나 정보를 뛰어넘기를 원하는 사람들.

Language한국어
Release dateApr 30, 2024
스케일 불변 특징 변환: 컴퓨터 비전에서 규모 불변 기능 변환의 힘 공개

Read more from Fouad Sabry

Related to 스케일 불변 특징 변환

Titles in the series (100)

View More

Related ebooks

Reviews for 스케일 불변 특징 변환

Rating: 0 out of 5 stars
0 ratings

0 ratings0 reviews

What did you think?

Tap to rate

Review must be at least 10 words

    Book preview

    스케일 불변 특징 변환 - Fouad Sabry

    1장: 배율 불변 특성 변환

    David Lowe는 1999년에 이미지에서 로컬 특징을 찾고, 특성화하고, 일치시키기 위한 컴퓨터 비전 알고리즘으로 SIFT(Scale-Invariant Feature Transform)를 개발했습니다. 물체 인식, 로봇 매핑 및 내비게이션, 이미지 스티칭, 3차원 모델링, 제스처 인식, 비디오 추적, 개별 야생 동물 식별 및 매치메이킹은 이 기술의 가능한 많은 용도 중 일부에 불과합니다.

    Object SIFT 키포인트는 먼저 훈련 이미지 세트에서 추출됩니다.

    이미지의 모든 개체에 대한 기능 설명은 해당 개체에 대한 키 포인트를 분리하여 만들 수 있습니다. 다른 많은 객체가 있는 테스트 이미지에서 객체를 찾으려고 할 때 훈련 이미지에서 추출되었기 때문에 이 설명을 사용할 수 있습니다. 학습 영상에서 추출된 특징은 이미지 스케일, 노이즈 및 조명의 변화에도 불구하고 신뢰할 수 있는 인식을 달성할 수 있어야 합니다. 이러한 반점은 일반적으로 이미지 가장자리 또는 대비가 높은 다른 영역에 있습니다.

    또한 이러한 기능은 원본 장면에서와 같이 한 이미지에서 다음 이미지까지 동일한 상대적 위치를 유지해야 합니다. 문의 네 모서리만 기능으로 사용되면 문이 열려 있는지 닫혀 있는지 인식이 성공합니다. 그러나 프레임의 점도 사용되는 경우 두 경우 모두 인식에 실패합니다. 마찬가지로, 처리 중인 세트의 두 이미지 사이에 관절 또는 유연한 물체의 내부 형상에 변화가 있는 경우 해당 물체에 있는 특징이 더 이상 작동하지 않을 수 있습니다. 이러한 국부적 변동은 모든 특징 일치 오류의 평균 오차에 상당한 영향을 미칠 수 있지만, 실제로 SIFT는 이미지에서 훨씬 더 많은 수의 특징을 감지하고 사용하여 영향을 완화합니다.

    이 섹션에서는 원래 SIFT 알고리즘에 대한 간략한 개요를 제공하고 배경 소음이 많거나 시야가 가려진 환경에서 객체 인식을 위한 몇 가지 대체 방법에 대해 간략하게 설명합니다.

    SIFT 디스크립터는 수용장 측정을 사용하여 이미지를 분석합니다.

    로컬 이미지 기능은 감지하고 설명할 수 있는 경우 개체 인식에 도움이 될 수 있습니다. SIFT 기능은 불연속적인 관심 지점에서 객체의 모양을 기반으로 하기 때문에 이미지 크기 조정 또는 회전의 영향을 받지 않습니다. 관점의 사소한 변화와 조명 및 소음의 변화를 견딜 수 있습니다. 또한 불일치 가능성이 적고 정확한 물체 식별이 가능하며 매우 독특하고 추출하기 쉽습니다. 그러나 높은 차원이 문제가 될 수 있으므로 최상의 빈 우선 검색이 있는 k-d 트리와 같은 확률적 알고리즘이 일반적으로 사용됩니다. 로컬 기능의 (대규모) 데이터베이스와 간단하게 일치시킬 수 있습니다. 물체의 위치와 포즈를 계산하는 데 물체에서 3개의 SIFT 특징만 있으면 되므로 부분 폐색에 강력한 SIFT 특징 세트를 기반으로 하는 물체 설명이 가능합니다. 상대적으로 작은 데이터베이스와 오늘날의 컴퓨팅 성능으로 거의 즉시 인식이 가능합니다.

    Lowe의 접근 방식을 사용하면 이미지가 로컬 기하학적 왜곡에 강하면서도 이미지 변환, 크기 조정 및 회전에 영향을 받지 않는 대규모 기능 벡터 세트로 변환되며, 조명의 변화는 더 적습니다. 영장류의 시각에서 물체 감지를 위한 기본 형태, 색상 및 움직임을 인코딩하는 일차 시각 피질의 뉴런은 이러한 특징과 유사한 특성을 가지고 있습니다. 스케일 공간에 적용된 가우스 함수의 차이의 최대값과 최소값을 스무딩되고 리샘플링된 이미지 세트에 적용하여 주요 위치를 정의합니다. 가장자리를 따라 대비가 낮은 후보 및 가장자리 반응 지점은 제거됩니다. 방향은 특정 노드에서 지배적인 방향이 지정됩니다. 이러한 절차를 따르면 일치 및 인식이 더 정확해집니다. 그런 다음 키 위치의 반경 내에 있는 픽셀을 고려하고, 로컬 이미지 방향 평면을 흐리게 처리하고, 리샘플링하여 로컬 아핀 왜곡에 강한 SIFT 디스크립터를 얻을 수 있습니다.

    인덱싱할 때 SIFT 키를 저장하고 새 이미지를 사용하여 일치하는 키를 찾습니다. 후보를 유지할지 아니면 버릴지 결정하기 위해 Lowe는 best-bin-first search method라고 하는 k-d 트리 알고리즘의 변형을 사용했습니다. 이 방법은 후보의 특징 벡터와 현재 후보와 동일한 객체 클래스에 속하지 않는 가장 가까운 키포인트의 특성 벡터(후보 특성 벡터/가장 가까운 다른 클래스 특성 벡터) 사이의 거리를 비교합니다. 비율이 0.8보다 크면 자동으로 실격 처리됩니다. 이 기술을 사용하여 실제 히트의 5%를 버리고 거짓 긍정의 90%를 제거할 수 있었습니다. best-bin-first 검색 알고리즘은 200개의 가장 가까운 이웃을 테스트한 후 중지하여 최적화되었습니다. 이 방법은 100,000개의 키포인트가 포함된 데이터베이스에 대한 정확한 최근접 이웃 검색보다 약 2배 더 빠르며 올바른 일치 횟수가 5% 미만으로 손실됩니다.

    특정 모델 포즈에 해당하는 키를 찾기 위해 Hough 변환을 사용하여 모델에 대한 신뢰할 수 있는 가설을 그룹화합니다. 각 피처가 피처와 일치하는 모든 오브젝트 포즈에 대해 투표를 하도록 함으로써 Hough 변환은 일관된 해석으로 피처 클러스터를 식별할 수 있습니다. 여러 피처가 객체의 동일한 포즈에 투표하는 것으로 밝혀질 때 해석이 정확할 가능성이 훨씬 더 높습니다. 일치 가설에 따라 모델의 위치, 방향 및 크기를 예측하는 해시 테이블 항목이 생성됩니다. bin에 있는 3개 이상의 항목으로 구성된 모든 클러스터가 해시 테이블에서 조회되고 bin이 가장 큰 값에서 가장 작은 값으로 정렬됩니다.

    각 SIFT 키포인트에는 2D 위치, 크기 및 방향에 대한 정보가 포함되어 있으며, 데이터베이스는 트레이닝 세트에 일치하는 인스턴스가 있는 각 키포인트에 대해 이러한 파라미터를 추적합니다. 3D 오브젝트의 포즈 공간에는 6개의 자유도가 있으며, 이 4개의 매개변수에 내포된 유사성 변환은 강체 변형만 고려합니다. 따라서 방향에는 30도, 배율에는 2배, 위치에는 0.25배의 빈이 사용되었습니다(예측된 배율을 사용한 최대 투영 학습 이미지 차원). 작은 규모에 비해 더 큰 규모에서 생성된 SIFT 키 샘플에 대해 두 배 더 많은 고려가 제공됩니다. 이는 더 큰 규모가 더 작은 규모에서 추가 조사를 위해 가장 가능성이 높은 이웃을 선택할 수 있음을 의미합니다. 이것은 소음이 가장 적은 저울에 더 많은 가중치를 부여하기 때문에 인식에 도움이 됩니다. 각 키포인트 일치는 16개의 가능한 가설을 각 차원에서 가장 가까운 두 개의 Bin으로 좁혀 Bin 할당에서 경계 효과의 영향을 줄입니다.

    식별된 군집은 모델을 영상에 연결하는 아핀 변환 파라미터에 대해 선형 최소제곱해가 계산되는 검증 과정을 거칩니다.

    모델 점 [x, y]T 를 이미지 점

    Enjoying the preview?
    Page 1 of 1