기하학적 특징 학습: 기하학적 특징 학습을 통해 시각적 통찰력 확보
By Fouad Sabry
()
About this ebook
기하학적 특징 학습이란 무엇입니까?
기하학적 특징 학습은 기계 학습과 컴퓨터 비전을 결합하여 시각적 작업을 해결하는 기술입니다. 이 방법의 주요 목표는 이미지로부터 기하학적 특징을 수집하고 이를 효율적인 머신러닝 방법을 사용하여 학습함으로써 객체를 표현하기 위한 기하학적 형태의 대표적인 특징 집합을 찾는 것입니다. 인간은 자신이 보는 것에서 지각 정보를 추출함으로써 시각적 과제를 해결하고 환경에 빠르게 반응할 수 있습니다. 연구자들은 컴퓨터 비전 문제를 해결하기 위해 인간의 물체 인식 능력을 시뮬레이션합니다. 예를 들어, M. 여성 et al.(2002)은 장애물을 피하기 위해 모바일 로봇 탐색 작업에 특징 학습 기술을 적용했습니다. 그들은 특징을 학습하고 물체(그림)를 인식하기 위해 유전 알고리즘을 사용했습니다. 기하학적 특징 학습 방법은 인식 문제를 해결할 수 있을 뿐만 아니라 순차적으로 입력된 감각 이미지 세트(일반적으로 이미지의 일부 특징 추출)를 분석하여 후속 동작을 예측할 수도 있습니다. 학습을 통해 다음 행동에 대한 몇 가지 가설을 제시하고 각 가설의 확률에 따라 가장 가능성이 높은 행동을 제시합니다. 이 기술은 인공지능 분야에서 널리 사용된다.
당신이 얻을 수 있는 혜택
(I) 다음 주제에 대한 통찰력 및 검증:
1장: 기하학적 특징 학습
2장: 패턴 인식
3장: 허프 변환
4장: 손실 함수
5장: 기대-최대화 알고리즘
6장: 거부 샘플링
7장: 배열 처리
8장: 오토인코더
9장: 확률적 근사
10장: 체스판 감지
(II) 기하학적 특징 학습에 관한 대중의 주요 질문에 답합니다.
(III) 다양한 분야에서 기하학적 특징 학습을 사용하는 실제 사례.
이 책은 누구를 위한 책인가
전문가, 학부 및 대학원생, 열성팬, 취미생활자 및 모든 종류의 기하학적 특징 학습에 대한 기본 지식이나 정보를 넘어서고 싶은 사람들.
Read more from Fouad Sabry
항공 우주의 새로운 기술 [Korean]
Related to 기하학적 특징 학습
Titles in the series (100)
호모그래피: 호모그래피: 컴퓨터 비전의 변화 Rating: 0 out of 5 stars0 ratings인페인팅: 컴퓨터 비전의 격차 해소 Rating: 0 out of 5 stars0 ratings컬러 모델: 컴퓨터 비전의 스펙트럼 이해: 색상 모델 탐색 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings소음 감소: 선명도 향상, 컴퓨터 비전의 노이즈 감소를 위한 고급 기술 Rating: 0 out of 5 stars0 ratings톤 매핑: 톤 매핑: 컴퓨터 비전의 관점 밝히기 Rating: 0 out of 5 stars0 ratings감마 보정: 컴퓨터 비전의 시각적 선명도 향상: 감마 보정 기술 Rating: 0 out of 5 stars0 ratings컴퓨터 스테레오 비전: 컴퓨터 비전의 깊이 인식 탐구 Rating: 0 out of 5 stars0 ratings이미지 히스토그램: 시각적 통찰력 공개, 컴퓨터 비전의 이미지 히스토그램 깊이 탐색 Rating: 0 out of 5 stars0 ratings공동 사진 전문가 그룹: JPEG 표준으로 시각적 데이터의 힘 활용 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings레티넥스: 레티넥스 를 통해 컴퓨팅 비전의 비밀을 밝히다 Rating: 0 out of 5 stars0 ratings아핀 변환: 시각적 관점 잠금 해제: 컴퓨터 비전의 아핀 변환 탐색 Rating: 0 out of 5 stars0 ratings이방성 확산: 이방성 확산을 통한 이미지 분석 향상 Rating: 0 out of 5 stars0 ratings허프 변환: 컴퓨터 비전에서 Hough 변환의 마법 공개 Rating: 0 out of 5 stars0 ratings이미지 압축: 시각적 데이터 최적화를 위한 효율적인 기술 Rating: 0 out of 5 stars0 ratings색 공간: 컴퓨터 비전의 스펙트럼 탐색 Rating: 0 out of 5 stars0 ratings컬러 매칭 기능: 컴퓨터 비전의 스펙트럼 감도 이해 Rating: 0 out of 5 stars0 ratings히스토그램 균등화: 향상된 시각적 인식을 위한 이미지 대비 향상 Rating: 0 out of 5 stars0 ratings고유면: 고유면 를 통한 시각적 인식의 깊이 탐색 Rating: 0 out of 5 stars0 ratings관절 신체 자세 추정: 컴퓨터 비전에서 인간의 움직임 잠금 해제 Rating: 0 out of 5 stars0 ratings라돈 변환: 시각적 데이터에 숨겨진 패턴 밝히기 Rating: 0 out of 5 stars0 ratings시각적 인식: 컴퓨터 시각적 처리에 대한 통찰력 Rating: 0 out of 5 stars0 ratings하다마드 변환: 컴퓨터 비전에서 아다마르 변환의 힘 공개 Rating: 0 out of 5 stars0 ratings상황별 이미지 분류: 효과적인 분류를 위한 시각적 데이터 이해 Rating: 0 out of 5 stars0 ratings자동 번호판 인식: 컴퓨터 비전 기술의 잠재력 활용 Rating: 0 out of 5 stars0 ratings번들 조정: 정확한 재구성을 위한 시각적 데이터 최적화 Rating: 0 out of 5 stars0 ratings필터 뱅크: 컴퓨터 비전의 필터 뱅크 기술에 대한 통찰력 Rating: 0 out of 5 stars0 ratings색상 외관 모델: 컴퓨터 비전의 인식 및 표현 이해 Rating: 0 out of 5 stars0 ratings컴퓨터 비전 기본 매트릭스: '컴퓨터 비전' 영역에 '컴퓨터 비전 기본 매트릭스'라는 제목의 책 부제를 제안해주세요. 추천 자막에는 ':'이 포함되어서는 안 됩니다. Rating: 0 out of 5 stars0 ratings
Related ebooks
상황별 이미지 분류: 효과적인 분류를 위한 시각적 데이터 이해 Rating: 0 out of 5 stars0 ratings보행자 감지: '컴퓨터 비전' 영역에서 '보행자 감지'라는 제목의 도서에 대한 부제를 제안해 주세요. 추천 자막에는 ':'이 포함되어서는 안 됩니다. Rating: 0 out of 5 stars0 ratings단어 가방 모델: 단어 가방 로 시각적 지능 잠금 해제 Rating: 0 out of 5 stars0 ratings머신비전: 컴퓨터 비전의 세계에 대한 통찰력 Rating: 0 out of 5 stars0 ratings자동 타겟 인식: 표적 인식을 위한 컴퓨터 비전 기술의 발전 Rating: 0 out of 5 stars0 ratings무작위 표본 합의: 컴퓨터 비전의 강력한 추정 Rating: 0 out of 5 stars0 ratings관절 신체 자세 추정: 컴퓨터 비전에서 인간의 움직임 잠금 해제 Rating: 0 out of 5 stars0 ratings객체 감지: 발전, 응용, 알고리즘 Rating: 0 out of 5 stars0 ratings콘텐츠 기반 이미지 검색: 시각적 데이터베이스 잠금 해제 Rating: 0 out of 5 stars0 ratings은선 제거: 보이지 않는 것의 공개: 컴퓨터 비전의 비밀 Rating: 0 out of 5 stars0 ratings입자 필터: 컴퓨터 비전의 입자 필터 탐색 Rating: 0 out of 5 stars0 ratings이미지 분할: 픽셀 정밀도 을 통해 통찰력 확보 Rating: 0 out of 5 stars0 ratings고유면: 고유면 를 통한 시각적 인식의 깊이 탐색 Rating: 0 out of 5 stars0 ratings아펠리온 소프트웨어: 비전 잠금 해제: 아펠리온 소프트웨어의 깊이 탐구 Rating: 0 out of 5 stars0 ratings문서 모자이크: 문서 모자이크를 통해 시각적 통찰력 확보 Rating: 0 out of 5 stars0 ratings시각 센서 네트워크: 컴퓨터 비전에서 시각 센서 네트워크의 힘 탐구 Rating: 0 out of 5 stars0 ratings광학 점자 인식: 시각적 지능을 통한 접근성 강화 Rating: 0 out of 5 stars0 ratings메쉬 생성: 컴퓨터 비전 메시 생성의 발전과 응용 Rating: 0 out of 5 stars0 ratings컴퓨터 비전 기본 매트릭스: '컴퓨터 비전' 영역에 '컴퓨터 비전 기본 매트릭스'라는 제목의 책 부제를 제안해주세요. 추천 자막에는 ':'이 포함되어서는 안 됩니다. Rating: 0 out of 5 stars0 ratings합성 보기: 컴퓨터 비전의 관점 탐구 Rating: 0 out of 5 stars0 ratings자동 이미지 주석: 자동 태깅을 통한 시각적 이해 향상 Rating: 0 out of 5 stars0 ratings광학 흐름: 컴퓨터 비전의 동적 시각적 패턴 탐색 Rating: 0 out of 5 stars0 ratings컴퓨터 시각 인식: 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings수중 컴퓨터 비전: 파도 밑에서 컴퓨터 비전의 깊이 탐구 Rating: 0 out of 5 stars0 ratings지향성 그라디언트 히스토그램: 시각적 영역 공개: 컴퓨터 비전에서 지향성 그라데이션 히스토그램 탐색 Rating: 0 out of 5 stars0 ratings계산 기하학: 컴퓨터 비전을 위한 기하학적 통찰력 탐구 Rating: 0 out of 5 stars0 ratings스마트 카메라: 컴퓨터 비전을 통한 시각적 인식의 혁명 Rating: 0 out of 5 stars0 ratings피라미드 이미지 처리: 시각적 분석의 깊이 탐구 Rating: 0 out of 5 stars0 ratings활성 외관 모델: 컴퓨터 비전에서 활성 외관 모델의 힘 활용 Rating: 0 out of 5 stars0 ratings얼룩 감지: 시각적 데이터의 패턴 공개 Rating: 0 out of 5 stars0 ratings
Reviews for 기하학적 특징 학습
0 ratings0 reviews
Book preview
기하학적 특징 학습 - Fouad Sabry
1장: 기하학적 특징 학습
기계 학습과 컴퓨터 비전은 시각적 작업을 완료하는 데 사용되는 기하학적 기능 학습이라는 방법으로 결합됩니다. 사진에서 기하학적 특징을 추출하고 효과적인 기계 학습 방법으로 학습함으로써 이 방법은 물체를 설명하기 위해 기하학적 모양의 대표적인 특징 집합을 설정하려고 합니다. 인간은 자신이 보는 것에서 지각 정보를 수집함으로써 시각적 문제를 해결하고 주변 환경에 신속하게 대응할 수 있습니다. 컴퓨터 비전의 문제를 해결하기 위해 연구원들은 인간 객체 인식 전략을 모델링하기 시작했습니다. 모바일 로봇이 안전하게 탐색할 수 있도록 M. Mata et al. (2002)과 같은 연구자들은 기능 학습 방법을 사용했습니다. 유전 알고리즘은 특징 학습 및 객체 인식(그림)에 활용되었습니다. 기하학적 특징 학습 접근 방식은 일반적으로 입력 감각 이미지에서 특징을 추출하여 일련의 입력 감각 이미지를 연구함으로써 인식 문제를 처리할 수 있을 뿐만 아니라 향후 동작을 예측할 수 있습니다. 학습 프로세스는 다음 단계에 대한 일련의 가설을 제공한 다음 확률 순서대로 가설의 순위를 매겨 가장 가능성이 높은 행동 방침을 결정합니다. 인공 지능 분야는 이 방법을 광범위하게 사용합니다.
이미지에는 기하학적 특징 학습 기법을 사용하여 추출할 수 있는 고유한 기하학적 특징이 포함되어 있습니다. 객체는 점, 선, 곡선 및 표면과 같은 일련의 기하학적 부분으로 구성되기 때문에 기하학적 특성을 가질 수 있습니다. 특징 감지 기술은 모서리, 가장자리, 얼룩, 능선, 두드러진 점 및 이미지 텍스처의 기타 눈에 띄는 영역과 같은 특징을 식별할 수 있습니다.
기본 기능
오브젝트의 모서리는 단순하지만 중요한 디자인 요소입니다. 특히 복잡한 것들은 종종 대조적인 모서리 특성을 나타냅니다. 모서리 감지는 물체의 네 모서리를 분리하는 방법입니다. Cho와 Dunn은 두 평행선의 간격과 각도를 기반으로 새로운 접근 방식으로 모서리를 정의했습니다. 이 새로운 접근 방식에서 기능은 많은 하위 구성 요소의 매개 변수화된 합으로 정의됩니다.
그림의 가장자리는 단일 차원의 독특한 구조적 요소입니다. 뚜렷한 시각적 영역 사이의 한계를 나타냅니다. 가장자리 감지는 물체의 윤곽을 빠르고 정확하게 찾아내는 방법입니다.
얼룩 감지 방법은 사진의 영역인 얼룩을 식별하는 데 사용됩니다.
적용된 관점에서 능선은 대칭 1차원 곡선으로 해석될 수 있습니다. 참조: 융기 탐지 방법.
Kadir-Brady 현저성 검출기의 두드러진 특징, 이미지 텍스처에 초점을 맞추기 위해
복합 기능
기하학적 구성
모서리, 구석 또는 블롭과 같은 여러 기본체 피쳐가 결합되어 단일 기하학적 구성요소 피쳐를 형성합니다. 아래에서는 참조점을 사용하여 위치 x에서 기하학적 특징을 추출하는 데 필요한 벡터를 계산하는 방법을 보여줍니다.
\textstyle \ x_{{i}}=x_{{i-1}}+\sigma _{{i-1}}d_{{i}}{\begin{bmatrix}\cos(\theta _{{i-1}}+\phi _{{i}})\\\sin(\theta _{{i-1}}+\phi _{{i}})\end{bmatrix}}\textstyle \ \theta _{{i}}=\theta _{{i-1}}+\Delta \theta _{{i}}\textstyle \ \sigma _{{i}}=\sigma _{{i-1}}\Delta \sigma _{{i}}피처 위치는 기호 x로 표시되며, \textstyle \theta 방향을 의미하고 \textstyle \sigma 고유 축척을 의미합니다.
부울 컴포지션
프리미티브 피처 또는 다른 복합 피처 중 두 개의 추가 피처가 부울 컴파운드 피처를 구성합니다. 부울 특성은 두 가지 범주로 나눌 수 있습니다: 값이 두 하위 기능의 곱인 결합 기능과 값이 두 하위 기능의 최대값인 분리 기능.
Segen은 컴퓨터 비전 분야에서 기능 공간
의 개념을 처음으로 숙고했습니다. 지역적 특성 간의 기하학적 관계를 묘사하기 위해 그는 다단계 그래프를 활용했습니다.
이미지의 물체 인식은 사용 가능한 여러 학습 기술로 가르칠 수 있습니다. 학습 과정에서 레퍼토리에 새로운 종류의 물건을 추가할 수 있습니다.
코너 감지
곡선 피팅
가장자리 감지
전역 구조 추출
기능 히스토그램
라인 감지
상호 연결된 부품의 라벨링
이미지 텍스처
움직임 추정
1. 새로운 I
훈련 그림을 얻으십시오.
2. 인식 알고리즘에 비추어 결과를 평가합니다. 결과가 양수인 경우 새 객체 클래스가 인식됩니다.
인식 알고리즘
한 클래스를 다른 클래스와 구별하는 기능을 찾는 것이 모든 인식 프로그램의 주요 목표입니다.
따라서 아래 방정식을 사용하여 기능을 최대화합니다. \textstyle \ f_{{max}}
\textstyle \ I_{{max}}={\underset {f}{max}}{\underset {C}{max}}I(C,F_{{f}})\textstyle \ I(C,F_{{f}})=-{\underset {C}{\sum }}{\underset {F_{{f}}}{\sum }}BEL(F_{{f}},C)\log {\frac {BEL(C,F_{{f}})}{BEL(F_{{f}})BEL(C)}}이미지 피처의 가치를 평가 \textstyle \ f_{{max}} 하고 \textstyle \ f_{{f_{{max}}}} , 또한 특정 지역에 맞게 속성을 조정합니다.
\textstyle \ f_{{f_{{(p)}}}}(I)={\underset {x\in I}{max}}f_{{f_{{(p)}}}}(x)여기서 \textstyle f_{{f_{{(p)}}}}(x) 는 다음과 같이 정의됩니다.
\textstyle f_{{f_{{(p)}}}}(I)=max\left\{0,{\frac {f(p)^{T})f(x)}{\left\|f(p)\right\|\left\|f(x)\right\|}}\right\}평가
인식 결과에는 정답, 틀림, 모호함, 혼란스러움, 무지의 다섯 가지 평가 범주가 있습니다. 이러한 범주는 기능을 인식한 후 클래스를 인식할 수 있는지 여부를 결정하는 데 도움이 됩니다. 평가가 정확해지면 새 학습 이미지를 추가합니다. 인식에 실패한 경우 KSD(Kolmogorov-Smirnoff distance)로 측정한 대로 기능 노드의 구별력을 최대화하는 것이 좋습니다.
\textstyle KSD_{{a,b}}(X)={\underset {\alpha }{max}}\left|cdf(\alpha |a)-cdf(\alpha |b)\right|3.특징 획득을 위한 알고리즘 그런 다음 특징 학습 접근 방식을 사용하여 특징이 식별된 후 베이지안 네트워크의 인식 정확도를 테스트합니다.
기능 학습 방법의 주요 목표는 클래스가 올바르게 인식되었는지 여부를 평가하는 데 사용할 샘플 이미지에서 새로운 기능을 발견하는 것입니다. 고려해야 할 두 가지 시나리오가 있습니다. 샘플 이미지를 사용하여 실제 클래스와 잘못된 클래스의 새로운 기능을 찾습니다. 클래스가 인식되고 실제 클래스의 새 기능이 발견되고 잘못된 클래스가 발견되지 않는 경우 프로시저가 종료되어야 합니다. 거짓 클래스가 샘플 영상에는 있지만 실제 클래스에는 없는 경우 거짓 클래스를 인식하는 데 사용할 수 있는 특징을 베이즈 신경망에서 제거합니다.
테스트 절차는 베이지안 네트워크를 사용하여 구현됩니다.
D는 아마도 대략 정확 (PAC)이라는 개념을 사용했습니다.
이 접근 방식은 Roth(2002)가 컴퓨터 비전을 위한 무분포 학습 이론을 만드는 데 사용되었습니다.
기능 효율적인 학습 방법을 만드는 것은 이 가설의 성공에 매우 중요했습니다.
이 알고리즘의 목적은 기하학적 특성을 기반으로 이미지의 물체를 인식하는 것입니다.
특징 벡터는 입력으로 사용되며, 끝에 있는 1은 객체 감지 성공을 나타내고 0은 실패를 나타냅니다.
이 학습 방법의 핵심 아이디어는 기능을 통해 항목을 충실하게 설명할 수 있는 기능을 축적한 다음 그림에서 물체를 인식하여 해당 기능을 테스트하는 것입니다.
학습 알고리즘은 학습된 대상 개념이 클래스에 속하는지 여부를 예측하는 것을 목표로 \textstyle f_{{T}}(X) 하며, 여기서 X는 인스턴스 공간이고 매개변수는 정확한지 확인하기 위해 테스트됩니다.
특성을 학습한 후 학습 알고리즘의 효율성을 평가하는 데 사용할 수 있습니다. D. Roth는 두 가지 학습 알고리즘을 사용했습니다.
1. SNoT(Scattered Nodes on a Tree) 알고리즘
SNoW-트레인
초기 단계: \textstyle F_{{t}}=\phi 모든 대상에 대한 t에 연결된 기능 집합을 초기화 \textstyle t\in T 합니다.
T는 객체 대상의 집합이며, 그 요소는 \textstyle t_{{1}} \textstyle t_{{k}}
초기 가중치를 설정하고 설정 T에 활성 기능 집합을 공유하는 대상만 포함된 경우 특성을 대상으로 연결합니다.
Evaluate the targets : 목표값을 와 비교 \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}} 합니다 \textstyle \theta _{{t}} . 여기서 \textstyle w_{{i}}^{{t}} 는 특징 i와 대상 t를 연결하는 한 위치의 가중치입니다.
theta t는 t가 아니라 원하는 임계값입니다.
분석 결과에 따라 중요도를 조정합니다.
부정적인 예에서 예측된 긍정( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}>\theta _{{t}} 그리고 대상이 활성 기능 목록에 없음)과 긍정적인 예에서 예측된 부정( \textstyle {\underset {i\in e}{\sum }}w_{{i}}^{{t}}\leq \theta _{{t}} 그리고 대상이 활성 기능 목록에 있음)의 두 가지 경우가 있습니다.
SNoW 평가
앞 문장에서 설명한 것과 동일한 평가 함수를 각 목표에 적용합니다.
예측: 터미널 프로세스가 가장 활발한 노드를 선택합니다.
벡터 기반 지원 시스템
SVM의 주요 목적은 샘플 세트를 분리하기 위해 초평면을 찾는 것입니다. \textstyle (x_{{i}},y_{{i}}) 여기서 \textstyle x_{i} 는 특징의 선택인 입력 벡터 \textstyle x\in R^{{N}} 이고 \textstyle y_{{i}} 의 레이블입니다 \textstyle x_{i} .
초평면의 형태는