기본 콘텐츠로 건너뛰기

6장

고찰(2)
주 성분의 방향성분이 본 특징 지표의 회전 불변성에 미치는 영향을 서술하시오.
-> 주 성분을 0으로 놓고 주 성분을 기준으로 다시 재정렬
디스크립터의 내용을 분석하는 프로그램을 작성하시오.
-> 안 해도 됨.

FAST

- HST : 주변 데이터 4개를 봐서 극점, Corner를 찾는다.
- FST : HST에서 통과된 점에 대해서 주변 데이터 4~16개
- NMS : 가장 큰 것만 남기고 키포인트를 제거한다.

- SLAM : 임베디드에서 사용

-단점
 코너만을 찾지 않기 때문에 에지가 포함될 수도 있다.
 영상을 멀티 스케일로 해석하지 않는다.



HST : 1,5,9,13번 4개 중에 3포인트가 threshold보다 모두 높거나 낮으면..
FST : 점점 늘려가면서..
NMS : 가장 큰 점만..

- cv2.FAST_FEATURE_DETECTOR_TYPE
5_8=62.5%, 7_12=58.3%, 9_16=56% -> 통과될 확률이 아닌 threshold.
(반대로 생각할 것)
9_16 = 56% 대가 임계점. 그래서 키포인트가 가장 많이 나옴.



SURF

- 스케일 변환에 견인하다. 그러나 영상을 스케일링하는 것은 아니고 필터가 커진다.
- 적분 영상을 쓰기 때문에 필터가 커져도 시간 소비가 일어나지 않는다.

- LoG = Laplacian of Gaussian 를 이용한 극점 추출
           (2차 미분)
- 영상 -> Gaussian -> Laplacian -> Log (느림)

2차 미분을 한 가우시안 영상

● 고속화 구현 (Haar Wavelet = Haar like feature)
- 영상 -> LoG filter -> LoG (적분 영상을 이용)
                                     (filter가 커져도 시간 소비가 일어나지 않음)

- LoG 필터로 구성한 Hessian Matrix


어두운 부분은 내려가는 부분, 밝은 부분은 올라가는 부분

↓ 근사화


-영상에 LoG 필터를 적용하는 것이 아니라 LoG 필터를 적분영상에 사용하기 유리하도록 [2x2] 형태로 근사화한 Hessian Blob Detector를 사용한다.

- 키포인트 결정 방법 순서
1) 적분 영상을 이용한 LoG Hessian Matrix 원소의 근사화 연산
2) Blob Response로 판단한다.
3) Scaling 을 변환하여 키 포인트를 검출한다. 
4) Non-Maximum Suppression 

- 적분 영상이 2번(LoG, 방향성분) 쓰인다.

- SIFT와 유사하게 방향성분을 누적하여 주 방향 성분을 결정하고 키포인트의 주 방향을 기본 축으로 고정한 후 이를 중심으로 20x20 영 역을 4x4 개의 서브 영역으로 나누고 각 서브 영역에 대한 Haar Wavelet 의 4개의 주변 방향성분 정보를 저장하는 디스크립터를 생성한다. (적분 영상 사용 불가)

Response = Blob Response
파란색은 임계점을 넘은 것 중 제일 큰 것, 연두색은 임계점을 넘은 것 중 제일 작은 것.


동그라미가 크다는 것은 상층부(옥타브가 높다)에서 검출되었다는 말이다.
동그라미가 작을 수록 하층부(옥타브가 낮다)


ORB(Oriented FAST and Rotated BRIEF)

구성 : Oriented FAST + Rotation of BRIEF

Oriented FAST
- FAST에서는 없는 회전 불변 특징을 지원.
- 방향 성분 검출 : FAST로 발견된 코너를 중심으로 하는 패치에 대해 intensity weighted centroid를 계산한다. 이 코너로부터 centroid(FAST로 검출된 코너)로 향한 방향을 구한다.
ex) 검은색 blob에서 하얀색 blob
- 회전 강인성 : 반지름 r에 있는 원형 패치 영역에 대해 모멘트를 계산한다.

Rotation of BRIEF
- 키포인트의 0차, 1차 모멘트를 이용한 방향성분을 이용해 영상을 회전



Feature Matching


FLANN
대용량 데이터 셋과 고차원의 특징들의 근접값 들을 고속으로 찾아주는 알고리즘 BFMatcher 보다 고속. 10배 이상으로 알려져 있음. 

Homography
한 사진의 한 점이 다른 사진의 한 점에 해당하고 그 반대가 성립하는 두 사진 간의 관계

Homography matrix -> Correlation Coefficient (조도 영향 X)



댓글

이 블로그의 인기 게시물

1094 : 막대기 [C++]

# include < iostream > # include < vector > using namespace std ; int main ( ) { vector < int > Stick ; Stick . push_back ( 64 ) ; int Target ; cin > > Target ; int Last = 0 ; while ( true ) { if ( Target = = 64 ) break ; int Sum = 0 ; for ( int i = 0 ; i < Stick . size ( ) ; i + + ) Sum + = Stick [ i ] ; if ( Target = = Sum ) break ; else if ( Target < Sum ) { Stick [ Last ] / = 2 ; Sum = 0 ; for ( int i = 0 ; i < Stick . size ( ) ; i + + ) Sum + = Stick [ i ] ; if ( Target < = Sum ) continue ; else Stick . push_back ( Stick [ Last + + ] ) ; } } cout < < Stick . size ( ) ; ...

2407 : 조합 (Dynamic Programming) [C++]

어려웠다. 문제를 풀면서 솔직히 이게 되려나?? 메모리 제한걸리려는게 아닌가 싶었는데 만들면서 최대한 메모리를 작게 만들었더니 맞았습니다! 주어진 입력 값은 최대 100인데, 입력값을 입력하면 오버플로우가 나므로 자릿수 배열을 만들어주어야 한다! 처음으로 한 생각은 재귀! (n == m || m == 0) 참이면 1 거짓이면 [n-1], [n]번째에 계속 접근하기 결과는 20이 넘어가면 엄청난 시간이 걸림. 두 번째 한 생각은 3차원 배열이었다. 2차원 배열에 또 배열을 만들어 자릿 수를 다 저장하려 했으나~ for문이 3개나 들어가서 시간이 엄청 오래걸렸음. 결국 2차원 배열이지만 3차원의 효과를 내게끔 선언하였다. 2차원배열이 원래이런 식이라면 1 11 121 1331 14641 내가 만든 배열은 111121133114641 즉 한 차원을 줄일 수 있었고, 각 원소에 대한 파스칼의 삼각형을 이용한 덧셈 공식은  그 줄의 자릿수 사이즈를 이용하여 전에 있는 줄에 접근하였다. DP 사용!! Answer[i] = Answer[i-Answer[i].size()] + Answer[i-Answer[i].size()+1] 그리고 저장한 자릿수들을 거꾸로 출력해주면 그것이 정답! Combination() : 각 줄의 번호만큼 자릿수를 가지는 벡터 생성, 계속 쓰는 Sum 벡터 생성 Increase() : 각 자릿수가 10이 넘어가면 올림을 해준다. GetSum() : 각 자릿수를 더해준다. GetAnswer() : DP, 올림, 출력  Combination :: Combination ( ) { this - > Sum . push_back ( 0 ) ; for ( int i = 1 ; i < = 101 ; i + + ) Sum . push_back ( S...

11401 : 이항계수 3 (Dynamic Programming, Divide and Conquer) [C++]

1번, 2번 문제들과 확연히 차이나는 입력의 범위. 400만 ! DP를 사용해서 풀 수 없는 문제이다 . 하지만 DP가 쓰이긴 한다! 수학은 너무 어렵다. 곱셈의 역원을 공부해보다가 모르겠어서 도움을 구했다. 왜 곱셈의 역원을 구해야하는가? N! / (K! * (N-K)!) 에서 K! * (N-K)! 의 역원을 구해야 하기 때문! 곱셈의 역원을 구하는 정리인 페르마의 소정리를 이용하면 p가 1000000007 이지만 분할 정복을 이용한 제곱 수 계산 덕분에 logP 시간 소요. 분할 정복을 이용한 제곱 수 계산은 계속 써먹을 것 같아서 따로 올려놓았다. DP가 쓰이는 부분은 구해준 400만의 역원을 바탕으로 모든 역원을 구하는 부분이다. 그러므로 총 시간 소요는 O(N+LogP) long long BinomialCoefficient :: GetNum ( int N , int K ) { this - > Factorial [ 1 ] = 1 ; for ( int i = 2 ; i < = 4000000 ; i + + ) this - > Factorial [ i ] = ( this - > Factorial [ i - 1 ] * i ) % P ; this - > Invert [ 4000000 ] = this - > Pow_DC ( this - > Factorial [ 4000000 ] , P - 2 ) ; for ( int i = 4000000 - 1 ; i > 0 ; i - - ) this - > Invert [ i ] = ( this - > Invert [ i + 1 ] * ( i + 1 ) ) % P ; if ( N = = K | | K = ...