11-8. 숫자 영상 정규화

학습 데이터 영상 정규화(Normalization)

    이전 kNN과 SVM으로 필기체 숫자 인식 프로그램을 돌릴 때 한 쪽에 치우친 숫자가 제공될 경우 정확도가 낮음

    학습 데이터 영상과 테스트 데이터 영상의 위치, 크기, 회전 등의 요소를 정규화하여 인식 성능 향상

     -> 숫자 영상의 무게 중심이 전체 영상의 중앙이 되도록 위치 정규화 과정 추가

무게 중심 이동 예시 (출처: FastCampus)

동영상 서비스가 종료되어 해당 콘텐츠를 재생할 수 없습니다.


11-9. k-평균 알고리즘

k-평균 알고리즘(k-means clustering algorithm)

    주어진 데이터를 k개의 구역으로 나누는 군집화 알고리즘 (링크)

     1. 임의의 k개의 중심 선정

     2. 모든 데이터에 대하여 가장 가까운 중심 선택

     3. 각 군집에 대해 중심을 다시 계산

     4. 중심이 변경되면 2-3 단계 반복

     5. 중심이 고정되면 종료

k-평균 알고리즘 동작 순서 (출처: wiki)

    K-means 군집화 함수: cv2.kmeans(data, K, bestLabels, criteria, attempts, flags, centers) -> retval, bestLabels, centers

     data는 (N,d) 크기와 np.float32 데이터 형식을 갖는 np.ndarray 타입의 학습 데이터 행렬

     K는 군집의 개수

     bestLables는 (N,1) 크기와 np.int32 데이터 형식을 갖는 np.ndarray 타입의 각 샘플의 군집 번호 행렬

     criteria는 (type, maxCount, epsilon) 튜플 형식의 종료 기준

     attempts는 다른 초기 레이블을 이용해 반복 실행할 횟수

     flags는 초기 중앙 설정 방법으로 cv2.KMEANS_RANDOM_CENTERS, cv2.KMEANS_PP_CENTERS, cv2.KMEANS_USE_INITIAL_LABELS 중 하나 선택

     centers는 (N,d) 크기와 np.float32 데이터 형식을 갖는 np.ndarray 타입의 군집 중심을 나타내는 행렬

     retval는 compactness measure로 샘플과 센터간의 거리의 합으로 적절한 k값 선정에 도움

   

    k-평균 알고리즘을 이용해 컬러 영상을 분할하는데 사용

     1. 입력 영상의 각 픽셀 값을 색 공간 상의 한 점으로 표현 (RGB 3차원 공간 픽셀 값 -> HS 2차원 공간 픽셀 값)

     2. HS 색 공간에서 k-평균 알고리즘 수행

     3. 각 픽셀 값을 k개의 대표 색상으로 치환

동영상 서비스가 종료되어 해당 콘텐츠를 재생할 수 없습니다.


11-10. 실전 코딩

문서에서 필기체 숫자 인식

    문서를 촬영 또는 스캔한 영상에서 필기체 숫자를 인식하는 프로그램

    구현할 기술:

     1. 각 숫자의 부분 영상 추출

       - 레이블링을 이용하여 각 숫자의 바운딩 박스 정보 추출

     2. 숫자 부분 영상을 정규화 과정을 거쳐 20x20 크기로 resize

       - 숫자의 바운딩 박스 부분 영상의 가로/세로 비율은 유지하되 학습에 사용된 숫자 영상이 20x20 꽉 채운 형태가 아니기 때문에 적절한 여백도 유지

     3. HOG & SVM 방법으로 숫자 인식 

 

실행 예제 (출처:FastCampus)


인증 타임

마지막 실전 코딩의 경우 코드에 에러가 있어서 직접 돌려보지 못했는데 에러 메세지를 좀더 둘러보고 코드를 수정해야할거 같다. 예제 파일의 경우 흰 배경에 쓰인 숫자만 확인되었는데 일반 종이에 쓰인 글씨의 경우 어떨지 보고 싶다.

11-8. 공부 인증 영상
11-9. 공부 인증 영상
11-10. 공부 인증 영상


#패스트캠퍼스 #패캠챌린지 #직장인인강 #직장인자기계발 #패스트캠퍼스후기 #OpenCV를 활용한 컴퓨터비전과 딥러닝 올인원 패키지 Online

 

패스트캠퍼스(FastCampus) 강의 둘러보러 가기 

   

https://bit.ly/37BpXiC

 

패스트캠퍼스 [직장인 실무교육]

프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.

fastcampus.co.kr

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.


 

+ Recent posts