13-5. EAST 문자 영역 검출

EAST(CVPR, 2017)

    An Efficient and Accurate Scene Text Detector의 약자로 FCN을 활용한 다-각도 글자 박스 검출 알고리즘이다. 

     소스 코드: github 링크

EAST 구조 (CVPR, 2017)

    EAST 세팅

     1. 모델 파일: 링크

     2. 설정 파일: X

     3. 입력과 출력: 출력에서 일정 임계값을 넘는 Score를 가지는 RBOX(geometry)를 decode하여 RotatedRect 형식으로 변환한 뒤 회전된 사각형에 대한 비최대 억제를 통해 나온 인덱스로 최종 사용할 단어 박스를 검출한다. 

EAST의 입출력 구조 (출처: FastCampus & CVPR, 2017)
EAST 예제 시행 결과 (출처: FastCampus). 오른쪽 사진을 보면 완벽하게 글자 박스만 검출하는 것이 아닌 것을 볼 수 있다.


13-6. 실전 코딩

실시간 얼굴 인식

    카메라 또는 동영상에 나타나는 얼굴을 검출하고 인식하여 화면에 표시하는 프로그램

    구현할 기능:

     1. 카메라 또는 동영상에서 사람의 얼굴 부분 영상을 파일로 저장하기

       - OpenCV SSD 얼굴 검출 기능을 이용하여 검출된 얼굴 영역 부분 영상을 추출하고 일련의 이미지 파일로 저장

       - 다양한 동영상을 사용해 등장 인물 별 폴더를 생성하고 추출한 얼굴 영상을 분류하여 각 폴더에 저장

     2. 폴더로 구분된 이미지 파일에 대한 CNN 영상 인식 학습

       - 추출한 얼굴 영상의 폴더 이름을 카테고리로 사용하여 지원하는 영상 파일 확장자를 가진 이미지들로 분류 학습을 수행

       - 학습이 끝나면 .pb 파일로 저장

     3. 카메라 또는 동영상에서 얼굴을 검출 후 학습된 얼굴 인식 모델을 이용하여 실시간으로 얼굴을 인식

실시간 얼굴 인식 수행 예제 (출처: FastCampus)


인증 타임

강의 마지막 챕터의 남은 수업을 기록한 글로 50일 챌린지에는 포함되지 않았지만 마무리할 수 있어서 좋다. 물론 강의 내용을 요약해서 써놓은 수준이라 퀄리티는 떨어지는 듯 하지만 다시 돌아보면서 차차 수정해 나가야겠다.

실시간 얼굴 인식의 경우 요즘 TV 다시보기 영상 인터페이스에 현재 출연진이 누구인지 보여주는 UI가 포함되어 있는데 이런 원리로 구현한걸까라는 생각이 들었다. 

한 영상에 누가 얼마나 출연하는지 퍼센트를 따져야한다면 이런 분류에 의한 자동 계산이 이루어 질 수 있겠다.


#패스트캠퍼스 #패캠챌린지 #직장인인강 #직장인자기계발 #패스트캠퍼스후기 #OpenCV를 활용한 컴퓨터비전과 딥러닝 올인원 패키지 Online

 

패스트캠퍼스(FastCampus) 강의 둘러보러 가기 

   

https://bit.ly/37BpXiC

 

패스트캠퍼스 [직장인 실무교육]

프로그래밍, 영상편집, UX/UI, 마케팅, 데이터 분석, 엑셀강의, The RED, 국비지원, 기업교육, 서비스 제공.

fastcampus.co.kr

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성되었습니다.


 

+ Recent posts