728x90
Text Detecction 문제란 이미지 내에 텍스트가 존재하는 영역의 위치정보를 Bounding Box로 찾는 문제들을 말한다.
EAST(Efficient and Accuracy Scene Text)
2017년에 나온 모델로 Text 인식에 특화된 모델이다.
위과정을 통해서 진행된다.
QUAD방식이나 RBOX 방식의 선택지가 있다. 둘의 성능차이는 크지 않은 편이다.
Loss for Score Map
Text Detection 의 경우 글자인 부분의 영역을 뽑아내는것이 관건이다. 그렇기 때문에 영역중에서 글자가 아닌것이 많다면, 손실률이 높다고 볼 수 있다.
Intersection over Union
두박스의 크기가 같으면 같을수록 1로 생각하는 방식
locality aware non maximum suppression
컴퓨터는 사람이 아니기때문에 답을 위처럼 여러개의 박스로 내게된다. 그것을 하나의 박스로 만드는 과정까지 거쳐야 완성된다.
728x90
'Python > 인공지능' 카테고리의 다른 글
다중차원 선형모델 직접 구현 (0) | 2022.04.17 |
---|---|
경사하강법 직접구현 (0) | 2022.04.10 |
09_순환신경망 RNN (0) | 2022.03.19 |
08_개,고양이 구분 인공지능 구현 (0) | 2022.03.18 |
06_CNN ILSVRC,CNN모델들 (0) | 2022.03.18 |