네이버1 파이썬 각종 OCR 사용해보기 및 네이버 클라우드 AI OCR 사용법 (1) 유해이미지를 판별해야하는데 처음에는 야한이미지나 잔인한이미지를 판별하는 모델을 만들었었다. 만들고나서 어플 내에서 이전의 광고로 판단되어 삭제되었던 이미지를 가지고 와서 테스트를 해보았다. 하지만 실제로 어플에서는 그런 경우는 많이 없고 글자로 광고하는 경우가 많았다. 그래서 우선 글자로 광고하는 게시물을 잡는 로직을 거치려고 한다. 내가 생각한 방법은 먼저 OCR을 통해서 글자를 추출하고 글자가 있다면 형태소 분석을 통해 키워드를 추출하여 로직을 통해 광고성 글이 들어갔는지 판별하는 알고리즘이다. 내가 생각한 알고리즘인데 우선 유해이미지에 대해 정의하였고 무료 OCR를 먼저 사용해보았다. 1. tesseract tesseract는 검색했을때 가장 먼저 나온 파이썬 OCR 라이브러리였다. pip inst.. 2023. 3. 30. 이전 1 다음