가끔 파일이 아닌 출력물로 받은 문서의 내용을 읽어야 하는 경우가 종종 있습니다.
이러한 기능을 OCR이라고 하는데요, 영어로는 Optical Character Recognition, 우리 말로 번역하면 광학 문자 인식 기능이라고 생각하면 되겠습니다.
알PDF와 같은 프로그램에서도 OCR을 지원하는데 생각처럼 만족스러운 결과를 얻지는 못했습니다만, 지금 소개하는 프로그램의 경우 완성도가 상당히 높다는 생각이 들어서 포스팅을 합니다. 아참, 무설치 프로그램으로 웹 기반입니다. 물론 보안이 된다고는 하지만 중요한 보안문서의 경우는 고민해보고 사용하는게 좋지 않을까 싶네요.
https://www.cardscanner.co/image-to-text
Image to Text Converter - Free Online OCR
Image to Text A free online OCR image to text converter will extract text from image, scanned document, or printed PDF by using Optical Character Recognition.
www.cardscanner.co
위의 링크를 통해서 접속합니다.
위의 그림과 같이 파일을 업로드하고, 하단의 '로봇이 아닙니다. '버튼을 클릭하면 이미지에 기록된 텍스트를 인식해 줍니다.
특징
사이트 기준으로 설명을 드리면, 우선 다음과 같은 특징이 있다고 합니다.
1. 다국어 지원
- 영어로 작성된 문서를 스캔하여 이미지 파일로 업로드 했었는데, 완벽하게 인식됩니다.
- 한글로 작성된 문서 또한 스캔하여 이미지 파일로 업로드 했는데, 역시나 완벽하게 인식됩니다. 참고로 스캔의 경우 스캐너를 활용하지 않고, 스마트폰(저는 아이폰 13pro를 사용하고 있습니다.)의 스캔 어플을 활용해서 촬영한 내용을 이미지 파일로 저장하여 PC에 업로드 후 사이트에 적용했었는데, 영어와 한글 모두 잘 인식되었습니다.
2. 안전한 변환
- 파일을 업로드 하니까 원본파일에 타격이 가지 않습니다. 보안 여부는 사실 잘 모르겠습니다. 믿고 써야지요.
3. 무료서비스
- 정말 계속 사용해도 별 이야기 없더라고요. 아마 페이지 여기 저기에 있는 광고비를 이용해서 수익을 얻는게 아닌가 생각됩니다.
4. 여러 이미지 형식
- 저는 jpg만 사용했었는데, 사이트 공지내용을 참고하자면 jpg, jpeg, png, webp, jfif, bmp, gif를 지원한다고 나와있습니다.
5. 문서, PDF, HTML등의 텍스트 다운로드
- 변환 후 다운로드 가능하며 다운받지 않아도 결과창에 출력된 인식 결과를 드레그하여 활용하기도 가능합니다.
6. 높은 정밀도
-정말, 기대하지 않고 했었는데 정말 정밀도가 높았습니다.
사용 방법
사이트 이미지를 활용했습니다.
1. Upload or Drag file here를 클릭하여 파일을 첨부하거나 이미지 파일의 주소, 또는 Drop box를 선택하여 이미지에서 텍스트를 추출할 파일을 불러옵니다.
2. 사이트 최상단 우측을 보시면 언어를 선택 할 수 있게 되어 있습니다.
3. 변환합니다.
'로봇이 아닙니다.'를 꼭 클릭하시고 컨버트 하셔야 합니다.
4. 필요한 형식으로 다운로드 합니다.
사용 용도
저는 주로 원서로 된 문서를 스마트폰으로 스캔하고 이미지로 변형하여 텍스트를 추출 후 번역 프로그램을 이용하여 내용을 공부하곤 합니다.
3년전?? 많은 출력물을 다루기 위해서 다양한 OCR프로그램을 알아봤었는데, 시간이 지나면서 알고리즘이 많이 좋아진건지 확신하기는 힘들지만 아무튼 너무도 만족스러운 결과물을 보여준다는 생각을 했습니다.
스캔할 문서가 필요하다면 추천 해 봅니다..!!!
'프로그램 상자' 카테고리의 다른 글
광고 없는 초강추 무료 캡쳐 프로그램-에스 캡쳐 (0) | 2022.12.04 |
---|---|
이미지를 AI가 글로 표현해 줍니다. CLIP-interrogator (0) | 2022.11.29 |
adobe 유료 플랜 해지방법 (0) | 2022.11.17 |
크롬을 이쁘게 꾸며서 사용하자. 크롬 확장도구 Momentum (0) | 2022.11.08 |
컨텐츠를 만들 생각이라면, 일단 미리캔버스!-초기설정 (0) | 2022.11.05 |
댓글