실수를 수정하는 데 유용한 GUI가있는 SimpleOCR을 사용 했습니다 . 불행히도 많은 실수를합니다! (그리고 다른 버그와 한계가 있습니다)
반면 Tesseract 는 더 정확하지만 GUI가 전혀 없습니다.
내 질문은 좋은 GUI 와 낮은 오류율 을 가진 Windows 용 무료 OCR 프로그램 이 있습니까? SimpleOCR과 비슷한 OCR 단어를 편집하는 동안 의심스러운 단어를 강조 표시하고 (OCR 불확실성에 의한 맞춤법 검사가 아닌) 원본 (비트 맵) 단어를 표시하고 싶습니다.
오픈 소스가 가장 좋았고 프리웨어가 뒤따 랐으며 시험 / 데모 / 크 러플웨어가 훨씬 뒤쳐졌습니다.
답변
Tesseract의 gui front 인 gimagereader 를 사용해 보셨습니까 ?
답변
OCRopus :
이 소프트웨어는 현재 최고의 오픈 소스 OCR 엔진 인 Tesseract를 기반으로합니다. 이 프로젝트는 내년 말에 출시 될 예정이며 Google의 도서 스캔 프로젝트에 사용될 예정이지만이 팀은 몇 가지 흥미로운 응용 프로그램을 염두에두고 있습니다.
- 웹 서비스 인터페이스
- PDF, 카메라 및 화면 OCR
- 데스크톱 검색 도구와 통합 : Beagle, Spotlight, Google 데스크톱
OCRopus ™는 최첨단 문서 분석 및 OCR 시스템으로, 플러그 가능 레이아웃 분석, 플러그 가능 문자 인식, 통계 자연 언어 모델링 및 다국어 기능을 갖추고 있습니다.
OCRopus 엔진은 90 년대 중반에 개발되어 미국 인구 조사국에서 배포 한 고성능 필기 인식기와 새로운 고성능 레이아웃 분석 방법이라는 두 가지 연구 프로젝트를 기반으로합니다.
OCRopus는 Google에서 개발을 후원하며 처음에는 처리량이 많은 대용량 문서 변환 작업을위한 것입니다. 우리는 또한 다른 많은 응용 분야에서 훌륭한 OCR 시스템이 될 것으로 기대합니다.
연결:
GOCR은 GNU Public License에 따라 개발 된 OCR (Optical Character Recognition) 프로그램입니다. 스캔 한 텍스트 이미지를 다시 텍스트 파일로 변환합니다. Joerg Schulenburg는이 프로그램을 시작했으며 이제 개발자 팀을 이끌고 있습니다. GOCR은 다른 프런트 엔드와 함께 사용할 수 있으므로 다른 OS 및 아키텍처로 쉽게 이식 할 수 있습니다. 다양한 이미지 형식을 열 수 있으며 품질이 매일 향상되고 있습니다.
연결:
답변
11 개 언어에 대한 사후 처리 맞춤법 검사기를 포함하는 TOPOCR (일명 SnapReader) 도 있습니다 .
SnapReader를 사용하면 거의 모든 문서 이미지에서 검색 가능한 메모를 작성할 수 있습니다. 또는 제작 도구로 사용하고 스캐너 또는 카메라를 사용하여 자신 만의 편집 가능한 컨텐츠를 작성하고 결과를 HTML 또는 PDF로 저장할 수 있습니다. SnapReader는 Audrey를 사용하여 텍스트를 고품질 오디오로 변환 할 수도 있습니다. 따라서 스캐너 또는 카메라를 사용하여 문서를 캡처 할 수있을뿐만 아니라 휴대용 음악 플레이어 또는 스마트 폰을 사용하여 “읽을”수도 있습니다.