텍스트를 PDF로 변환하는 PDF [닫기]

모든 PDF를 가져 와서 일반 텍스트로 변환하는 “원 클릭”방식을 찾고 있습니다. OSX 또는 Linux에 이상적입니다.

이상적으로 솔루션에는 OCR 기능이 포함되지만 반드시 그럴 필요는 없습니다.

최우선 순위는 구성없이 모든 파일을 취할 수있는 것입니다.



답변

있다 xpdf를 포함 pdftotext바이너리.

Pdftotext는 PDF (Portable Document Format) 파일을 일반 텍스트로 변환합니다.

Linux에는 사용 가능한 설치 프로그램이 있습니다. poppler-utils패키지 에도 들어있는 것 같습니다 . OS X에서는 Homebrew (먼저 설치)를 사용하여 설치 한 다음

brew install homebrew/x11/xpdf

소스 파일을 다운로드하여 OS X 용으로 컴파일합니다. 그 후 다음과 같이 사용하십시오.

pdftotext your_pdf_file.pdf

일반 텍스트 파일이 생성됩니다. 몇 가지 옵션도 있습니다 man pdftotext. 자세한 내용을 확인 하십시오.

대안은 OSX에서 poppler입니다 .

brew install poppler

데비안과 친구들

apt-get install poppler-utils