Java에서 Tesseract OCR을 사용하는 방법

작가: Eugene Taylor

창조 날짜: 8 팔월 2021

업데이트 날짜: 21 십일월 2024

Java와 함께 Tesseract OCR을 사용하는 방법은 무엇입니까? | 이미지에서 텍스트 추출 — 동영상: Java와 함께 Tesseract OCR을 사용하는 방법은 무엇입니까? | 이미지에서 텍스트 추출

콘텐츠

지침

Tesseract 광학 문자 인식 라이브러리는 개발자가 문서와 텍스트를 이미지로 스캔하는 방법을 제공합니다. 이들은 더 이상 필요하지 않은 문서의 이미지를 종이에 저장하는 데 사용됩니다. 각 문자에 대한 제어 루프를 작성하고 각 문자에 파일을 작성하여 Java에서 사용할 수 있습니다. Tesseract 라이브러리를 사용하려면 OCR 함수에 Java "네임 스페이스"를 포함시켜야합니다.

지침

Tesseract 라이브러리를 통해 사용자는 문서를 스캔 할 수 있습니다. (존 Foxx / Stockbyte / 게티 이미지)

OCR 문서를 만드는 데 사용할 Java 파일을 마우스 오른쪽 단추로 누릅니다. "연결 프로그램"을 클릭하고 원하는 Java 편집기를 선택하십시오.
파일의 맨 위에 OCR 라이브러리 이름 공간을 추가하십시오. 다음 코드를 복사하여 소스 파일에 붙여 넣으십시오.

com.touch.robot.imagecomparison.tesseractocr
파일의 문자 스캔을 담당하는 코드를 만듭니다. 예를 들어, 다음 코드는 파일의 각 문자를 통해 루프를 만들고이를 이미지 파일에 씁니다.

(I = 1; {i} <{lines} +1; i = {i})는 다음과 같이 정의되는 값 집합입니다. +1) {Typeline "{_TOCR_LINE {i}}"}
자바 컴파일러에서 코드를 실행하려면 편집기의 "저장"버튼을 클릭하고 "실행"을 클릭하십시오.