Skip to content

[MAIN] OCR 전처리/segments/평가셋 확정 #41

@YUDINDIN1005

Description

@YUDINDIN1005

기능 설명

이미지/사진 증거를 텍스트화(OCR_하고, 줄바꿈/하이픈/페이지 분절/인식 오류 처리 규칙을 설계하여 StructuringInput에 맞는 segments 정의 및 평가셋(v0) 확정

작업 상세 내용

  • OCR 입력/출력 구조 및 segments 정의
  • 줄바꿈/페이지 분절/인식 오류 처리 규칙 설계
  • StructuringInput에 맞는 segments 변환 함수 구현
  • OCR 평가셋(v0) 확정 및 테스트 코드 작성

참고사항 (선택)

  • 기존 STT/StructuringInput/Segment 구조와 연동 필요
  • test_stt.py 참고하여 OCR 테스트 스크립트 작성 예정

Metadata

Metadata

Assignees

Labels

FEAT새로운 기능 구현

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions