Skip to content

[MAIN] STT 텍스트화 및 태그 추출 파이프라인 구현 #46

@YUDINDIN1005

Description

@YUDINDIN1005

기능 설명

Whisper(OpenAI) 엔진을 활용해 음성(STT) 파일을 텍스트로 변환하고, 변환된 결과에서 태그를 자동 추출하는 파이프라인을 구현합니다.

작업 상세 내용

  • Whisper 엔진 설치 및 연동
  • Whisper로 음성 파일을 텍스트 및 segments(STTResult)로 변환
  • 각 segment에 대해 태그 추출 함수 적용 및 결과 저장
  • 테스트 코드 및 자동화 검증 추가

참고사항 (선택)

  • 기존 OCR 파이프라인과 구조/동작 일관성 유지
  • Whisper는 CPU/GPU 모두 지원하며, 한국어 인식률이 우수함
  • 추후 실제 서비스 STT 엔진 교체/확장도 고려

Metadata

Metadata

Assignees

Labels

FEAT새로운 기능 구현

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions