VoiceScript — STT + OCR 통합 툴

faster-whisper(STT) + PaddleOCR 3.x / Ollama Vision / OpenRouter Vision(OCR)

빌드 전 필수 설정 (docker-compose.yml)

항목	설명
`AUTH_USERNAME` / `AUTH_PASSWORD`	로그인 계정 변경 필수
`JWT_SECRET`	`openssl rand -hex 32` 로 생성
`OLLAMA_URL`	호스트 실제 LAN IP (host.docker.internal 불안정)
`CPU_THREADS`	0 = 자동, 5825u 기준 8~12 권장
`OLLAMA_TIMEOUT`	큰 모델(11b+) 은 300+ 권장

cd whisper-stt
docker compose up -d --build
docker compose logs -f worker   # 모델 다운로드 완료 확인

접속: http://서버IP:8800

오류	해결
paddlepaddle 빌드 실패	Dockerfile에 `-i pypi.tuna...` 없는지 확인
SIGSEGV (worker 크래시)	`--pool=solo` 옵션 확인
Ollama 연결 실패	OLLAMA_URL에 `host.docker.internal` 대신 실제 IP 사용
OCR 빈 응답	Vision 미지원 모델 선택 여부 확인
Redis write 에러	`redis-server --stop-writes-on-bgsave-error no` 확인
PPStructure 오류	PaddleOCR 3.x 에서 제거됨, 표 추출은 Ollama/OpenRouter 사용