VoiceScript

파일 업로드

🎵

탭하거나 드래그하여 선택
음성 또는 영상 파일

mp3 · wav · m4a · ogg · flac · mp4 · webm

STT 엔진

후처리 모델

OpenRouter 후처리 모델

⚙️ 설정 → OpenRouter에서 API 키 및 기본 모델을 설정하세요

처리 중...0%

변환 결과

언어 —

길이 —

세그먼트 —

📝

파일 업로드 후
변환을 시작하면
결과가 표시됩니다

이미지 업로드

🖼

탭하거나 드래그하여 선택
이미지 파일

jpg · png · bmp · tiff · webp · gif

OCR 엔진

Vision 모델

▶ 커스텀 프롬프트

OpenRouter Vision 모델

▶ 커스텀 프롬프트

⚠️ Vision 기능을 지원하는 모델만 이미지 처리 가능 (Claude-3, GPT-4o, Gemini 등)

인식 모드

일반 텍스트와 글자를 인식합니다

처리 중...0%

인식 결과

줄 —

모드 —

엔진 —

표 —

🔍

이미지 업로드 후
인식을 시작하면
결과가 표시됩니다

📊

표 구조 분석 모드를
선택하면 표를
추출할 수 있습니다

📋 변환 이력

불러오는 중...

⚙️ 설정

📊 시스템 리소스

RAM 사용량

—

로딩 중

CPU 사용률

—

로딩 중

Swap

—

CPU 스레드

—

worker 재시작 후 반영

🖥️ CPU 스레드

Whisper STT에 사용할 CPU 스레드 수0 = 자동 (전체 코어 사용)

0 (자동)

⏱️ 변환 타임아웃

STT 변환 타임아웃 (초)

0 = 무제한 · 대용량 파일은 크게 설정

Ollama 응답 타임아웃 (초)

11b 이상 모델은 300+ 권장

🎙 STT Ollama 후처리 기본 모델

Whisper 변환 후 교정에 사용할 모델STT 페이지에서 미선택 시 이 모델이 사용됩니다

🔍 OCR Ollama 기본 모델

OCR Vision 엔진 선택 시 사용할 모델OCR 페이지에서 미선택 시 이 모델이 사용됩니다

🌐 OpenRouter 외부 AI 연동

API 키openrouter.ai에서 발급 — 저장 후 "연결 테스트"로 확인

API URL기본값 사용 권장

👤 사용자 관리

사용자 목록

사용자명	역할	STT	OCR	관리

신규 사용자 추가

아이디

비밀번호

기능 권한

STT 음성변환 OCR 이미지인식