PG-Video-Transcriber

Локальное приложение для транскрибации видео и аудио файлов с поддержкой диаризации спикеров.

Возможности

Транскрибация видео и аудио файлов (MP4, MKV, AVI, MOV, MP3, WAV, FLAC, OGG, M4A)
Автоматическое определение языка (русский, английский и другие)
Опциональная диаризация спикеров (определение кто говорит)
Поддержка длинных записей (2+ часа, 2-6 GB файлы)
Полностью локальная обработка — никакие данные не отправляются в интернет
Автоматическое определение GPU и оптимальных настроек

Требования

Windows 10/11
Python 3.11+
NVIDIA GPU с CUDA (рекомендуется, но не обязательно)
- RTX 3090 / RTX 4090 — все модели, максимальная скорость
- GTX 1080 / RTX 2080 — большинство моделей
- Работает и на CPU, но медленнее

Установка

# Клонировать репозиторий
git clone https://github.com/kophysty/PG-Video-Transcriber.git
cd PG-Video-Transcriber

# Создать виртуальное окружение
python -m venv .venv
.venv\Scripts\activate

# Установить PyTorch с CUDA
pip install torch torchaudio --index-url https://download.pytorch.org/whl/cu124

# Установить остальные зависимости
pip install -r requirements.txt

Запуск

python main.py

Модели

При первом запуске нужно скачать модель Whisper. Рекомендуемые модели:

Модель	VRAM	Качество	Скорость
large-v3-turbo	~3 GB	Отличное	Очень быстро
large-v3	~5 GB	Лучшее	Быстро
medium	~2.5 GB	Хорошее	Быстро
small	~1 GB	Приемлемое	Очень быстро

Для диаризации спикеров дополнительно нужна модель pyannote (требует бесплатный HuggingFace токен).

Форматы вывода

JSON — полные данные с метаданными, word-level timestamps, спикерами
SRT — субтитры для видеоплееров
VTT — субтитры для веб
TXT — простой текст с таймстампами

Лицензия

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
Logs		Logs
app		app
models		models
tests		tests
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
README.md		README.md
TESTING.md		TESTING.md
check_paths.py		check_paths.py
main.py		main.py
requirements.txt		requirements.txt
run.bat		run.bat
run.sh		run.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PG-Video-Transcriber

Возможности

Требования

Установка

Запуск

Модели

Форматы вывода

Лицензия

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

PG-Video-Transcriber

Возможности

Требования

Установка

Запуск

Модели

Форматы вывода

Лицензия

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages