github.com / knigaperevodchik

Инструменты
для переводчика

Утилиты для работы со словарями, книгами и текстом. Python, AutoHotkey, NLP.

→ GitHub профиль

Проекты

📖
book-dictionary-builder
Создаёт словарь из любой книги
GitHub ↗

Два Python-скрипта: берут книгу в формате fb2, epub или txt — и автоматически строят словарь именно из слов этой книги с определениями из Викисловаря. На выходе готовый файл StarDict для GoldenDict или Lingvo.

10 226уникальных лемм
~98%покрытие Викисловарём
5–10 минна 123k слов
fb2 / epub / txt токенизация лемматизация Викисловарь StarDict
Python pymorphy3 NLP StarDict GoldenDict Wiktionary
🔍
morph-dict-converter
Поиск по любой форме слова в словаре
GitHub ↗

Конвертирует обычный толковый словарь DSL или StarDict в морфологический: добавляет ко всем словарным статьям все словоформы как альтернативные заголовки. Без плагинов и дополнений.

До
Ищем: «человеку»
Результат: ничего
После
Ищем: «человеку»
Находим: «человек» ✓
Python pymorphy3 DSL StarDict морфология лемматизация
🇸🇪
scandinavian-caps-fixer
Автоматически убирает КАПС при копировании
GitHub ↗

AutoHotkey-скрипт для Windows: перехватывает буфер обмена и исправляет ВСЁКАПС из скандинавских книг прямо при нажатии Ctrl+C. Поддерживает шведские, норвежские и датские символы (Å, Ä, Ö, Æ, Ø).

Ctrl+C из книги
KOMMISSARIEN SATT
STILLA OCH VÄNTADE
Ctrl+V в переводе
Kommissarien satt
stilla och väntade
AutoHotkey Windows шведский норвежский датский