Open SourceLive

Scribe4Me

Speech-to-text local com IA. Fala, solta a tecla, o texto aparece onde o cursor estiver.

PythonWhisperIASpeech-to-textOpen Source

Visitar site GitHub Download Windows Download macOS Download Linux

O que é o Scribe4Me

Scribe4Me é um app de transcrição de voz que funciona assim: você pressiona Ctrl+Alt+H, fala, solta a tecla. O texto aparece onde o cursor estiver, seja no Word, no Slack, no terminal, em qualquer lugar. Sem copiar e colar, sem janela extra, sem login.

Por padrão tudo roda localmente com o Whisper da OpenAI. Nenhum áudio sai do seu computador. Se você quiser mais velocidade, pode configurar um backend de API e o app usa serviços como Groq ou Deepgram no lugar do modelo local, mantendo o mesmo fluxo de uso.

É útil pra escrever mensagens longas, ditar código, registrar ideias, transcrever reuniões. Qualquer situação onde digitar é mais lento do que falar.

Funcionalidades

O modo offline usa o faster-whisper com detecção automática de GPU. Se tiver uma NVIDIA com CUDA, o app usa ela. Se não tiver, roda na CPU mesmo. A qualidade da transcrição é boa o suficiente pra uso diário sem precisar de internet.

O modo API é opcional e configurável pelo menu do tray. Os backends disponíveis são Groq (whisper-large-v3, com 7.200 segundos por dia no plano gratuito), OpenAI (whisper-1), Gemini (free tier) e Deepgram. Com Deepgram e o modo realtime ativado, um overlay aparece na tela mostrando o texto parcial enquanto você fala, frase por frase. Se a API cair, o app cai automaticamente pro Whisper local.

Além da transcrição, tem cancelamento de gravação (Ctrl+Alt+C), atalhos de teclado configuráveis, log diário das transcrições e prompt personalizado pra ajustar estilo e vocabulário.

Python 3.12faster-whisperWhisperGroqOpenAIGeminiDeepgramPyInstallerAppImage

Open source e multiplataforma

O Scribe4Me roda em Windows, macOS e Linux. No Windows e no macOS tem instalador direto. No Linux a instalação é via um script de shell que baixa o AppImage e cria o atalho no menu de aplicativos.

O projeto é MIT. Se te ajudou, uma estrela no GitHub já ajuda outros a descobrirem. E se tiver interesse em contribuir, issues e PRs são bem-vindos, especialmente pra novos backends de API e melhorias na precisão em ambientes ruidosos.