Scribe4Me
Tradutor universal de áudio com motor NLP em Rust.
O que é o Scribe4Me
Scribe4Me é um tradutor universal de áudio que transcreve e traduz conteúdo falado entre múltiplos idiomas. Diferente de soluções genéricas, ele usa um motor NLP customizado escrito em Rust que gera embeddings semânticos de 384 dimensões e tradução via NLLB-200, o modelo de tradução multilíngue da Meta com suporte a mais de 200 idiomas.
O projeto nasceu da frustração com ferramentas de tradução que perdem nuance e contexto. O Scribe4Me mantém a semântica original através de cache semântico e validação de qualidade automática.
Como foi construído
O coração do projeto é o Motor Rust, um módulo de NLP de alta performance que expõe suas funcionalidades pra Python via PyO3. Ele oferece geração de embeddings semânticos (vetores 384D multilíngues), cálculo de similaridade coseno, tradução via NLLB-200 com cache semântico e validação automática de qualidade da tradução.
A camada Python cuida da orquestração: captura de áudio, transcrição via Whisper e interface com o usuário. Rust cuida do processamento pesado e Python da lógica de aplicação, o que resulta em performance excepcional sem sacrificar a ergonomia de desenvolvimento.
Download e comunidade
O Scribe4Me está disponível pra download direto, por enquanto só pra Windows. A versão Linux está planejada pro futuro. É só baixar o instalador pela página de releases no GitHub e já pode começar a usar.
Se o Scribe4Me te ajudou, considera deixar uma estrela no repositório do GitHub. Isso ajuda outros desenvolvedores a encontrarem o projeto. E se puder compartilhar com alguém que precisa de uma ferramenta de tradução de áudio, melhor ainda.
O projeto é totalmente open source porque acredito que ferramentas de tradução e acessibilidade linguística devem ser acessíveis a todos. O motor NLP em Rust pode ser reutilizado em outros projetos, inclusive já é usado como dependência no Overwatch pra análise de sentimento multilíngue de notícias financeiras. Contribuições são bem-vindas, especialmente pra expandir o suporte a novos formatos de áudio e melhorar a precisão da transcrição em ambientes ruidosos.