MacWhisper é o software de transcrição gratuito que eu estava esperando

Você está procurando um software Mac para transcrever arquivos de áudio em arquivos de texto escritos? Existem muitas ferramentas pagas, como Otter.ai e Trint, que podem custar dinheiro real quando você começa a usá-las demais. Mas MacWhisper é a solução gratuita que a internet estava esperando. Ou, pelo menos, aquele que eu estava esperando.

A OpenAI lançou um programa gratuito incrivelmente poderoso em setembro de 2022 que permitia que pessoas com algum conhecimento de tecnologia convertessem seus arquivos de áudio e vídeo em transcrições incrivelmente precisas. O problema era que não era muito acessível para o usuário comum, já que você precisava estar familiarizado com o uso de comandos no aplicativo Terminal.

Mas com MacWhisper, que foi detectado pela primeira vez por 9to5Mac, alguém finalmente desenvolveu uma GUI, ou interface gráfica do usuário, que se baseia no Whisper da OpenAI e deixa todas as coisas confusas da tecnologia sob o capô, permitindo que você apenas arraste e solte seu arquivo de áudio e obtenha uma transcrição muito rapidamente. E o MacWhisper é extremamente preciso porque o Whisper da OpenAI foi treinado em 680,000 horas de dados de áudio na web.

Uma das coisas boas sobre o MacWhisper é que você não está carregando o arquivo de áudio ou vídeo que deseja transcrever para a Internet. Isso é importante para jornalistas que podem estar trabalhando em uma história delicada ou para qualquer pessoa que tenha receio de enviar seus arquivos pessoais para a nuvem. O arquivo permanece em sua área de trabalho, o que significa que não há chance de alguém interceptar seu áudio.

Novamente, o MacWhisper é apenas uma nova interface de usuário para um programa gratuito que foi introduzido pela OpenAI no final do ano passado, mas realmente facilitará a transcrição de áudio para praticamente qualquer pessoa. Porque eu tenho usado o Whisper e achei extremamente útil desde que foi lançado. E até eu agora estarei usando o MacWhsiper, porque com certeza vai acelerar meu fluxo de trabalho.

Como apenas um exemplo, após a notícia do colapso da empresa cripto FTX, usei o Whisper para transcrever dezenas de horas de entrevistas antigas no YouTube com o fundador da empresa, Sam Bankman-Fried. A partir daí, pude pesquisar as transcrições e encontrar ideias estranhas e interessantes de artigos para escrever, como quando a SBF disse em junho de 2021 que blockchain teria consertado a Enron. A comparação da SBF com a Enron foi uma estranha coincidência, dado tudo o que sabemos agora sobre como a FTX entrou em colapso. Mas eu nunca teria encontrado aquele momento em uma velha entrevista obscura sem ter dezenas de transcrições que eu poderia pesquisar. E esse processo, embora mais fácil do que ouvir horas e horas de fitas, ainda era desajeitado e não muito automatizado.

Depois de instalar o Whisper em minha máquina, eu costumava digitar “whisper audiofilename.mp3 —model tiny.en” no aplicativo Terminal do Mac sempre que queria transcrever um arquivo. Com o WhisperMac, posso simplesmente arrastar e soltar meu arquivo de áudio e ele faz sua mágica sem nenhuma digitação extra.

Testei o MacWhisper com um episódio do NBC Nightly News que baixei do YouTube. Além de alguns erros, como interpretar a palavra “windshills” como “windshills” e ouvir Lester Holt como “Lester Hold”, a transcrição foi muito precisa. O MacWhisper é gratuito, mas há um nível pago do software que pode ser um pouco mais preciso porque usa os modelos de treinamento mais intensivos do OpenAI, mas a versão gratuita funcionará muito bem para a maioria das pessoas.

O MacWhisper permite exportar a palavra transcrita em alguns formatos diferentes, incluindo texto simples, CSV ou até mesmo um formato de arquivo de legendas como SRT e VTT.

E o MacWhisper não é apenas para inglês. Você pode transcrever áudio em 100 idiomas diferentes, o que é incrivelmente útil. O único recurso que o MacWhisper não possui, com o qual gostei de brincar no Whisper no aplicativo Terminal, é a tradução de idiomas. Traduzi vídeos virais em russo e chinês e fui informado por pessoas que falam os idiomas no Twitter que as traduções são preciso.

O outro recurso que o MacWhisper não possui, embora também não esteja disponível no Whisper da OpenAI, é a capacidade de diferenciar os alto-falantes. Por exemplo, se você estiver transcrevendo uma entrevista com dois palestrantes, não há marcações claras que mostrem quando um falante parou e outro começou. Mas eu suspeito que alguém eventualmente desenvolverá essa capacidade. Serviços pagos como o Trint fazem isso automaticamente, e seria ótimo ter de graça eventualmente, mas você recebe o que paga.

Há também um recurso com o MacWhisper onde você pode converter a fala do microfone do seu computador em texto, o que pode ser útil se você quiser transcrever algo na hora.

Passei meses imaginando quando alguém finalmente desenvolveria uma GUI para o Whisper, já que algumas pessoas tentaram, mas não criaram nada muito amigável. Mas MacWhisper, que foi desenvolvido por Jordi Bruin, é o software que eu estava esperando. Bruin também desenvolveu software como MacGPT, que permite aos usuários acessar o ChatGPT a partir de sua barra de menus.

Você pode baixar MacWhisper de graça, com cadastro por e-mail, no site da Bruin.

Fonte: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/