A startup de IA Speechify está dando seu próprio toque aos audiolivros e dando a você, o ouvinte, um papel de liderança. Você pode ser a estrela se quiser.

Você pode importar sua própria voz para criar um clone de IA e então ouvir o texto com sua voz ou a da sua namorada, como no caso do CEO Cliff Weitzman.

Você também pode escolher entre celebridades como Snoop Dogg e Gwyneth Paltrow, que assinaram para adicionar suas vozes como opções. A reviravolta é que elas são geradas por IA, não as próprias celebridades lendo.

“Você pode simplesmente escolher suas próprias vozes e isso é uma ótima experiência”, disse Weitzman.

É essa capacidade de escolher a voz que você quiser e de transformar qualquer livro em um audiolivro que, segundo Weitzman, diferencia a Speechify de gigantes da indústria como Apple Books, Audible e Spotify.

Audiobooks são uma mercadoria quente. De acordo com a Audio Publishers Association, 2023 marcado o 12º ano consecutivo de crescimento de vendas, com um total de cerca de US$ 2 bilhões no ano. A APA também descobriu que 52% dos adultos norte-americanos já ouviram audiolivros em algum momento, o que equivale a cerca de 150 milhões de pessoas.

Etiqueta de distintivo de arte do Atlas AI Etiqueta de distintivo de arte do Atlas AI

Com a inteligência artificial, e especialmente a IA generativa, exercendo sua influência por toda parte, estamos vendo empreendedores buscando aproveitar a tecnologia para desafiar o status quo em uma variedade de indústrias, do direito à medicina e até mesmo a própria IA generativa. A Speechify, de sete anos, está posicionando sua ferramenta de leitura de texto para fala como uma alternativa aos audiolivros tradicionais por meio do uso de vozes humanas geradas por IA.

Quando criança com dislexia, Weitzman dependia dos pais para ler livros em voz alta para ele. Mas quando chegou à faculdade, não conseguiu encontrar versões em áudio de seus livros didáticos, então ele construiu um programa para ler para ele usando aprendizado profundo, uma técnica de IA que ensina computadores a processar dados como o cérebro humano faz, e o que é conhecido como texto-para-fala concatenativo, uma forma de geração de fala que aproveita amostras pré-gravadas de fala.

O falante nativo de hebraico também incluiu a capacidade de alterar a velocidade – um recurso que o Speechify mantém até hoje.

“Quando comecei, não falava inglês, então ouvia tudo na velocidade de 0,75x e depois com o tempo fui aumentando para 1x, 1,25x, 1,5x, 2x, 3x”, disse ele. “Se uma frase fosse fácil de entender, eu a escreveria muito rápido. Se a frase fosse difícil, eu a faria bem lenta.”

O irmão de Weitzman, Tyler, entrou como cofundador em 2018 e atuou como chefe de IA e presidente desde 2022. Tyler Weitzman ajudou a desenvolver o algoritmo que eventualmente se tornou a primeira versão do Speechify. Ele foi treinado em 100.000 horas de áudio para que a voz de leitura soasse humana.À medida que o produto melhorava, a startup firmou parcerias com celebridades para usar suas vozes também.

Speechify pode ler livros, documentos e artigos em um dispositivo móvel. Para usá-lo, você pode fazer upload de um PDF para o aplicativo da web, que adiciona o áudio ao seu aplicativo móvel, ou pode baixar a extensão do Chrome para ouvir texto do Google Drive, iCloud ou Dropbox.

Uma versão limitada do Speechify é gratuita. Inclui seis vozes de leitura para começar e você pode ouvir em velocidades de até 1x. Essas opções de voz incluem homens americanos gerados por computador chamados Nate e John, bem como Stephanie, uma voz feminina do Reino Unido, junto com Snoop Dogg, Gwyneth Paltrow e o Youtuber americano Mr.

Eu escolhi Stephanie, e então o aplicativo me disse que mais de 100 vozes também estariam disponíveis no aplicativo. (Você então tem que ouvir um discurso de vendas de aproximadamente um minuto na sua voz escolhida antes de prosseguir.)

O Speechify Premium, que custa US$ 11,67 por mês por usuário, tem mais de 250 vozes de leitura e mais de 50 idiomas e você pode ouvir em até 4,5x.

Speechify tem 40 milhões de usuários, de acordo com Cliff Weitzman. (No entanto, o próprio aplicativo diz que mais de 23 milhões de pessoas usam o Speechify enquanto você está se inscrevendo.)

A inicialização é supostamente apoiado por US$ 4,5 milhões de uma rodada de capital de risco em estágio inicial em 2020. A empresa não quis comentar sobre o financiamento.

Este é um de uma série de breves perfis de startups de IA, para ajudá-lo a entender o cenário da atividade de inteligência artificial em andamento. Para saber mais sobre IA, consulte nosso novo hub AI Atlas, que inclui análises de produtos, notícias, dicas e explicadores.



Fuente