A API de Reconhecimento de Voz é uma ferramenta poderosa e precisa projetada para transformar palavras faladas em texto organizado Utilizando tecnologia avançada de reconhecimento de fala e IA, ela fornece transcrições de alta qualidade para uma ampla gama de indústrias e aplicações Seja processando fala ao vivo ou arquivos de áudio pré-gravados, esta API garante conversão confiável e precisa com erros mínimos
Um destaque importante desta API é seu suporte multilíngue, permitindo que os usuários transcrevam áudio em vários idiomas com precisão excepcional Esse recurso a torna uma ferramenta essencial para aqueles que necessitam de transcrições em diferentes idiomas
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
A API de Reconhecimento de Voz retorna o texto transcrito do arquivo de áudio fornecido A saída inclui a fala reconhecida convertida em um formato de texto estruturado permitindo que os usuários acessem e utilizem facilmente o conteúdo falado
Os dados da resposta geralmente incluem campos como "transcrição" (o texto convertido), "idioma" (o idioma detectado do áudio) e "confiança" (uma pontuação que indica a precisão da transcrição)
Os usuários podem especificar parâmetros como "audio_url" (a URL do arquivo de áudio) e "language" (para indicar o idioma do áudio) Esses parâmetros ajudam a personalizar o processo de transcrição para melhor precisão
Os dados da resposta estão organizados em um formato JSON, com pares de chave-valor representando os resultados da transcrição. Essa estrutura permite uma fácil análise e integração em aplicativos, facilitando processamento ou exibição adicionais
Casos de uso típicos incluem transcrever reuniões gerar legendas para vídeos criar registros escritos de entrevistas e permitir comandos de voz em aplicativos O suporte multilíngue da API aprimora sua utilidade em diversas indústrias
A precisão dos dados é mantida através de algoritmos avançados de reconhecimento de fala e treinamento contínuo em conjuntos de dados diversos Atualizações regulares e verificação de qualidade garantem que a API se adapte a vários sotaques e padrões de fala
Os usuários podem utilizar os dados retornados integrando o texto transcrito em suas aplicações para busca análise ou exibição O formato estruturado permite fácil manipulação como destacar palavras-chave ou gerar resumos
Padrões de dados padrão incluem frases coerentes pontuação e formatação adequada com base no conteúdo falado Os usuários podem esperar variações em comprimento e complexidade dependendo da qualidade do áudio e clareza da fala
Nível de serviço:
100%
Tempo de resposta:
394ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
888ms
Nível de serviço:
100%
Tempo de resposta:
57ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
148ms
Nível de serviço:
100%
Tempo de resposta:
1.277ms
Nível de serviço:
100%
Tempo de resposta:
731ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
0ms
Nível de serviço:
100%
Tempo de resposta:
66ms
Nível de serviço:
100%
Tempo de resposta:
57ms
Nível de serviço:
100%
Tempo de resposta:
58ms
Nível de serviço:
100%
Tempo de resposta:
3.236ms
Nível de serviço:
100%
Tempo de resposta:
8.111ms
Nível de serviço:
100%
Tempo de resposta:
85ms
Nível de serviço:
100%
Tempo de resposta:
140ms
Nível de serviço:
100%
Tempo de resposta:
868ms
Nível de serviço:
100%
Tempo de resposta:
2.120ms
Nível de serviço:
100%
Tempo de resposta:
2.410ms