API que fornece inferência acelerada por GPU para múltiplos modelos de IA, incluindo transcrição de fala para texto, geração de texto para imagem, síntese de texto para fala, chat com modelo de linguagem grande, embeddings de texto, visão e OCR, geração de música e geração de efeitos sonoros
ok
curl --location --request GET 'https://zylalabs.com/api/12946/mastera+ai+gpu+inference+api/25846/health+check' --header 'Authorization: Bearer YOUR_API_KEY'
{"object":"list","data":[
{"id":"qwen3-coder-30b","object":"model","owned_by":"mastera-ai"},
{"id":"qwen2.5-vl-7b","object":"model","owned_by":"mastera-ai"},
{"id":"whisper-large-v3","object":"model","owned_by":"mastera-ai"},
{"id":"flux-schnell","object":"model","owned_by":"mastera-ai"},
{"id":"xtts-v2","object":"model","owned_by":"mastera-ai"},
{"id":"bge-m3","object":"model","owned_by":"mastera-ai"},
{"id":"musicgen-medium","object":"model","owned_by":"mastera-ai"},
{"id":"stable-audio-open","object":"model","owned_by":"mastera-ai"}
]}
curl --location --request GET 'https://zylalabs.com/api/12946/mastera+ai+gpu+inference+api/25847/list+available+models' --header 'Authorization: Bearer YOUR_API_KEY'
Após se cadastrar, cada desenvolvedor recebe uma chave de acesso à API pessoal, uma combinação única de letras e dígitos para acessar nosso endpoint de API. Para autenticar com a MasterA AI GPU Inferência API basta incluir seu token Bearer no cabeçalho Authorization.
| Cabeçalho | Descrição |
|---|---|
Authorization
|
Obrigatório
Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito.
|
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
(Economize 2 meses com cobrança anual 🎉)
Empresas líderes confiam em nós
Esta API fornece acesso a múltiplos modelos de inferência de IA por meio de
um único endpoint e chave de autenticação.
Modelos disponíveis:
Fala e Áudio
- Whisper large-v3: Transcrição de fala para texto suportando
mais de 100 idiomas. Aceita formatos WAV, MP3, M4A, OGG, FLAC.
- XTTS-v2: Síntese de texto para fala com clonagem de voz.
Suporta 17 idiomas.
- MusicGen Medium: Geração de música a partir de descrições textuais.
Saída de até 30 segundos.
- Stable Audio Open: Geração de efeitos sonoros e áudio ambiente
a partir de prompts de texto. Saída de até 47 segundos.
Geração de Imagem
- Flux.1-Schnell: Geração de texto para imagem de até 2048x2048px.
- SDXL Turbo FP8: Geração rápida de texto para imagem de até 1024x1024px.
Modelos de Linguagem
- Qwen3-Coder 30B: Geração de código e conclusão de chat.
Janela de contexto de 128K. Endpoint compatível com OpenAI.
- Qwen2.5-VL 7B: Modelo de linguagem-visual para análise de imagem,
OCR e resposta a perguntas visuais.
Embeddings
- BGE-M3: Embeddings de texto multilíngues (1024 dimensões,
mais de 100 idiomas). Também suporta nomic-embed-text.
Geração de Vídeo (em breve)
- Wan2.1-1.3B: Geração de texto para vídeo e imagem para vídeo.
- Wan2.1-14B INT4: Geração de vídeo de texto de alta qualidade.
Todos os modelos são acessíveis através de uma única chave de API usando
formato de solicitação compatível com OpenAI onde aplicável.
Cada endpoint retorna tipos de dados específicos com base em sua função Por exemplo o endpoint de Transcrição de Fala retorna texto transcrito e detecção de idioma enquanto o endpoint de Geração de Imagem retorna URLs de imagens geradas Endpoints relacionados a áudio retornam dados de áudio binário no formato WAV
Os campos chave variam de acordo com o endpoint. Para Transcrição de Fala, os campos incluem "texto", "idioma" e "duração_segundos". O endpoint de Geração de Imagens inclui "imagens" com "url" e "nome_do_arquivo". A estrutura da resposta de cada endpoint é adaptada à sua funcionalidade específica
Os parâmetros dependem do ponto de extremidade Por exemplo o ponto de extremidade de Transcrição de Fala aceita formatos de arquivo de áudio WAV MP3 etc enquanto o ponto de extremidade de Geração de Imagem requer um prompt de texto Os usuários podem personalizar solicitações fornecendo dados de entrada específicos relevantes ao modelo sendo utilizado
Os dados de resposta são organizados em formato JSON, com campos estruturados relevantes para cada endpoint. Por exemplo, o endpoint de Geração de Código retorna um "id", "objeto", "modelo" e um array de "escolhas" contendo a resposta gerada. Essa estrutura permite uma fácil análise e utilização
Cada ponto final oferece informações distintas Por exemplo o ponto final de Geração de Música oferece música original com base em descrições de texto enquanto o ponto final de Análise de Imagens fornece insights a partir de imagens incluindo OCR e resposta a perguntas visuais Cada um serve a casos de uso únicos
Os usuários podem utilizar os dados retornados analisando a resposta JSON para extrair campos relevantes Por exemplo na resposta de Geração de Imagens os usuários podem acessar a "url" para exibir a imagem gerada Compreender a estrutura ajuda na integração da saída da API em aplicações
Casos de uso típicos incluem transcrever áudio para acessibilidade gerar imagens para projetos criativos e criar música para produção de mídia Cada modelo atende necessidades específicas como melhorar a interação do usuário por meio de bate-papo ou fornecer efeitos sonoros para jogos
A precisão dos dados é mantida por meio de treinamento e atualizações contínuas do modelo A API aproveita modelos de inteligência artificial avançados que são regularmente refinados com base no feedback dos usuários e métricas de desempenho Isso garante saídas de alta qualidade em várias tarefas desde transcrição até geração de imagens