GPU-सहायता प्राप्त पूर्वानुमान के लिए API जो कई AI मॉडलों के लिए प्रदान की जाती है जिसमें वाणी से पाठ ट्रांसक्रिप्शन पाठ से छवि उत्पन्न करना पाठ से वाणी संश्लेषण बड़े भाषा मॉडल चैट पाठ एम्बेडिंग दृश्य और OCR संगीत उत्पादन और ध्वनि प्रभाव उत्पादन शामिल हैं
ok
curl --location --request GET 'https://zylalabs.com/api/12946/mastera+ai+gpu+inference+api/25846/health+check' --header 'Authorization: Bearer YOUR_API_KEY'
{"object":"list","data":[
{"id":"qwen3-coder-30b","object":"model","owned_by":"mastera-ai"},
{"id":"qwen2.5-vl-7b","object":"model","owned_by":"mastera-ai"},
{"id":"whisper-large-v3","object":"model","owned_by":"mastera-ai"},
{"id":"flux-schnell","object":"model","owned_by":"mastera-ai"},
{"id":"xtts-v2","object":"model","owned_by":"mastera-ai"},
{"id":"bge-m3","object":"model","owned_by":"mastera-ai"},
{"id":"musicgen-medium","object":"model","owned_by":"mastera-ai"},
{"id":"stable-audio-open","object":"model","owned_by":"mastera-ai"}
]}
curl --location --request GET 'https://zylalabs.com/api/12946/mastera+ai+gpu+inference+api/25847/list+available+models' --header 'Authorization: Bearer YOUR_API_KEY'
साइन अप करने के बाद, प्रत्येक डेवलपर को एक पर्सनल API एक्सेस की असाइन की जाती है, जो अक्षरों और अंकों का एक यूनिक संयोजन होता है, जिसका उपयोग हमारे API एंडपॉइंट तक पहुंचने के लिए किया जाता है। प्रमाणीकरण के लिए मास्टरए एआई जीपीयू इनफेरेंस API के साथ बस अपने बेयरर टोकन को Authorization हेडर में शामिल करें।
| हेडर | विवरण |
|---|---|
Authorization
|
आवश्यक
होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें।
|
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
(वार्षिक बिलिंग के साथ 2 महीने बचाएँ 🎉)
अग्रणी कंपनियों का भरोसा
यह एपीआई एकल एन्डपॉइंट और प्रमाणीकरण कुंजी के माध्यम से कई एआई निष्कर्षण मॉडलों तक पहुँच प्रदान करता है
उपलब्ध मॉडल:
स्पीच और ऑडियो
- व्हिस्पर लार्ज-वी3: भाषण से पाठ रूपांतरण, 100+ भाषाओं का समर्थन करता है। WAV, MP3, M4A, OGG, FLAC प्रारूप स्वीकार करता है
- XTTS-v2: आवाज क्लोनिंग के साथ पाठ से भाषण संश्लेषण। 17 भाषाओं का समर्थन करता है
- म्यूजिकजेन मीडियम: पाठ विवरणों से संगीत का निर्माण। आउटपुट 30 सेकंड तक
- स्टेबल ऑडियो ओपन: पाठ संकेतों से ध्वनि प्रभाव और वातावरण ऑडियो निर्माण। आउटकम 47 सेकंड तक
छवि निर्माण
- फ्लक्स.1-श्नेल: 2048x2048px तक पाठ से छवि निर्माण
- SDXL टर्बो FP8: 1024x1024px तक तेज पाठ से छवि निर्माण
भाषा मॉडल
- क्यूवेन3-कोडर 30B: कोड निर्माण और चैट पूर्णता। 128K संदर्भ विंडो। OpenAI-संगत एन्डपॉइंट
- क्यूवेन2.5-VL 7B: छवि विश्लेषण, OCR, और दृश्य प्रश्न उत्तर के लिए दृष्टि-भाषा मॉडल
एंबेडिंग
- BGE-M3: बहुभाषी पाठ एंबेडिंग (1024 आयाम, 100+ भाषाएँ)। यह nomic-embed-text का भी समर्थन करता है
वीडियो निर्माण (जल्द ही आ रहा है)
- Wan2.1-1.3B: पाठ से वीडियो और छवि से वीडियो निर्माण
- Wan2.1-14B INT4: उच्च गुणवत्ता वाला पाठ से वीडियो निर्माण
सभी मॉडल एकल एपीआई कुंजी के माध्यम से उपलब्ध हैं जो OpenAI-संगत अनुरोध प्रारूप का उपयोग करते हैं जहां लागू हो
प्रत्येक एंडपॉइंट अपनी कार्यक्षमता के आधार पर विशिष्ट डेटा प्रकार लौटाता है उदाहरण के लिए स्पीच ट्रांसक्रिप्शन एंडपॉइंट ट्रांसक्राइब किया गया टेक्स्ट और भाषा पहचान लौटाता है जबकि इमेज जेनरेशन एंडपॉइंट उत्पन्न छवियों के यूआरएल लौटाता है ऑडियो से संबंधित एंडपॉइंट बाइनरी ऑडियो डेटा WAV फॉर्मेट में लौटाते हैं
मुख्य क्षेत्रों में एंडपॉइंट के अनुसार भिन्नता होती है। स्पीच ट्रांसक्रिप्शन के लिए, क्षेत्रों में "पाठ", "भाषा" और "अवधि_सेकंड" शामिल हैं। इमेज जनरेशन एंडपॉइंट में "छवियाँ" होती हैं जिनमें "यूआरएल" और "फाइलनाम" शामिल हैं। प्रत्येक एंडपॉइंट की प्रतिक्रिया संरचना इसके विशेष कार्यक्षमता के अनुसार तैयार की गई है
पैरामीटर अंत बिंदु पर निर्भर करते हैं उदाहरण के लिए स्पीच ट्रांसक्रिप्शन अंत बिंदु ऑडियो फ़ाइल प्रारूप (WAV MP3 आदि) स्वीकार करता है जबकि इमेज जनरेशन अंत बिंदु को एक टेक्स्ट प्रॉम्प्ट की आवश्यकता होती है उपयोगकर्ता अनुरोधों को कस्टमाइज़ कर सकते हैं द्वारा प्रदान की गई विशेष इनपुट डेटा जिसे मॉडल का उपयोग किया जा रहा है
प्रतिक्रिया डेटा JSON प्रारूप में व्यवस्थित किया गया है जिसमें प्रत्येक एंडपॉइंट के लिए प्रासंगिक संरचित क्षेत्रों होते हैं उदाहरण के लिए कोड जनरेशन एंडपॉइंट "id" "object" "model" और "choices" एरे लौटाता है जिसमें उत्पन्न प्रतिक्रिया होती है यह संरचना आसान पार्सिंग और उपयोग की अनुमति देती है
प्रत्येक एंडपॉइंट विशिष्ट जानकारी प्रदान करता है उदाहरण के लिए म्यूजिक जनरेशन एंडपॉइंट पाठ विवरण के आधार पर मूल संगीत प्रदान करता है जबकि इमेज एनालिसिस एंडपॉइंट छवियों से अंतर्दृष्टि प्रदान करता है जिसमें ओसीआर और दृश्य प्रश्न उत्तर शामिल हैं प्रत्येक अद्वितीय उपयोग मामलों की सेवा करता है
उपयोगकर्ता संबंधित फ़ील्ड निकालने के लिए JSON प्रतिक्रिया को पार्स करके लौटाई गई डेटा का उपयोग कर सकते हैं उदाहरण के लिए, इमेज जनरेशन प्रतिक्रिया में, उपयोगकर्ता बनाए गए चित्र को प्रदर्शित करने के लिए "url" तक पहुँच सकते हैं संरचना को समझना API के आउटपुट को अनुप्रयोगों में एकीकृत करने में मदद करता है
विशिष्ट उपयोग के मामले में पहुंच के लिए ऑडियो का ट्रांसक्रिप्शन करना रचनात्मक परियोजनाओं के लिए चित्र उत्पन्न करना और मीडिया उत्पादन के लिए संगीत बनाना शामिल हैं प्रत्येक मॉडल विशेष जरूरतों को पूरा करता है जैसे चैट के माध्यम से उपयोगकर्ता इंटरैक्शन को बढ़ाना या खेलों के लिए ध्वनि प्रभाव प्रदान करना
डेटा सटीकता निरंतर मॉडल प्रशिक्षण और अपडेट के माध्यम से बनाए रखी जाती है एपीआई उन्नत एआई मॉडलों का लाभ उठाता है जो नियमित रूप से उपयोगकर्ता प्रतिक्रिया और प्रदर्शन मैट्रिक्स के आधार पर परिशोधित होते हैं यह विभिन्न कार्यों में उच्च गुणवत्ता वाले आउटपुट सुनिश्चित करता है ट्रांसक्रिप्शन से लेकर छवि जनरेशन तक