वॉइस रिकॉग्निशन एपीआई एक शक्तिशाली और सटीक उपकरण है जिसे बोले गए शब्दों को व्यवस्थित पाठ में बदलने के लिए डिज़ाइन किया गया है। उन्नत भाषण पहचान और एआई तकनीक का उपयोग करते हुए, यह विभिन्न उद्योगों और अनुप्रयोगों के लिए उच्च गुणवत्ता वाले ट्रांसक्रिप्शन प्रदान करता है। लाइव भाषण या पूर्व-रिकॉर्डेड ऑडियो फ़ाइलों को संसाधित करते समय, यह एपीआई न्यूनतम त्रुटियों के साथ विश्वसनीय और सटीक रूपांतरण की गारंटी देता है।
इस एपीआई की एक प्रमुख विशेषता इसकी बहुभाषी समर्थन है, जो उपयोगकर्ताओं को कई भाषाओं में ऑडियो का ट्रांसक्रिप्शन करने की अनुमति देती है अत्यधिक सटीकता के साथ। यह सुविधा विभिन्न भाषाओं में ट्रांसक्रिप्शन की आवश्यकता रखने वालों के लिए इसे एक अनिवार्य उपकरण बनाती है।
{"success":true,"audio_file":"https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3","output":{"text":"Ciao a tutti, come state?","result":{"text":"Ciao a tutti, come state?","word_count":5,"vtt":"WEBVTT\n\n00.000 --> 01.860\nCiao a tutti, come state?","words":[{"word":"Ciao","start":0,"end":0.23999999463558197},{"word":"a","start":0.23999999463558197,"end":0.4000000059604645},{"word":"tutti,","start":0.4000000059604645,"end":1.0800000429153442},{"word":"come","start":1.0800000429153442,"end":1.2799999713897705},{"word":"state?","start":1.2799999713897705,"end":1.8600000143051147}]}}}
curl --location --request POST 'https://zylalabs.com/api/6370/voice+recognition+api/9135/audio+to+text?url=https://s33.aconvert.com/convert/p3r68-cdx67/fx4z0-q5m8m.mp3' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
वॉयस मान्यता एपीआई प्रदान किए गए ऑडियो फ़ाइल से लिप्यांकीत पाठ लौटाता है आउटपुट में मान्यता प्राप्त भाषण शामिल होता है जिसे संरचित पाठ प्रारूप में परिवर्तित किया जाता है जिससे उपयोगकर्ता बोले गए सामग्री को आसानी से एक्सेस और उपयोग कर सकें
प्रतिक्रिया डेटा में आमतौर पर "ट्रांसक्रिप्शन" (परिवर्तित पाठ), "भाषा" (ऑडियो की पहचान की गई भाषा), और "विश्वास" (ट्रांसक्रिप्शन की सटीकता को दर्शाने वाला स्कोर) जैसे फ़ील्ड शामिल होते हैं
उपयोगकर्ता "audio_url" (ऑडियो फ़ाइल का यूआरएल) और "language" (ऑडियो की भाषा को दर्शाने के लिए) जैसे पैरामीटर निर्दिष्ट कर सकते हैं इन पैरामीटर्स से ट्रांसक्रिप्शन प्रक्रिया को बेहतर सटीकता के लिए अनुकूलित करने में मदद मिलती है
उत्तर डेटा JSON प्रारूप में व्यवस्थित है जिसमें कुंजी-मूल्य जोड़ होते हैं जो अनुलेखन परिणामों का प्रतिनिधित्व करते हैं यह संरचना आसान पार्सिंग और अनुप्रयोगों में एकीकरण की अनुमति देती है जिससे आगे की प्रसंस्करण या प्रदर्शन सुगम होता है
परंपरागत उपयोग के मामले में बैठकें लिखना वीडियो के लिए उपशीर्षक उत्पन्न करना साक्षात्कारों का लिखित रिकॉर्ड बनाना और अनुप्रयोगों में.voice कमांड सक्षम करना शामिल है API की बहुभाषी समर्थन इसकी विभिन्न उद्योगों में उपयोगिता को बढ़ाता है
डेटा की सटीकता उन्नत भाषण मान्यता एल्गोरिदम और विविध डेटा सेटों पर लगातार प्रशिक्षण के माध्यम से बनाए रखी जाती है नियमित अपडेट और गुणवत्ता जांच सुनिश्चित करती हैं कि एपीआई विभिन्न लहजों और भाषण पैटर्न के साथ अनुकूलित होता है
उपयोगकर्ता खोजने की क्षमता, विश्लेषण या प्रदर्शन के लिए ट्रांसक्राइब किए गए पाठ को अपने अनुप्रयोगों में एकीकृत करके लौटाए गए डेटा का उपयोग कर सकते हैं संरचित प्रारूप आसान हेरफेर की अनुमति देता है जैसे कि कीवर्ड को उजागर करना या सारांश उत्पन्न करना
मानक डेटा पैटर्न में संगत वाक्य, विराम चिह्न और बोले गए सामग्री के आधार पर सही प्रारूपण शामिल होते हैं उपयोगकर्ता ऑडियो की गुणवत्ता और भाषण की स्पष्टता के आधार पर लंबाई और जटिलता में भिन्नताएँ अनुभव कर सकते हैं
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,503ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
426ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
883ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
558ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
17,611ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,494ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
13,713ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
816ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
148ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
319ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,896ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
18ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
8,257ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
11,896ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
9,542ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,445ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
20ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
16ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
20ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,094ms