कुशल मिलान समानता एपीआई वास्तविक दुनिया के अव्यवस्थित डेटा के लिए निर्मित एक उच्च-गति धुंधला मिलान और डुप्लीकेशन एपीआई है यह आपको लगभग समान रिकॉर्ड पहचानने और संस्थाओं को मिलाने में मदद करता है भले ही मान बिल्कुल मेल न खाएं—टाइपो, केस भिन्नताएँ, लापता विराम चिह्न, स्पेसिंग मुद्दे, संक्षेपण और छोटे शब्द क्रम परिवर्तन।
अपनी खुद की धुंधली मिलान पाइपलाइन बनाने और ट्यून करने के बजाय आप अपने स्ट्रिंग (या रिकॉर्ड) एपीआई को भेजते हैं और आपको समानता-संख्यांकित मिलान प्राप्त होते हैं जिन पर आप भरोसा कर सकते हैं सामान्य आउटपुट में मेल खाती जोड़ी (जैसे, “सेब” ↔ “एप्पल इंक।”), समानता स्कोर और संरचित परिणाम होते हैं जिन्हें डेटा सफाई कार्यप्रवाह, सीआरएम, ईटीएल नौकरी और विश्लेषिकी पाइपलाइनों में लगाना आसान होता है।
सामान्य उपयोग के मामले:
सूची को डुप्लीकेट करें: एक डेटा सेट के अंदर डुप्लिकेट खोजें (सबसे सभी मिलान) और संभावित डुप्लिकेट पेयर लौटाएं।
मास्टर सूची के खिलाफ मिलान करें: एक आने वाली सूची को एक मानक सेट से मिलाएं (सूची-से-मास्टर)।
सीआरएम और ग्राहक डेटा स्वच्छता: ऐसे लीड/खाते/कंपनियों को साफ करें जहां डुप्लिकेट रिपोर्टिंग और आउटरीच को तोड़ते हैं।
संस्थान समाधान और रिकॉर्ड लिंकिंग: स्रोतों में एक ही वास्तविक दुनिया की संस्था के संदर्भों को जोड़ें।
टीमें इसका उपयोग क्यों करती हैं:
बॉक्स से बाहर अव्यवस्थित पाठ पर काम करता है (हर एज केस के लिए कोई मैनुअल नियम नहीं)
रैंकिंग और थ्रेशोल्ड के लिए समानता स्कोर (आप चुनते हैं कि कितने सख्त होना है)
स्केल और स्वचालन के लिए बनाया गया (पाइपलाइनों में चलाने के लिए डिज़ाइन किया गया है, सिर्फ एक बार के स्क्रिप्ट के लिए नहीं)
{"status":"success","response_data":[["Apple","appl!e",1.0]]}
curl --location --request POST 'https://zylalabs.com/api/11918/efficient+matching+similarity+api/22651/dedupe?data=["Apple", "appl!e"]' --header 'Authorization: Bearer YOUR_API_KEY'
| हेडर | विवरण |
|---|---|
Authorization
|
[आवश्यक] होना चाहिए Bearer access_key. जब आप सब्सक्राइब हों तो ऊपर "Your API Access Key" देखें। |
कोई लंबी अवधि की प्रतिबद्धता नहीं। कभी भी अपग्रेड, डाउनग्रेड या कैंसल करें। फ्री ट्रायल में 50 रिक्वेस्ट तक शामिल हैं।
डिडुप एンドपॉइंट एक JSON ऑब्जेक्ट लौटाता है जिसमें मेल खाने वाले स्ट्रिंग्स के जोड़े, समानता स्कोर और वैकल्पिक डिडुप्लिकेटेड परिणाम होते हैं आउटपुट को स्ट्रिंग जोड़ों, इंडेक्स जोड़ों या डिडुप्लिकेटेड स्ट्रिंग्स के रूप में प्रारूपित किया जा सकता है जो निर्धारित कॉन्फ़िगरेशन के आधार पर है
प्रतिक्रिया डेटा में मुख्य क्षेत्रों में "स्थिति" शामिल है (जो सफलता या त्रुटि को दर्शाता है) और "प्रतिक्रिया_डेटा," जिसमें उपयोगकर्ता के अनुरोध के अनुसार स्वरूपित परिणाम होते हैं, जैसे मेल खाते जोड़े या डिडुप्लिकेट की गई स्ट्रिंग्स
उपयोगकर्ता "config" ऑब्जेक्ट में पैरामीटर्स को समायोजित करके अनुरोधों को अनुकूलित कर सकते हैं जैसे "similarity_threshold" मिलान की कठोरता के लिए "remove_punctuation" पूर्व-प्रसंस्करण के लिए और "output_format" वांछित परिणाम संरचना चुनने के लिए
प्रतिक्रिया डेटा परिणामों के एक एल्गो में व्यवस्थित है जहां प्रत्येक प्रविष्टि एक मैच या डिडुप्लिकेटेड स्ट्रिंग के अनुसार होती है आउटपुट प्रारूप के आधार पर प्रविष्टियों में मूल स्ट्रिंग्स अनुक्रमांक और समानता स्कोर शामिल हो सकते हैं जो वर्कफ़्लोज़ में आसान एकीकरण की सुविधा प्रदान करते हैं
प्रमुख उपयोग के मामलों में ग्राहक सूचियों को डिडुप्लिकेट करना मुख्य सूची के खिलाफ रिकॉर्ड का मिलान करना CRM डेटा को साफ करना और विभिन्न डेटा स्रोतों में एंटिटी समाधान करना शामिल है ताकि डेटा की अखंडता और सटीकता सुनिश्चित की जा सके
डेटा की सटीकता उन्नत फजी मिलान एल्गोरिदम के माध्यम से बनाए रखी जाती है जो टाइपो और केस में भिन्नताओं जैसी सामान्य डेटा समस्याओं को ध्यान में रखती है एपीआई को गंदे डेटा को प्रभावी ढंग से संभालने के लिए डिज़ाइन किया गया है जिससे विश्वसनीय मिलान परिणाम सुनिश्चित होते हैं
स्वीकृत पैरामीटर मानों में "similarity_threshold" (0 से 1), "remove_punctuation" (बूलियन), "to_lowercase" (बूलियन), "use_token_sort" (बूलियन), और "top_k" (पूर्णांक या "all") शामिल हैं ये पैरामीटर उपयोगकर्ताओं को उनकी विशिष्ट आवश्यकताओं के अनुसार मिलान प्रक्रिया को अनुकूलित करने की अनुमति देते हैं
यदि डिडुप्लीकेट एंडपॉइंट आंशिक या खाली परिणाम लौटाता है तो उपयोगकर्ताओं को गुणवत्ता समस्याओं जैसे अधिक डुप्लिकेट या बहुत कम समानता थ्रेशोल्ड के लिए इनपुट डेटा की जांच करनी चाहिए "समानता_थ्रेशोल्ड" को समायोजित करना या इनपुट सूची की समीक्षा करना परिणामों में सुधार करने में मदद कर सकता है
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
22ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
417ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,815ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
108ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
6,721ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
634ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
167ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
1,062ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
575ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
291ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,598ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
6,456ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,124ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
983ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,801ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,183ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
4,733ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
3,284ms
सर्विस लेवल:
50%
रिस्पॉन्स टाइम:
1,703ms
सर्विस लेवल:
100%
रिस्पॉन्स टाइम:
2,896ms