मेटा ने दुनिया की सबसे बड़ी ओम्नीलिंगुअल स्पीच-टू-टेक्स्ट तकनीक लॉन्च की है, जो 1,600 से ज़्यादा भाषाओं को सपोर्ट करती है। इसमें भारत की कई दुर्लभ बोलियाँ भी शामिल हैं, जो अब तक डिजिटल दुनिया से लगभग ग़ायब थीं।
एक मॉडल, 1,600 भाषाएँ – पहली बार इतना बड़ा कवरेज
मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम पेश किया है। यह 7-बिलियन पैरामीटर वाला मॉडल है, जो 500 से ज़्यादा कम संसाधन वाली भाषाओं को पहली बार एआई के दायरे में लाता है।
78% भाषाओं में चरित्र एरर रेट (CER) 10% से कम हिंदी, तमिल,
बांग्ला से लेकर कुई, छत्तीसगढ़ी,
अवधी तक विविध एक्सेंट्स, बोलचाल की शैली और क्षेत्रीय उच्चारण को समझता है
भारत की ‘भूली-बिसरी’ बोलियाँ अब डिजिटल हो रही हैं
भारत में 22 आधिकारिक भाषाएँ हैं, लेकिन लाखों लोग दुर्लभ बोलियाँ बोलते हैं। मेटा का मॉडल अब इन्हें भी पहचानता है:
ओपन-सोर्स रिलीज़ – डेवलपर्स के लिए नया अवसर
मेटा ने पूरा मॉडल एपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स किया है। साथ में:
- 350 कम संसाधन भाषाओं का नया डेटासेट
- मोज़िला कॉमन वॉइस और लैनफ्रिका के साथ साझेदारी
भारत सरकार की ‘मिशन भाषिणी’ से तालमेल
मेटा का यह कदम सिर्फ़ तकनीकी नहीं, सामाजिक क्रांति है। जब कोई बुजुर्ग अवधी में बोलेगा और उसकी बात डिजिटल रिकॉर्ड में बदल जाएगी – यही है भाषाई समानता की नई शुरुआत