मेटा ने दुनिया की सबसे बड़ी ओम्नीलिंगुअल स्पीच-टू-टेक्स्ट तकनीक लॉन्च की है, जो 1,600 से ज़्यादा भाषाओं को सपोर्ट करती है। इसमें भारत की कई दुर्लभ बोलियाँ भी शामिल हैं, जो अब तक डिजिटल दुनिया से लगभग ग़ायब थीं।
एक मॉडल, 1,600 भाषाएँ – पहली बार इतना बड़ा कवरेज
मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम पेश किया है। यह 7-बिलियन पैरामीटर वाला मॉडल है, जो 500 से ज़्यादा कम संसाधन वाली भाषाओं को पहली बार एआई के दायरे में लाता है।
    78% भाषाओं में चरित्र एरर रेट (CER) 10% से कम हिंदी, तमिल,
    बांग्ला से लेकर कुई, छत्तीसगढ़ी,
    अवधी तक विविध एक्सेंट्स, बोलचाल की शैली और क्षेत्रीय उच्चारण को समझता है
    भारत की ‘भूली-बिसरी’ बोलियाँ अब डिजिटल हो रही हैं
    भारत में 22 आधिकारिक भाषाएँ हैं, लेकिन लाखों लोग दुर्लभ बोलियाँ बोलते हैं। मेटा का मॉडल अब इन्हें भी पहचानता है:
    ओपन-सोर्स रिलीज़ – डेवलपर्स के लिए नया अवसर
    मेटा ने पूरा मॉडल एपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स किया है। साथ में:
    • 350 कम संसाधन भाषाओं का नया डेटासेट
    • मोज़िला कॉमन वॉइस और लैनफ्रिका के साथ साझेदारी

            भारत सरकार की ‘मिशन भाषिणी’ से तालमेल

    मेटा का यह कदम सिर्फ़ तकनीकी नहीं, सामाजिक क्रांति है। जब कोई बुजुर्ग अवधी में बोलेगा और उसकी बात डिजिटल रिकॉर्ड में बदल जाएगी – यही है भाषाई समानता की नई शुरुआत