मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं

मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) नामक एक क्रांतिकारी ओपन-सोर्स सिस्टम लॉन्च किया है, जो 1,600 से अधिक भाषाओं में स्पीच-टू-टेक्स्ट ट्रांसक्रिप्शन प्रदान करता है। इसमें 500 से अधिक कम संसाधन वाली भाषाएँ शामिल हैं, जो पहले कभी एआई द्वारा ट्रांसक्राइब नहीं की गईं। भारतीय संदर्भ में, यह मॉडल हिंदी, मराठी, मलयालम, तेलुगु, ओडिया, पंजाबी, उर्दू के अलावा दुर्लभ बोलियों जैसे कुई, छत्तीसगढ़ी, मैथिली, बघेली, महासू पहाड़ी, अवधी और राजबंशी को भी सपोर्ट करता है। यह 7-बिलियन पैरामीटर वाला मॉडल विविध एक्सेंट्स, डायलेक्ट्स और स्पीच पैटर्न्स पर ट्रेन किया गया है, जिसकी चरित्र एरर रेट (CER) 78% भाषाओं में 10% से कम है। मेटा ने मोज़िला फाउंडेशन के कॉमन वॉइस और लैनफ्रिका जैसे पार्टनर्स के साथ 350 कम संसाधन वाली भाषाओं का डेटासेट भी रिलीज़ किया है, जो एपाचे 2.0 लाइसेंस के तहत उपलब्ध है। यह कदम वैश्विक एआई समावेशिता को बढ़ावा देता है, खासकर भारत में मिशन भाषिणी जैसी पहलों के साथ तालमेल बिठाते हुए।

Web Desk
Web Desk Verified Media or Organization • 11 Jun, 2026 Sub Editor
November 11, 2025 • 7:42 PM  19
अंतर्राष्ट्रीय
NEWS CARD
Logo
मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं
“मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं”
Favicon
Read more on thekhatak.com
11 Nov 2025
https://thekhatak.com/meta-speech-to-text-ai-1600-languages-rare-indian-dialects
Google News
Copied
मेटा के नए स्पीच-टू-टेक्स्ट एआई मॉडल्स 1,600 भाषाओं को कवर करते हैं, जिसमें दुर्लभ भारतीय बोलियाँ भी शामिल हैं
मेटा ने दुनिया की सबसे बड़ी ओम्नीलिंगुअल स्पीच-टू-टेक्स्ट तकनीक लॉन्च की है, जो 1,600 से ज़्यादा भाषाओं को सपोर्ट करती है। इसमें भारत की कई दुर्लभ बोलियाँ भी शामिल हैं, जो अब तक डिजिटल दुनिया से लगभग ग़ायब थीं।
एक मॉडल, 1,600 भाषाएँ – पहली बार इतना बड़ा कवरेज
मेटा की फंडामेंटल एआई रिसर्च (FAIR) टीम ने ओम्नीलिंगुअल ऑटोमैटिक स्पीच रिकग्निशन (ASR) सिस्टम पेश किया है। यह 7-बिलियन पैरामीटर वाला मॉडल है, जो 500 से ज़्यादा कम संसाधन वाली भाषाओं को पहली बार एआई के दायरे में लाता है।
    78% भाषाओं में चरित्र एरर रेट (CER) 10% से कम हिंदी, तमिल,
    बांग्ला से लेकर कुई, छत्तीसगढ़ी,
    अवधी तक विविध एक्सेंट्स, बोलचाल की शैली और क्षेत्रीय उच्चारण को समझता है
    भारत की ‘भूली-बिसरी’ बोलियाँ अब डिजिटल हो रही हैं
    भारत में 22 आधिकारिक भाषाएँ हैं, लेकिन लाखों लोग दुर्लभ बोलियाँ बोलते हैं। मेटा का मॉडल अब इन्हें भी पहचानता है:
    ओपन-सोर्स रिलीज़ – डेवलपर्स के लिए नया अवसर
    मेटा ने पूरा मॉडल एपाचे 2.0 लाइसेंस के तहत ओपन-सोर्स किया है। साथ में:
    • 350 कम संसाधन भाषाओं का नया डेटासेट
    • मोज़िला कॉमन वॉइस और लैनफ्रिका के साथ साझेदारी

            भारत सरकार की ‘मिशन भाषिणी’ से तालमेल

    मेटा का यह कदम सिर्फ़ तकनीकी नहीं, सामाजिक क्रांति है। जब कोई बुजुर्ग अवधी में बोलेगा और उसकी बात डिजिटल रिकॉर्ड में बदल जाएगी – यही है भाषाई समानता की नई शुरुआत

    Web Desk Verified Media or Organization • 11 Jun, 2026 Sub Editor

    Web Desk The Khatak

    Digital Archives

    home Home amp_stories Web Stories local_fire_department Trending play_circle Videos mark_email_unread Newsletter