अभिजात मराठी भाषा सप्ताह – २०२५ च्या निमित्ताने : ऑनलाईन मराठीची स्थिती व गती
४ ऑक्टोबर २०२५ रोजी मराठी भाषा विभाग, महाराष्ट्र शासनाच्या वतीने “ऑनलाईन मराठी : स्थिती व गती” या विषयावर एक महत्त्वपूर्ण परिसंवाद आयोजित करण्यात आला. हा कार्यक्रम प्रतिष्ठित पु. ल. देशपांडे कला अकादमी, प्रभादेवी, मुंबई येथे पार पडला.

मा. उद्योग व मराठी भाषा मंत्री डॉ. उदयजी सामंत, मराठी भाषा विभाग सचिव मा. डॉ. किरणजी कुलकर्णी, सहसचिव मा. डॉ. नामदेवजी भोसले आणि इतर मान्यवरांच्या उपस्थितीत हा परिसंवाद झाला.
या परिसंवादाचे अध्यक्षपद माधुरी यादवडकर यांनी भूषविले. तर श्रीमती मंजुषा वैद्य, प्रसाद शिरगावकर, श्रीपाद ब्रह्मे, संजय देशपांडे, सुनील खांडबहाले, निलेश छडविलकर, चिन्मय गव्हाणकर या तज्ज्ञ विचारवंतांनी परिसंवादात मते व्यक्त केली. मला या थोर व्यक्तीं सोबत एकाच व्यासपीठावर बोलण्याचा सन्मान लाभला, ही माझ्यासाठी मोठी अभिमानाची गोष्ट होती.
माझ्या मांडणीतील काही मुद्दे
स्थिती:
- २०११ च्या जनगणनेनुसार भारतात मराठी भाषिकांची संख्या ८.३ कोटी तर एथनोलॉग्ज २०२४ अहवालानुसार जागतिक मराठी भाषिक ९.३ कोटी आहे.
- IAMAI (२०२४) च्या अहवालानुसार ५७% भारतीय इंटरनेट वापरकर्ते स्वतःच्या भाषेत माहिती पाहू इच्छितात, परंतु मराठीचा रूपांतरण दर (conversion ratio) अत्यंत कमी आहे.
- W3Tech (२०२४) नुसार इंटरनेटवरील एकूण माहितीमध्ये मराठी फक्त ०.१% आहे. म्हणजे मागणी आणि पुरवठा यामध्ये प्रचंड तफावत आहे.
- एक मोठे कारण म्हणजे मराठी भाषेतील डेटामध्ये आंतरराष्ट्रीय मानकांनुसार मेटाडेटा नसणे आणि खुले डेटासेट्सची टंचाई.
संधी:
- ITU, Statista आणि DataReportal (२०२४) नुसार जगातील तब्बल ५.५ अब्ज लोक इंटरनेट वापरतात. भारतात हा आकडा ९५ कोटी ते १ अब्ज इतका आहे (PIB, २०२४).
- हीच वेळ आहे मराठी भाषेला डिजिटल व ए.आय. युगात पुढे नेण्याची.
- मराठी सामग्रीचे विविध कॉर्पस, तांत्रिक मानकांनुसार डेटासेट्स आणि ओपन सोर्स संसाधने निर्माण करून आपण भविष्यकालीन तंत्रज्ञानात मराठीला अग्रस्थानी ठेवू शकतो.
दिशा/गती:
- मराठी डिजिटल कॉर्पस व खुले डेटासेट तयार करणे.
- मेटाडेटा वापराबाबत जनजागृती करणे.
- ASR (Speech Recognition), TTS (Text-to-Speech), NLP (Natural Language Processing) यासाठी दर्जेदार प्रशिक्षण डेटा निर्माण करणे.
- विद्यार्थी, शैक्षणिक संस्था, स्टार्टअप्स, टेक कंपन्यांना यासाठी प्रोत्साहित करणे.
- लोकसहभागातून LLMs (Large Language Models) प्रशिक्षणासाठी मुक्त व दर्जेदार मराठी माहितीची निर्मिती.
माझे चिंतन
आजपर्यंत आपण “लोकांपर्यंत मराठी माहिती पोहोचवण्यासाठी” प्रयत्न केले, पण आता परिस्थिती वेगळी आहे. कृत्रिम बुद्धिमत्तेच्या युगात फक्त लोकांपर्यंत नव्हे तर “यंत्रांपर्यंत मराठी भाषा पोहोचवणे” ही गरज आहे.
माणसांनी संगणक निर्माण केले, आणि आता संगणकच संगणक तयार करत आहेत — हे ए.आय. युगाचे वास्तव आहे. त्यामुळे आपण जर मराठीला पुढील शतकात अधिक सक्षम ठेवू इच्छितो, तर पहिला टप्पा म्हणजे — विविध विषयांवरील मराठी माहितीचे डिजिटल कॉर्पस तयार करणे, योग्य मेटाडेटासह सादर करणे आणि ए.आय. प्रशिक्षणासाठी उपलब्ध करून देणे.
कृतज्ञता व आवाहन

या महत्त्वपूर्ण कार्यक्रमाचे आयोजन केल्याबद्दल मी मराठी भाषा विभाग, महाराष्ट्र शासनाचे मनःपूर्वक आभार मानतो. मा. मंत्री, मा. सचिव आणि उपस्थित सर्व मान्यवरांनी दिलेली प्रेरणा माझ्यासाठी ऊर्जा आहे.
माझी विनंती अशीच आहे की — या प्रयत्नात शासन, संशोधक, शैक्षणिक संस्था, स्टार्टअप्स, टेक कंपन्या आणि सर्वसामान्य नागरिकांनी हातभार लावावा. आपण सर्व मिळून “मराठीला डिजिटल विश्वात आणि ए.आय.च्या युगात अग्रस्थानी” नेऊ शकतो.
मराठी भाषेच्या या प्रवासात मी कायम उपायाचा भाग राहिलो आहे आणि पुढेही राहीन, ही माझी बांधिलकी आहे.
—
सुनील खांडबहाले
उद्योजक | संशोधक | भाषातंत्रज्ञान क्षेत्रातील प्रयोगकर्ता

