आता AI उलगडणार मोडी लिपीतील दस्तऐवज
हर्षल, तन्वी आणि त्यांच्या सहकाऱ्यांनी मिळून तयार केलेले हे जगातील पहिले कृत्रिम बुद्धीमत्तेचे मॉडेल आहे ज्याने मोडी लिपीचे देवनागरीकरण शक्य झाले आणि त्यांच्या ह्या संशोधनात मला सहभाग देता आला ही माझ्याकरता नुसतीच आनंदाची नाही तर अभिमानाची गोष्ट आहे.
*************साधारण १५-१६ वर्षांपूर्वी जेव्हा मोडी लिपीतल्या अभिलेखांच्या देवनागरीकरणासाठी OCR असलं पाहिजे हा विचार मांडला गेला तेव्हा ती कल्पना अशक्य कोटीतली वाटत होती. तसं वाटण्याचं कारण कोणत्याही मोडी अभ्यासकाला अगदी सहज कळण्यारखं आहे. जितकी मोडी कागदपत्रे तितकेच हस्ताक्षराचे नमुने. एक कागद लिप्यंतर केला म्हणजे आपल्याला मोडी लिपी कळते अश्या आनंदात असताना दुसरा मोडी कागद समोर येतो, तो आपल्या लिप्यंतराच्या ज्ञानाला आव्हान देण्यासाठीच! आधीच मोडी लिपीला भूत लिपी, पिशाच्च लिपी अशी नावं पडलेली. त्यात ती तत्कालिन लेखनिकांच्या शैलीमुळे दुर्बोध आणि कुरूप असल्याच्या अपसमजांत अडकलेली.
अशी ही सुंदर, प्रवाही पण चंचला मोडी लिपी एखाद्या तांत्रिक करामतीने देवनागरीत उलगडू लागेल ही शक्यता धूसर वाटत असतानाच कृत्रिम बुद्धीमत्तेच्या रुपाने जणू एक अदृश्य हातच मदतीसाठी पुढे आला आणि त्या हाताने मदत घेण्यासाठी माझी निवड करावी ह्याचा मला अभिमान आहे.
मागल्या वर्षी CoEP चे अभियंते श्री. हर्षल कौसाडीकर आणि श्रीमती तन्वी काळे ह्यांनी माझ्याशी संपर्क साधला होता. कृत्रिम बुद्धिमत्तेचा वापर करून मोडी अभिलेखांच्या देवनागरीकरणासाठी एक मॉडेल तयार करणे हा त्यांच्या संशोधनाचा विषय होता. ह्या मॉडेलच्या चाचणीकरता नेमका किती डेटा आणि कश्या स्वरुपात हवा आहे हे फोन, गुगल मीट आणि प्रत्यक्ष भेटीतील चर्चांमधून त्यांनी स्पष्ट केलं. त्यानुसार मोडी लिपीमधील प्रत्येक अक्षराचं स्वरुप, कालानुपरत्वे त्यात आलेलं वैविध्य, एका अक्षराचं इतर अक्षरांशी असलेलं तुलनात्मक साम्य अश्या सर्वंकष घटकांचा विचार करून त्यांना हवा असलेला डेटा मी दिला.
ह्या डेटाच्या बऱ्याच चाचण्या घेतल्यानंतर त्यांचा रिसर्च पेपर प्रसिद्ध झाला आणि आता त्याचसोबत त्यांचं कृत्रिम बुद्धिमत्तेचं मॉडेल Hugging Face ह्या मशीन लर्निंग आणि डेटा सायन्स प्लॅटफॉर्मवर त्यांनी उपलब्ध करून दिलं आहे. त्याची लिंक पुढीलप्रमाणे:
https://huggingface.co/datasets/historyHulk/SynthMoDeह्या संशोधनाचा Research paper ची लिंक खाली दिली आहे. तिथे View PDF वर क्लिक केल्यास संपूर्ण पेपर डाऊनलोड करता येईल.
https://arxiv.org/abs/2503.13060ह्या संशोधनासंबंधी बातम्या प्रसिद्ध झाल्या आहेत त्यांच्या लिंक्स:
https://x.com/iitroorkee/status/1946113765294157847https://www.thehindubusinessline.com/business-tech/reviving-the-modi-script/article69366203.ece
https://www.indiatoday.in/education-today/news/story/worlds-first-ai-model-cracks-modi-script-thanks-to-iit-roorkee-2757612-2025-07-18
https://www.ndtv.com/education/iit-roorkee-develops-worlds-first-ai-model-to-transliterate-the-modi-script-8903705
बहुतेक सकाळ वृत्तपत्रातही ही बातमी आली आहे पण त्याची लिंक मला सापडली नाही.
हे मॉडेल जेव्हा परिपूर्ण स्वरुपात मोडी लिपीचं देवनागरीकरण करू लागेल तेव्हा अनेक वर्षे धूळ खात पडून राहिलेल्या मोडी अभिलेखांना वाचा फुटणार आहे. अनेक ऐतिहासिक सत्यं उजेडात येऊ शकतील.
संशोधन म्हटलं म्हणजे नुसतंच यश नसतं. त्यात अनेक त्रुटी असतात, अडथळे असतात. तसंच ह्या संशोधनात हर्षल, तन्वी आणि त्यांच्या सहकाऱ्यांनाही बऱ्याच अडचणी आल्या होत्या, अगदी मनोधैर्यही खचलं पण त्यांनी चिकाटीने आपलं संधोधन सुरू ठेवलं म्हणूनच आज यशस्वीतेचं एक शिखर त्यांनी गाठलं आहे. ही फक्त सुरूवात आहे. अजून त्यांना बराच लांबचा पल्ला गाठायचा आहे. ह्या प्रवासात त्यांना माझी साथ शंभर टक्के मिळणार आहे.