শিরোনাম
প্রকাশ : শনিবার, ২৯ ফেব্রুয়ারি, ২০২০ ০০:০০ টা
আপলোড : ২৮ ফেব্রুয়ারি, ২০২০ ২১:২৫

গবেষণা

অন্যরকম ডিজিটাল ভাষিক রিসোর্স

বাংলাদেশের সাঁওতাল ও কুড়ু খভাষী তরুণদের হাত ধরে নির্মিত হচ্ছে দক্ষিণ এশিয়ার সর্ববৃহৎ ডিজিটাল ভাষিক রিসোর্স। সাঁওতালি ইউনিকোড টাইপিং সফটওয়্যারের নির্মাতা সমর এম সরেনের উদ্যোগেই এই রিসোর্স নির্মাণের কাজ শুরু হয়েছে।

জয়শ্রী ভাদুড়ী

অন্যরকম ডিজিটাল ভাষিক রিসোর্স

দেশের সাঁওতাল ও কুড়ুখভাষী তরুণদের হাতে নির্মিত হচ্ছে দক্ষিণ এশিয়ার সর্ববৃহৎ ডিজিটাল ভাষিক রিসোর্স। সাঁওতালি ইউনিকোড টাইপিং সফটওয়্যারের নির্মাতা সমর এম সরেনের উদ্যোগে এই রিসোর্স নির্মাণের কাজ শুরু হয়েছে। তার কাজে এগিয়ে এসেছেন এই ভাষাভাষী তরুণরা।

আন্তর্জাতিক মাতৃভাষা ইনস্টিটিউটে ভাষা গবেষণার কাজ করতে সমর এম সরেন লক্ষ্য করেন, বাংলাদেশে প্রায় ৪৩টি ভাষা রয়েছে। রয়েছে বিপুল পরিমাণ ভাষিক সম্পদ। কিন্তু এই ভাষিক সম্পদ বাঁচিয়ে রাখার কার্যকর কোনো উদ্যোগ নেই। অথচ বর্তমান কৃত্রিম বুদ্ধিমত্তার যুগে ভাষা গুরুত্বপূর্ণ উপাদান।

তাই ২০১৭ সালে নিজেদের সাঁওতালি ভাষা ও উরাও জনগোষ্ঠীর বিপন্ন কুড়ুখ ভাষা নিয়ে একটি ভাষিক রিসোর্স এর ডিজিটাল মডেল দাঁড় করানোর প্রচেষ্টা শুরু করেন সম্পূর্ণ নিজস্ব অর্থায়নে। এই মডেলের নাম দেওয়া হয়েছে ল্যাঙ্গুয়েজ রিসোর্স ডাটাবেজ। ভাষাকে ডিজিটালাইজেশন করাই এই উদ্যোগের মূল লক্ষ্য। শুরুর কথা বলতে গিয়ে সমর এম সরেন বলেন, ২০১৭ সালে মাত্র সাতজন সাঁওতাল ও উরাও জনগোষ্ঠীর স্বেচ্ছাসেবীদের নিয়ে ল্যাঙ্গুয়েজ রিসোর্স হাব নামের একটি কমিউনিটি গড়ে তুলি। তথ্য-প্রযুক্তিতে ভাষাকে টিকিয়ে রাখার জন্য বেশ কয়েকটি কম্পোনেন্ট নির্মাণ করছে আমাদের ল্যাঙ্গুয়েজ রিসোর্স হাব কমিউনিটি।

এসব কম্পোনেন্টের মধ্যে রয়েছে, ত্রিভাষিক ওয়ার্ডলিস্ট (ইংরেজি-সাঁওতালি-বাংলা), ছয় লাখ শব্দের অনলাইন ডিকশনারি, গ্লসভিত্তিক অনলাইন ডিকশনারি, সাঁওতালি ও কুড়ুখ ভাষার ফ্রন্ট, টাইপিং সফটওয়্যার, স্পেল চেকার, অনলাইন টাইপিং প্যাড, ভাষিক ডকুমেন্টেশন,অ্যালফাবেট ট্রান্সলিটারেশন টুল, সোশ্যাল মিউজিক ডাটাবেজ, লোকজ চিকিৎসার ডাটাবেজ, ইতিহাস ও সাংস্কৃতিক এটিমলজি, আইনগত শব্দ ও টিকার গ্লোসারি, শিশুদের ঐতিহ্যবাহী খেলাধুলার ডাটাবেজ, উদ্ভিদের গ্লোসারি, পশু-পাখি ও কীটপতঙ্গের ডাটাবেজ, ইউনিকোড টু আসকি ফ্রন্ট কনভার্টার, আইপিএ কনভার্টার, সান্তালি মিউজিক এডিটর,  মিউজিক ডকুমেন্টেশন প্রভৃতি। এসব কম্পোনেন্টের কয়েকটি ইতিমধ্যে পুরোপুরি সম্পন্ন হয়েছে। আবার কিছু কম্পোনেন্ট নির্মাণাধীন রয়েছে।        

সমর এম সরেন জানান, শুধু বাংলাদেশেই ২০টির বেশি সাঁওতাল সামাজিক সংগঠন আমাদের রিসোর্স/টুলসগুলো ব্যবহার করছেন। সম্প্রতি প্রকল্পের সংগ্রহকৃত ডাটা রিসোর্স ব্যবহার করে সান্তালি ভাষার ব্যাকরণ আন্তর্জাতিকভাবে প্রকাশ করা সম্ভব হয়েছে। তিন খন্ডের সান্তালি ব্যাকরণের মধ্যে ইতিমধ্যে একটি খন্ড প্রকাশিত হয়েছে। কথা প্রসঙ্গে জানা গেল, এগুলো সান্তালি ভাষার ভাষিক ডকুমেন্টেশনে অত্যন্ত সহায়ক হয়ে উঠেছে। সমরদের সদ্য সমাপ্ত হওয়া ট্রান্সলিটারেশন টুলটি সান্তালি ভাষার লিপিগুলোর মধ্যে একটি সেতুবন্ধন তৈরি করে। এ ছাড়া ভাষার দুই ধারার সাহিত্য ও দুটি ডায়ালেক্ট এর (সাউদার্ন ও নর্দার্ন) ভাষিক পার্থক্য ও বৈচিত্র্য সম্পর্কে  স্বচ্ছ ধারণা পাওয়া যাচ্ছে। এতে করে বিভিন্ন লিপিতে লিখিত কনটেন্টগুলোকে বিশ্লেষণ করা সম্ভব হচ্ছে। লিপি বিষয়ক সিদ্ধান্ত গ্রহণে এসব তুলনামূলক বিশ্লেষণ অত্যন্ত গুরুত্বপূর্ণ।

সমর এম সরেন বলেন, এই মডেলটির মাধ্যমে অনলাইনে সাঁওতালি ও কুড়ুখ ভাষার একটি দৃশ্যমান ভিত্তি দাঁড় হবে। সম্প্রতি সাঁওতালি ভাষায় মেশিন ট্রান্সলেশনের উদ্যোগ গ্রহণ করতে চলেছেন। কিন্তু এতে প্রয়োজন যথেষ্ট দক্ষ জনবল ও পর্যাপ্ত অর্থ, যা সমর এম সরেনের জন্য একটি বড় চ্যলেঞ্জ।

সমর এম সরেনের শিক্ষক ও ড্যাফোডিল ইন্টারন্যাশনাল ইউনিভার্সিটির আইন বিভাগের সহযোগী অধ্যাপক ড. কুদরাত-ই-খুদা বাবু বলেন, সরেনের ডিজিটাল রিসোর্সগুলোর মধ্যে সান্তালি সোশ্যাল মিউজিক ডাটাবেজ একটি বড় রিসোর্স। এর মাধ্যমে সান্তালি সংগীতের একটি বৃহৎ ডিজিটাল আর্কাইভ তৈরি করা সম্ভব হয়েছে। বাংলাদেশ ও ভারতের সাঁওতাল শিল্পী ও তাদের সংগীতের একমাত্র প্লাটফর্ম হিসেবে গড়ে উঠেছে। সব সান্তাল সংগীত ও বাদ্যযন্ত্রের সব রকমের ডাটা পাওয়ার দরুন মিউজিক ডকুমেন্টেশনে বেশ সহায়ক হয়ে উঠেছে এই মিউজিক ডাটাবেজটি।

বাংলাদেশ কম্পিউটার কাউন্সিলের ভাষা প্রযুক্তি বিশেষজ্ঞ ও জাহাঙ্গীরনগর বিশ্ববিদ্যালয়ের সহকারী অধ্যাপক মামুন অর রশিদ বলেন, ডিজিটাল মাধ্যমে ভাষা সংরক্ষিত না হলে যে কোনো ভাষা বিপন্ন হয়ে পড়বে, এমনকি বিলুপ্তও হয়ে যেতে পারে। এজন্য ভাষার রিসোর্স সংগ্রহ করতে হবে, সেগুলো অ্যানালাইসিস করতে হবে। ঢাকা বিশ্ববিদ্যালয়ের ভাষাবিজ্ঞান বিভাগের সহকারী অধ্যাপক মাশরুর ইমতিয়াজ সমরের এই উদ্যোগের শুরুর দিক থেকেই পাশে দাঁড়িয়েছেন। তিনি বলেন, বিপন্ন ভাষার ডিজিটাল রিসোর্স নির্মাণ অত্যন্ত যুগোপযোগী এবং দীর্ঘমেয়াদি কাজ। এর জন্য উন্নত প্রশিক্ষণ ও অনেক পড়াশোনার প্রয়োজন। এসব কনটেন্ট নির্মাণের জন্য এরকম স্ব-উদ্যোগীদের প্রয়োজনীয় ও আন্তর্জাতিক মানের প্রশিক্ষণের ব্যবস্থা করলে এই বিপন্ন ভাষাগুলো টিকিয়ে রাখা সম্ভব।

সমর এম সরেন তার এই উদ্যোগের বিষয়ে বলেন, ল্যাঙ্গুয়েজ রিসোর্স ডাটাবেজ মডেলটি সান্তালি ও কুড়ুখ ভাষা রক্ষায় গুরুত্বপূর্ণ কাজ। ডিজিটাল রিসোর্স নির্মাণ কাজ সম্পূর্ণ সম্পন্ন হলে তথ্য-প্রযুক্তিতে এই দুটি ভাষায় বিভিন্ন কনটেন্ট তৈরিতে সহায়ক হবে। ভাষার ক্ষেত্রে লিপি বিতর্কে একটি যৌক্তিক অবস্থান দাঁড় করতে সহায়তা করবে।


আপনার মন্তব্য