পর্ব-৪ঃ টপিক নির্বাচন ও গবেষণার শুরু

5 minute read

Published:

গবেষনা শুরু করার অন্যতম একটি ধাপ হলো নিজের ইন্টারেস্ট এবং প্যাশন অনুযায়ী টপিক নির্বাচন করা। আমি অনেককেই দেখেছি টিচার বা বড়ভাইয়ের কথা অনুযায়ী কোনো একটা টপিক নিয়ে কাজ শুরু করে এবং পরবর্তীতে নিজের মন থেকে না আসার কারনে সেটি নিয়ে আর কাজ করা হয়ে ওঠে না।

নিজের ইন্টারেস্ট এবং আসক্তি অনুযায়ী টপিক নির্বাচন করলে একদিকে যেমন নিজের কাজের প্রতি অন্যরকম সম্মান এবং ভালোবাসা থাকে, ঠিক একইবাবে সেটি হয়ে ওঠে একটি কোয়ালিটিফুল রিসার্স ওয়ার্ক যা আপনার জন্য অনেক বড় একটা আ্যাচিভমেন্ট হতে পারে।

তাই আমি বলবো রিসার্স করার জন্য একটি উপযুক্ত এবং মানসম্মত টপিক নির্বাচন করতে হবে। মূলত এই কারনেই উপরে আমার এই গবেষনার সচরাচর ফিল্ডগুলো নিয়ে মোটামুটি পরিসরে লেখার চেষ্টা করেছি। আপনারা চাইলে পূর্বের চ্যাপ্টার থেকে সচরাচর গবেষনার ফিল্ড এবং টপিক সাম্পর্কে ধারনা নিতে পারেন এবং সে অনুযায়ী কাজ শুরু করে দিতে পারেন।

মনে করি আপনি আমার বর্ণনা দেয়া ফিল্ডগুলো থেকে সংক্ষিপ্ত ধারণা নিয়ে এনএলপি বা ন্যাচারাল ল্যাংগুয়েজ প্রসেসিং ফিল্ডে কাজ করবেন ভেবেছেন।

এখন আপনার কাজ হবে, এনএলপির সকল সাব-টপিক সম্পর্কে ওয়েব সার্স করে ধারণা নিয়ে প্রবলেম আইডেন্টিফাই করা এবং সেগুলোর সলভিং অ্যাপ্রোচ খেয়াল করা। এভাবে এখান থেকেই একটি টপিক সিলেক্ট করতে পারেন এবং শুরু করে দিতে পারেন আপনার গবেষনার কাজ।

এছাড়াও রিসার্স পেপার পড়ে কিভাবে টপিক সিলেক্ট করবেন সেটি নিয়ে নিচে আলোচনা করছি।

গবেষনার শুরুটা যেভাবে হওয়া উচিৎ

- অন্যের পেপার পড়া

গবেষনার শুরু বলতেই আসলে বুঝায় অনেক অনেক গবেষনাপত্র (থিসিস পেপার) পড়া এবং সেগুলো থেকে জ্ঞান নেয়া, অন্যের কাজ এবং ঐ ফিল্ডের অগ্রগতি সম্পর্কে জানা।

ধরুন আমি বাংলা ভাষার জন্য একটি টেক্সট সামারাইজার বানিয়ে ফেলেছি, এবং আপনি রিসার্স কমিউনিটিগুলোতে তেমন খোজখবর রাখেন না এবং রিসেন্ট গবেষনাপত্র তেমন ঘাটাঘাটি করেন না। ফলে আপনিও আলাদাভাবে ঐ একই টেক্সট সামারাইজার নিয়ে কাজ করে যাচ্ছেন।

তাহলে কি হল? একই সমস্যা সলভ করতে দুজনের কষ্ট করতে হচ্ছে, এবং আপনার গবেষনা সেখানে প্রায় অর্থহীন হয়ে যাবে।

তাই আপনি যে ফিল্ডে কাজ করছেন বা কাজ করতে আগ্রহী, সেই ফিল্ড এবং টপিকগুলো সার্স দিয়ে, রিলেটেড গবেষনাপত্র নামিয়ে আপনাকে সেগুলো নিয়ে বিস্তর ঘাটাঘাটি করতে হবে। চাইলে অন্যের কাজই হুবহু আপনি চেষ্টা করে দেখতে পারেন, সেটা করতে পারছেন কিনা। এরপর সেটা নিয়ে গবেষণা শুরু করুন এবং আপনার নিজের জন্য ঐ কাজেরই ফিউচার ওয়ার্ক নিয়ে কাজ করতে পারেন।

এছাড়া অন্যের গবেষণাপত্র থেকে আপনি নতুন কিছু শিখতেও পারবেন। কোনোকিছু না বুঝলে বা কোনো জিজ্ঞাসা থাকলে, পেপারের অথর সেকশন থেকে মেইল অ্যাড্রেস নিয়ে একজন অথরকে তাকে মেইলও করে ফেলতে পারেন। পেপারের অথর সেই ব্যাপারে সর্বোচ্চ চেষ্টা করতে আপনাকে সাহায্য করতে।

- কিভাবে পেতে পারি এই গবেষনাপত্রসমূহ?

এটা আসলে খুবই যৌক্তিক একটি প্রশ্ন। আমরা কম্পিউটার সায়েন্সের প্রায় সকল গবেষণাপত্র যেসকল ওয়েবসাইট বা পোর্টালে পেতে পারি সেগুলো হল-

গুগল স্কলারেই মোটামুটি সব ধরনের পেপার পাওয়া যাবে আশা করা যায়। এই সাইটগুতে গিয়ে সার্স দিয়ে খুব সহজেই পেপারগুলোর এবস্ট্রাক্ট দেখে নেয়া যায়, কিন্তু অনেক সময়ই এগুলো ফ্রিতে পুরো পেপার ডাউনলোড করার অনুমতি দেয়না না।

কিন্তু পুরো পেপার ডাউনলোড করারও উপায় রয়েছে, সেগুলো উপায় পাইরেসি রিলেটেড হওয়ায় এখানে না লেখাটাই উত্তম মনে করছি। তবে কেউ আমার সাথে ব্যক্তিগত যোগাযোগ করলে তাকে বিস্তারিত জানিয়ে দিব ইনশাআল্লাহ।

মনে করি আপনি এনএলপির ফিল্ডে কাজ করতে আগ্রহী হয়েছেন এবং সেখান থেকে সাব-ফিল্ডগুলো দেখে সেন্টিমেন্ট এনালাইজ নিয়ে কাজ করবেন সিদ্ধান্ত নিয়েছেন।

তাহলে আপনার জন্য উপদেশ- Sentiment analysis, Sentiment analysis in Bangla এরকম কিছু কী-ওয়ার্ড লিখে গুগল স্কলারে সার্স করুন এবং কোনো পেপারের এবস্ট্রাক্ট পড়ে পছন্দ হলে সেটির পুরো পেপারটি নামিয়ে নিন।

আমি রিকমেন্ড করবো রিসেন্ট কিছু পেপার (যেমন- ২০১৬, ২০১৭, ২০১৮) এবং মোটামুটি কিছুদিন আগের কিছু পেপার (যেমন- ২০০৫ বা ২০০৭) খুজে পছন্দমত নামানো। মোটামুটি কোনো টপিকের উপর রিসেন্ট পেপার ৫ টি এবং আগের পেপার ২ টি, এভাবে হিসাব করে নামাতে পারেন। তাহলে এই টপিকের কাজের অগ্রগতি এবং যুগোপযুগী সলিউশন সম্পর্কে জানতে পারবেন।

অন্যের পেপার পড়া এবং তার ড্রাফট রাইটিং

- কি এবং কেন

আপনি যদি ইতোমধ্যে বিভিন্ন ধরনের গবেষণাপত্র পড়া শুরু করে থাকেন, তাহলে রিসার্সের এই জগতে সঠিকভাবে প্রবেশ করে ফেলেছেন। এখন দরকার এই পড়াশোনাকে কিভাবে আমার কাজে লাগানো যায় সেটি। আরেকটি ব্যাপার, আপনার এই পড়াশোনা বা ঘাটাঘাটি করাটা কিছুটা অর্গানাইজড ওয়েতে হওয়া উচিৎ।

মনে করি আপনি এনএলপি ফিল্ড থেকে সেন্টিমেন্ট এনালাইসিস টপিক নিয়ে গবেষনা করছেন এবং গুগল স্কলার থেকে সার্স দিয়ে, সাইহাব ইউজ করে বেশ কিছু পেপারও নামিয়ে ফেলেছেন। এবার পড়ার পালা!

প্রথম দিকে থিসিস পেপার পড়াটা মোটামুটি একটু কঠিন মনে হবে। মনে হতে পারে এগুলো বাংলা, ইংরেজীরও বাইরে অন্য কোনো ভাষায় লেখা। অনেকে আবার অর্গানাইজড ওয়েতে স্টাডি না করার কারনে আরও কঠিন মনে হয়।

রিসার্স পেপারের সকল টার্ম কঠিন মনে হলে পড়ার দরকার নাই। আমি কিছু বিষয় পয়েন্ট আকারে বলছি, এগুলো একটা পেপার থেকে স্কিমিং করলেই মোটামুটি ঐ পেপার সম্পর্কে যা জানার দরকার জানা হয়ে যাবে-

- কি কি ড্রাফট করতে হবে?

  • পেপারের টাইটেল, অথর, কনফারেন্সের নাম এবং সময়কাল
  • এবস্ট্রাক্ট পুরোটা
    • ফাইনাল আউটপুটটা আসলে কি?
    • কিভাবে বা কোন অ্যাপ্রোচে তারা প্রবলেম সলভ করেছে?
    • কাজের একুরেসি কেমন?
  • লিটারেচার রিভিউ থেকে রিলেটেড ওয়ার্কস দেখে নেয়া
  • ডেটাসেট কোনটি ইউজ করেছে, সেটার প্রোপারটিজ (যদি থাকে)
  • কি কি টুলস এবং টেকনিক ইউজ করেছে
    • যদি নতুন কোনো টেকনিক হয়ে থাকে তাহলে সেটার মোটামুটি ধারনা নেয়া
  • তাদের কাজটির মধ্যে নতুনত্ব কি আছে সেটা আইডেন্টিফাই করা
  • কাজটির ফিউচার ওয়ার্কে তারা কি রেখেছে

প্রতিটি পেপারের এই ইনফরমেশনগুলো কালেক্ট করে সেগুলো নিজের মত নোট করে রাখলে সবচেয়ে ভালো হয়, যেটাকে বলেছি ড্রাফট রাইটিং। কেননা এরকম ১০/১৫ টা পেপারের ড্রাফট রাইটিং হলেই আপনি একটা নিজের রিভিউ পেপার তৈরি করতে পারবেন। যেটা গবেষণায় বিগিনার হিসেবে একটা গুরুত্বপূর্ণ কাজ।

এছাড়া কোনো পেপার পড়ে তাদের ফিউচার ওয়ার্ক দেখে আপনিই শুরু করে দিতে পারেন তাদের ফিউচার ওয়ার্কের একটা অংশ বা তাদের কাজটিই যদি আপনি আরও এফিসিয়েন্ট উপায়ে করতে পারেন তাহলে সেটিও চেষ্টা করে দেখতে পারেন। আর এভাবেই শুরু করবেন আপনার গবেষনা এবং ইনফরমেশন ড্রাফট রাইটিং এর কাজ।