পরিসংখ্যান ও তথ্য-উপাত্ত

পরিসংখ্যান ও এসপিএসএস শিখি ২: কতোটুকু আমরা শিখবো

এসপিএসএস
লিখেছেন গৌতম রায়

আগের পর্বে আমরা মূলত মজা করেছি। এই পর্ব থেকে আসুন আমরা সিরিয়াসলি কিন্তু খুবই সহজভাবে পরিসংখ্যান ও এসপিএসএস শেখা শুরু করি। তবে শুরুর আগে কিছু বিষয়ে আলোচনা করা বা খোলাসা হওয়া দরকার। বিশ্ববিদ্যালয় পর্যায়ে পরিসংখ্যান বেশ গুরুত্বপূর্ণ একটি বিষয় হিসেবে পরিচিত। বাংলাদেশের বিশ্ববিদ্যালয়গুলোতে বিষয়টির ওপর চার বছরের অনার্স ও এক বছরের মাস্টার্স কোর্স চালু আছে। শিক্ষার্থীরা পাঁচ বছর ধরে পরিসংখ্যানের নানা খুঁটিনাটি শিখেন; তবে যাঁরা শেষ পর্যন্ত পরিসংখ্যান-সম্পর্কিত চাকুরি করেন, তাঁরা বাস্তব অবস্থার কারণেই খুব সীমিত পর্যায়ে এর প্রয়োগ ঘটাতে পারেন। খুব কম সংখ্যক শিক্ষার্থীই তাঁর পরিসংখ্যান-জ্ঞানের পূর্ণ প্রতিফলন ঘটাতে পারেন।

এ টিউটোরিয়ালে স্বাভাবিকভাবেই এতো খুঁটিনাটি বিষয় আলোচনা করা হবে না। যতোদূর সম্ভব সূত্র আড়ালে রেখে সহজবোধ্যভাবে পরিসংখ্যানকে হাজির করার একটা পরিকল্পনা রয়েছে। তাই বলে সূত্রের বাস্তব ও বিকল্প ব্যাখ্যা বাদ দেওয়া হবে না। তার মানে দাড়াচ্ছে, পরিসংখ্যানের নানা টার্মের যে ব্যাখ্যা দেওয়া হবে, সেগুলোর সহকারী হিসেবে সূত্র থাকবে, সূত্র দিয়ে তার ব্যাখ্যা করা হবে না। এই সিদ্ধান্ত নেয়ার কারণ হচ্ছে- বাংলাদেশে অনেকেরই অ্যাকাডেমিক ব্যাকগ্রাউন্ড পরিসংখ্যান নয়, কিন্তু কর্মজীবনে পরিসংখ্যান নিয়ে কাজ করতে হয়, তাদের জন্য টিউটোরিয়ালটি সহজভাবে উপস্থাপন করা। কাজ করতে গিয়ে অনেকে সামান্য কিছু জেনে জীবনভর ঠেকা কাজ চালিয়ে দেন, অনেকে নানাভাবে পরিসংখ্যান শেখার চেষ্টা করেন। পরিসংখ্যান বিষয়ে যাদের প্রাতিষ্ঠানিক ভিত্তি আছে, তাদের কাছে এই টিউটোরিয়াল খুবই পানসে মনে হবে। কিন্তু পরিসংখ্যানের এই ভিত্তিটি যাদের নেই কিন্তু শেখার আগ্রহ আছে, তাদের কাছে টিউটোরিয়ালটি এমনভাবে উপস্থাপন করার চেষ্টা থাকবে, যাতে পরিসংখ্যান ভীতি একদমই কাজ না করে। ব্যক্তিগত অভিজ্ঞতা থেকে বলা যায়, পরিসংখ্যান বিষয়টি খুব একটা কঠিন বিষয় নয়; কিন্তু গতানুগতিকভাবে উপস্থাপন করা হয় বলে বিষয়টি উপস্থাপন-দোষে ভীতিকর হয়ে উঠে।

*
পরিসংখ্যান শিখতে গিয়ে অনেকে কোনো এসপিএসএস কোর্সে ভর্তি হয়ে যান, যেটি খুবই ভুল সিদ্ধান্ত। মনে রাখা দরকার, পরিসংখ্যান এক জিনিস ও এসপিএসএস আরেক জিনিস। এসপিএসএস হচ্ছে একটি সফটওয়্যার-মাত্র যেটি পরিসংখ্যানের নানা হিসাব-নিকাশ চোখের পলকে করে দেয়; এর বাইরে এসপিএসএসের আলাদা কোনো গুরুত্ব নেই। আপনাকে যদি [{(৬৫৮৭৭৬ x ৫৪৩৫৬৫৬) – ২৪৭৫৪ + ৬৫৭৪৩৫৪}/২] = কত বের করতে বলা হয়, তাহলে যোগ-বিয়োগ-গুণ-ভাগ শিখতে হবে। একই কাজ ক্যালকুলেটরও করতে পারবে; কিন্তু কোনটি আগে কোনটি পরে কখন কী করতে হবে, সেই জ্ঞান ক্যালকুলেটরের নেই। এই সিদ্ধান্তটুকু আপনাকেই নিতে হয়। কাজটি আপনি হাতেকলমেও করতে পারতেন; কিন্তু ক্যালকুলেটর আপনার সময় বাঁচিয়ে দেয়, খুব সহজবোধ্যভাবে ফলাফল হাজির করে। এসপিএসএসের বিষয়টিও তাই। সুতরাং এসপিএসএস শিখে কোনোভাবে পরিসংখ্যান শেখা যায় না, বরং পরিসংখ্যানের জ্ঞান ভালোভাবে আয়ত্ত করতে পারলে এসপিএসএসে কমান্ড দিয়ে সহজে ও স্বল্প সময়ে নানা কাজ করা যায়। এই টিউটোরিয়ালে আমরা মূলত শিখবো পরিসংখ্যান, কিন্তু পরিসংখ্যানের হিসাব-নিকাশগুলো কাগজ-পেন্সিলে না করে এসপিএসএস সফটওয়্যারে করা হবে- তাতে পরিসংখ্যান শেখার পাশাপাশি এসপিএসএসও শেখা হয়ে যাবে।

**
‌টিউটোরিয়ালটি কাদের জন্য- বিষয়টি একটু আগে বলা হলেও আরেকটু পরিষ্কার করা প্রয়োজন। টিউটোরিয়ালটি মূলত তাদের জন্য যারা অন্তত বিশ্ববিদ্যালয় পর্যায়ে কোনোভাবেই গণিত বা পরিসংখ্যানের সাথে যুক্ত ছিলেন না; কিন্তু বর্তমানে নানা কাজে পরিসংখ্যান ব্যবহার করতে হয়। বিশেষত সমাজ বিজ্ঞানের নানা শাখা থেকে প্রতি বছর অনেক গবেষক তাদের গবেষণা জীবন শুরু করেন, কিন্তু পারিসাংখ্যিক (পরিসংখ্যান-বিষয়ক) বিশ্লেষণে দুর্বলতার কারণে তাদের একটি বিরাট অংশ চাকুরি জীবনে নানা ধরনের সুবিধা থেকে বঞ্চিত হন। এই টিউটোরিয়ালটি মূলত তাদের জন্য। তাছাড়া যারা বর্তমানে বিশ্ববিদ্যালয় পর্যায়ে পড়ালেখা করছেন, কিন্তু ভবিষ্যতে এ বিষয়ে কাজ করার চিন্তা আছে, টিউটোরিয়ালটি তাদেরও কাজে লাগতে পারে। বিশ্ববিদ্যালয়ের অনেকের একটি বা দুটো কোর্স থাকে পরিসংখ্যান বিষয়ে। যারা ইতোমধ্যে সেই কোর্স করে ফেলেছেন বা সামনে করবেন কিংবা উভয় গ্রুপের জন্য টিউটোরিয়ালটি কার্যকর হতে পারে। শিক্ষাবিষয়ে যারা নিয়মিত কাজ করছেন, তাদের নানা কাজেও এই টিউটোরিয়ালটি কাজে আসতে পারে।

***
এ অংশটি সিরিয়াসলি পড়ার দরকার নেই। এখানে জাস্ট টিউটোরিয়ালটিতে কী কী বিষয় নিয়ে আলোচনা করা হতে পারে তার একটি তালিকা করে রাখা হয়েছে। তবে এক পলক চোখ বুলিয়ে নিতে পারেন- আপনার প্রয়োজন কিন্তু এই লিস্টে নেই এমন কিছু বাদ পড়লো কিনা সেটি দেখার জন্য।

****
টিউটোরিয়াল আউটলাইন (সম্ভাব্য)

পরিসংখ্যান

চলক (variables) ও তথ্য (data)

বিভিন্ন ধরনের চলক ও তথ্য (গুণগত ও পরিমাণগত ??)

Parameter ও Statistic

কেন্দ্রীয় প্রবণতা (central tendency): গড় (mean), মধ্যক (median) ও প্রচুরক (mood)

Quartile, Decile, Percentile কী?

Skewness

বিচ্যুতি পরিমাপ (Measures of dispersion)

Measures of variability

Regression and correlation analysis

সম্ভাব্যতা (Probability)

বিন্যাস ও স্বাভাবিক বিন্যাস (Normal distribution)

Sampling

Standard deviation

Confidence intervals

Sampling error and sample size

Frequency distributions

Hypothesis testing (t-test, F-test, Z-test)

Bivariate and multivariate analysis

Linear regression

Reliability analysis

Non-parametric tests

…এবং আরো কিছু।

আপনার দরকার এমন কিছু বাদ পড়লো কি? কিংবা কোনোটি অপ্রয়োজনীয় মনে হচ্ছে? জানান, প্লিজ।

*****
মোটাদাগে এগুলোই একের পর এক টিউটোরিয়ালে আসতে থাকবে। তবে:

১. প্রয়োজন অনুসারে টিউটোরিয়ালের বিষয় বদলাতে পারে।

২. একই বিষয় বেশ কয়েকটি টিউটোরিয়ালে আসতে পারে। কিন্তু উল্টোভাবে এক পর্বে বেশ কিছু বিষয় চলে আসতে পারে।

৩. যখন যে বিষয় উপস্থাপন করা হবে, তখন সেই বিষয়টিকে এসপিএসএসে বিশ্লেষণে দেখানো হবে। প্রয়োজনে এক্সেল শিটের কিছু কাজও দেখানো হতে পারে।

৪. এই লেখার কোনো পাঠক (যদি আদৌ থেকে থাকেন) কোনো প্রয়োজনীয় বিষয় মন্তব্যকারে উল্লেখ করলে সেটি গুরুত্বপূর্ণ মনে হলে সেটিও আলাদা টিউটোরিয়াল হিসেবে আসতে পারে।

৫. পরিসংখ্যানের ইংরেজি টার্মগুলোর বাংলা করা হবে না। সেই যোগ্যতা এই টিউটোরিয়াল লেখকের নেই। যেগুলোর বাংলা প্রচলিত, সেগুলোর বাংলা টার্মের পাশাপাশি ব্র্যাকেটে ইংরেজি টার্মটিও থাকবে।

আপনি কি আর কোনো আইডিয়া দিতে পারেন?

******
আজ এ পর্যন্তই। যাওয়ার আগে দেখুন তো পরিসংখ্যানের সাহায্যে বিশ্লেষণ করা এই ফ্যাক্টগুলো আপনাকে কোনোভাবে আনন্দ দিতে পারে কিনা?

ক. প্রতিবছর জানালার সাথে ধাক্কা লেগে অন্তত ১০০০ পাখি মারা যায়।

খ. ১৯৯৩ সালে মার্কিন যুক্তরাষ্ট্রের সরকার আচার নিয়ে গবেষণার জন্য ২,৭৭,০০০ ডলার খরচ করে।

গ. আপনার উচ্চতা মাপুন এবং একে আট দিয়ে ভাগ দিন। পেয়ে যাবেন আপনার মাথার উচ্চতা।

ঘ. ফটোকপি মেশিনের ওপর বসার কারণে প্রতি বছর অন্তত ২৩% ফটোকপি মেশিন নষ্ট হয়।

ঙ. মার্কিন যুক্তরাষ্ট্রে প্রতি বছর অন্তত ৪০০০০ দুর্ঘটনা ঘটে টয়লেটে কিংবা টয়লেট সম্পর্কিত কোনো কারণে।

লেখক সম্পর্কে

গৌতম রায়

গৌতম রায় রাজশাহী বিশ্ববিদ্যালয়ের শিক্ষা ও গবেষণা ইনস্টিটিউটে সহকারী অধ্যাপক হিসেবে কর্মরত রয়েছেন।

মন্তব্য লিখুন

9 মন্তব্য

  • খুবই ভাল লাগছে দাদা। অধীর আগ্রহে অপেক্ষা করছি পরের পর্বটির জন্যে।

    আপনার চমৎকার এই উদ্যোগের জন্য আন্তরিকভাবে সাধুবাদ জানাই।

    • Assalamualikum, i hope u can help me. Please try your level best….

      নিচে উল্লেখিত বিষয়ে কোন বাংলা pdf file কি আপনার কাছে আছে???

      পরিসংখ্যান

      চলক (variables) ও তথ্য (data)

      বিভিন্ন ধরনের চলক ও তথ্য (গুণগত ও পরিমাণগত ??)

      Parameter ও Statistic

      কেন্দ্রীয় প্রবণতা (central tendency): গড় (mean), মধ্যক (median) ও প্রচুরক (mood)

      Quartile, Decile, Percentile কী?

      Skewness

      বিচ্যুতি পরিমাপ (Measures of dispersion)

      Measures of variability

      Regression and correlation analysis

      সম্ভাব্যতা (Probability)

      বিন্যাস ও স্বাভাবিক বিন্যাস (Normal distribution)

      Sampling

      Standard deviation

      Confidence intervals

      Sampling error and sample size

      Frequency distributions

      Hypothesis testing (t-test, F-test, Z-test)

      Bivariate and multivariate analysis

      Linear regression

      Reliability analysis

      Non-parametric tests

  • Assalamualikum, i hope u can help me. Please try your level best….

    নিচে উল্লেখিত বিষয়ে কোন বাংলা pdf file কি আপনার কাছে আছে???

    পরিসংখ্যান

    চলক (variables) ও তথ্য (data)

    বিভিন্ন ধরনের চলক ও তথ্য (গুণগত ও পরিমাণগত ??)

    Parameter ও Statistic

    কেন্দ্রীয় প্রবণতা (central tendency): গড় (mean), মধ্যক (median) ও প্রচুরক (mood)

    Quartile, Decile, Percentile কী?

    Skewness

    বিচ্যুতি পরিমাপ (Measures of dispersion)

    Measures of variability

    Regression and correlation analysis

    সম্ভাব্যতা (Probability)

    বিন্যাস ও স্বাভাবিক বিন্যাস (Normal distribution)

    Sampling

    Standard deviation

    Confidence intervals

    Sampling error and sample size

    Frequency distributions

    Hypothesis testing (t-test, F-test, Z-test)

    Bivariate and multivariate analysis

    Linear regression

    Reliability analysis

    Non-parametric tests