কখন প্যারামেট্রিক, কখন নন-প্যারামেট্রিক টেস্ট ব্যবহার করবেন?

সেয়ার: 0
পরিসংখ্যান বিশ্লেষণ: গ্রাফ, চার্ট ও কম্পিউটার

সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন

কখন প্যারামেট্রিক, কখন নন-প্যারামেট্রিক টেস্ট ব্যবহার করবেন? – Mishra et al. (2019) অনুসারে সম্পূর্ণ নির্দেশিকা

জৈব-চিকিৎসা গবেষণায় সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন একটি গুরুত্বপূর্ণ ধাপ। ভুল পদ্ধতি শুধু ফলাফলের ব্যাখ্যাকেই প্রভাবিত করে না, গবেষণার সিদ্ধান্তকেও ভুল পথে নিয়ে যেতে পারে। প্রতিটি নির্দিষ্ট পরিস্থিতির জন্য নির্দিষ্ট পরিসংখ্যানিক পদ্ধতি রয়েছে। এখানে আমরা আলোচনা করব কীভাবে গবেষণার উদ্দেশ্য, ডেটার ধরন ও বিতরণ, এবং পর্যবেক্ষণের প্রকৃতির উপর ভিত্তি করে সঠিক টেস্ট নির্বাচন করা যায়।

১. গবেষণার উদ্দেশ্য

আমাদের পরীক্ষার নির্বাচন সরাসরি গবেষণার লক্ষ্যের উপর নির্ভর করে। উদাহরণ: যদি উদ্দেশ্য হয় কোনো ফল চলকের (outcome variable) পূর্বাভাষক (predictors) খুঁজে বের করা, তাহলে রিগ্রেশন বিশ্লেষণ ব্যবহার করতে হবে। অন্যদিকে দুটি স্বাধীন গোষ্ঠীর মধ্যে গড় তুলনা করতে চাইলে ব্যবহৃত হয় unpaired t‑test।

২. ডেটার ধরন ও বিতরণ

ক্যাটেগরিক্যাল ডেটা (nominal/ordinal): নন-প্যারামেট্রিক পদ্ধতি যেমন Chi‑square, Fisher’s exact test ব্যবহার হয়।

কন্টিনিউয়াস ডেটা: বিতরণের উপর নির্ভর করে – যদি normal distribution হয়, প্যারামেট্রিক টেস্ট (যেমন t‑test, ANOVA) ; অন্যথায় নন-প্যারামেট্রিক (Mann‑Whitney, Kruskal‑Wallis) ব্যবহার করতে হবে।

উদাহরণ: তিনটি বয়স গ্রুপের মধ্যে ডায়াস্টোলিক ব্লাড প্রেশার তুলনা করতে চাই। যদি ডেটা normal হয়, one‑way ANOVA; যদি non‑normal হয়, Kruskal‑Wallis test।

৩. পর্যবেক্ষণ পেয়ার্ড নাকি আনপেয়ার্ড?

একই ব্যক্তির উপর একাধিক পরিমাপ নেওয়া হলে ডেটা পেয়ার্ড (যেমন আগে-পরে)। ভিন্ন গ্রুপ হলে আনপেয়ার্ড। পেয়ার্ড ডেটার জন্য paired t‑test বা Wilcoxon signed‑rank; আনপেয়ার্ডের জন্য independent t‑test বা Mann‑Whitney U test।

প্যারামেট্রিক ও নন-প্যারামেট্রিক পদ্ধতির ধারণা

প্যারামেট্রিক: যেসব পদ্ধতি গড় (mean) তুলনা করে, যেমন t‑test, ANOVA, Pearson correlation। এদের জন্য ডেটা কন্টিনিউয়াস ও প্রায় normal হওয়া জরুরি।

নন-প্যারামেট্রিক: গড় ছাড়া অন্য পরিমাপ (মধ্যমা, র্যাঙ্ক, অনুপাত) তুলনা করে। যেমন Mann‑Whitney, Kruskal‑Wallis, Spearman correlation। এরা ডেটার বিতরণ সম্পর্কে কম ধারণা নেয় এবং outlier‑প্রতি সহনশীল।

প্যারামেট্রিকনন-প্যারামেট্রিক বিকল্প
Independent t‑testMann‑Whitney U test
Paired t‑testWilcoxon signed‑rank test
One‑way ANOVAKruskal‑Wallis test, median test
Repeated measures ANOVAFriedman test
Pearson correlationSpearman rank correlation
Linear regressionLog‑linear regression

অনুপাত তুলনার পদ্ধতি (কেবল নন-প্যারামেট্রিক)

অনুপাত (proportions) তুলনা করতে ব্যবহৃত পদ্ধতিগুলোর কোনো প্যারামেট্রিক বিকল্প নেই।

উদ্দেশ্যপদ্ধতি
দুই বা ততোধিক স্বাধীন গোষ্ঠীর অনুপাত তুলনাPearson Chi‑square, Fisher’s exact test
দুই পেয়ার্ড গোষ্ঠীর অনুপাতের পরিবর্তনMcNemar test
তিন বা ততোধিক পেয়ার্ড গোষ্ঠীর অনুপাতের পরিবর্তনCochran Q test

অন্যান্য গুরুত্বপূর্ণ পদ্ধতি

  • Intraclass correlation coefficient (ICC): একই ব্যক্তির উপর নেওয়া দুটি কন্টিনিউয়াস পরিমাপের মধ্যে চুক্তি নির্ণয়।
  • Kappa statistics: নমিনাল (unweighted) বা অর্ডিনাল (weighted) ডেটার জন্য দুটি পদ্ধতির মধ্যে চুক্তি নির্ণয়।
  • Logistic regression: ক্যাটেগরিক্যাল outcome variable‑এর পূর্বাভাষক নির্ণয়।
  • Survival analysis: রোগীর বেঁচে থাকার সময় (survival time) ও তার পূর্বাভাষক নির্ণয় (Cox regression)।
  • ROC curve analysis: কোনো কন্টিনিউয়াস চলকের কাট‑অফ মান ও ডায়াগনস্টিক নির্ভুলতা নির্ণয় (AUC, sensitivity, specificity ইত্যাদি)।

নমুনা আকার ও সতর্কতা

ছোট নমুনায় (প্রতি গ্রুপে গড়ে ≤১৫) normality পরীক্ষা কম সংবেদনশীল। তাই ছোট নমুনায় শুধুমাত্র অত্যন্ত normal ডেটাতেই প্যারামেট্রিক পদ্ধতি ব্যবহার করা উচিত; অন্যথায় নন-প্যারামেট্রিক পদ্ধতি নিরাপদ। বড় নমুনায় (>১৫) normality পরীক্ষা বেশি সংবেদনশীল – তাই অত্যন্ত non‑normal ডেটা ছাড়া প্যারামেট্রিক পদ্ধতি ব্যবহার করা চলে।

কোনো নির্দিষ্ট পরীক্ষার জন্য নির্দিষ্ট ন্যূনতম নমুনা আকার নেই; এটি প্রভাবের আকার (effect size), আত্মবিশ্বাসের মাত্রা ও পরীক্ষার ক্ষমতার (power) উপর নির্ভর করে। পর্যাপ্ত নমুনা ছাড়া প্রকৃত পার্থক্য শনাক্ত করা সম্ভব হয় না।

ভুল পদ্ধতি নির্বাচনের প্রভাব

একটি উদাহরণ: ২০টি করে নিয়ন্ত্রণ ও চিকিৎসা গোষ্ঠীর systolic blood pressure (mean ± SD) যথাক্রমে ১২৬.৪৫ ± ৮.৮৫ ও ১২১.৮৫ ± ৫.৯৬। Independent t‑test (সঠিক পদ্ধতি) দিলে P = ০.০৬১ (অর্থহীন), কিন্তু paired t‑test (ভুল) দিলে P = ০.০১১ (অর্থপূর্ণ) আসে। ভুল পদ্ধতি ব্যবহার করে আমরা এমন পার্থক্য পেয়ে যাই যা প্রকৃতপক্ষে নেই।

সুতরাং সঠিক পদ্ধতি নির্বাচন শুধু ফলাফল নয়, গবেষণার সিদ্ধান্তকেও সঠিক রাখে।

সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন মানসম্পন্ন গবেষণার ভিত্তি। গবেষকের উচিত পদ্ধতির অন্তর্নিহিত অনুমান (assumptions) বোঝা, ডেটার প্রকৃতি যাচাই করা, এবং প্রয়োজন হলে বিশেষজ্ঞের পরামর্শ নেওয়া। এতে গবেষণার ফলাফল হবে নির্ভরযোগ্য, পুনরুৎপাদনযোগ্য ও প্রমাণ-ভিত্তিক চর্চার উপযোগী।

0 Comments:

একটি মন্তব্য পোস্ট করুন