পরিসংখ্যান বিশ্লেষণ: গ্রাফ, চার্ট ও কম্পিউটার

সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন

কখন প্যারামেট্রিক, কখন নন-প্যারামেট্রিক টেস্ট ব্যবহার করবেন? – Mishra et al. (2019) অনুসারে সম্পূর্ণ নির্দেশিকা

জৈব-চিকিৎসা গবেষণায় সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন একটি গুরুত্বপূর্ণ ধাপ। ভুল পদ্ধতি শুধু ফলাফলের ব্যাখ্যাকেই প্রভাবিত করে না, গবেষণার সিদ্ধান্তকেও ভুল পথে নিয়ে যেতে পারে। প্রতিটি নির্দিষ্ট পরিস্থিতির জন্য নির্দিষ্ট পরিসংখ্যানিক পদ্ধতি রয়েছে। এখানে আমরা আলোচনা করব কীভাবে গবেষণার উদ্দেশ্য, ডেটার ধরন ও বিতরণ, এবং পর্যবেক্ষণের প্রকৃতির উপর ভিত্তি করে সঠিক টেস্ট নির্বাচন করা যায়।

১. গবেষণার উদ্দেশ্য

আমাদের পরীক্ষার নির্বাচন সরাসরি গবেষণার লক্ষ্যের উপর নির্ভর করে। উদাহরণ: যদি উদ্দেশ্য হয় কোনো ফল চলকের (outcome variable) পূর্বাভাষক (predictors) খুঁজে বের করা, তাহলে রিগ্রেশন বিশ্লেষণ ব্যবহার করতে হবে। অন্যদিকে দুটি স্বাধীন গোষ্ঠীর মধ্যে গড় তুলনা করতে চাইলে ব্যবহৃত হয় unpaired t‑test।

২. ডেটার ধরন ও বিতরণ

ক্যাটেগরিক্যাল ডেটা (nominal/ordinal): নন-প্যারামেট্রিক পদ্ধতি যেমন Chi‑square, Fisher’s exact test ব্যবহার হয়।

কন্টিনিউয়াস ডেটা: বিতরণের উপর নির্ভর করে – যদি normal distribution হয়, প্যারামেট্রিক টেস্ট (যেমন t‑test, ANOVA) ; অন্যথায় নন-প্যারামেট্রিক (Mann‑Whitney, Kruskal‑Wallis) ব্যবহার করতে হবে।

উদাহরণ: তিনটি বয়স গ্রুপের মধ্যে ডায়াস্টোলিক ব্লাড প্রেশার তুলনা করতে চাই। যদি ডেটা normal হয়, one‑way ANOVA; যদি non‑normal হয়, Kruskal‑Wallis test।

৩. পর্যবেক্ষণ পেয়ার্ড নাকি আনপেয়ার্ড?

একই ব্যক্তির উপর একাধিক পরিমাপ নেওয়া হলে ডেটা পেয়ার্ড (যেমন আগে-পরে)। ভিন্ন গ্রুপ হলে আনপেয়ার্ড। পেয়ার্ড ডেটার জন্য paired t‑test বা Wilcoxon signed‑rank; আনপেয়ার্ডের জন্য independent t‑test বা Mann‑Whitney U test।

প্যারামেট্রিক ও নন-প্যারামেট্রিক পদ্ধতির ধারণা

প্যারামেট্রিক: যেসব পদ্ধতি গড় (mean) তুলনা করে, যেমন t‑test, ANOVA, Pearson correlation। এদের জন্য ডেটা কন্টিনিউয়াস ও প্রায় normal হওয়া জরুরি।

নন-প্যারামেট্রিক: গড় ছাড়া অন্য পরিমাপ (মধ্যমা, র্যাঙ্ক, অনুপাত) তুলনা করে। যেমন Mann‑Whitney, Kruskal‑Wallis, Spearman correlation। এরা ডেটার বিতরণ সম্পর্কে কম ধারণা নেয় এবং outlier‑প্রতি সহনশীল।

প্যারামেট্রিক	নন-প্যারামেট্রিক বিকল্প
Independent t‑test	Mann‑Whitney U test
Paired t‑test	Wilcoxon signed‑rank test
One‑way ANOVA	Kruskal‑Wallis test, median test
Repeated measures ANOVA	Friedman test
Pearson correlation	Spearman rank correlation
Linear regression	Log‑linear regression

অনুপাত তুলনার পদ্ধতি (কেবল নন-প্যারামেট্রিক)

অনুপাত (proportions) তুলনা করতে ব্যবহৃত পদ্ধতিগুলোর কোনো প্যারামেট্রিক বিকল্প নেই।

উদ্দেশ্য	পদ্ধতি
দুই বা ততোধিক স্বাধীন গোষ্ঠীর অনুপাত তুলনা	Pearson Chi‑square, Fisher’s exact test
দুই পেয়ার্ড গোষ্ঠীর অনুপাতের পরিবর্তন	McNemar test
তিন বা ততোধিক পেয়ার্ড গোষ্ঠীর অনুপাতের পরিবর্তন	Cochran Q test

অন্যান্য গুরুত্বপূর্ণ পদ্ধতি

Intraclass correlation coefficient (ICC): একই ব্যক্তির উপর নেওয়া দুটি কন্টিনিউয়াস পরিমাপের মধ্যে চুক্তি নির্ণয়।
Kappa statistics: নমিনাল (unweighted) বা অর্ডিনাল (weighted) ডেটার জন্য দুটি পদ্ধতির মধ্যে চুক্তি নির্ণয়।
Logistic regression: ক্যাটেগরিক্যাল outcome variable‑এর পূর্বাভাষক নির্ণয়।
Survival analysis: রোগীর বেঁচে থাকার সময় (survival time) ও তার পূর্বাভাষক নির্ণয় (Cox regression)।
ROC curve analysis: কোনো কন্টিনিউয়াস চলকের কাট‑অফ মান ও ডায়াগনস্টিক নির্ভুলতা নির্ণয় (AUC, sensitivity, specificity ইত্যাদি)।

নমুনা আকার ও সতর্কতা

ছোট নমুনায় (প্রতি গ্রুপে গড়ে ≤১৫) normality পরীক্ষা কম সংবেদনশীল। তাই ছোট নমুনায় শুধুমাত্র অত্যন্ত normal ডেটাতেই প্যারামেট্রিক পদ্ধতি ব্যবহার করা উচিত; অন্যথায় নন-প্যারামেট্রিক পদ্ধতি নিরাপদ। বড় নমুনায় (>১৫) normality পরীক্ষা বেশি সংবেদনশীল – তাই অত্যন্ত non‑normal ডেটা ছাড়া প্যারামেট্রিক পদ্ধতি ব্যবহার করা চলে।

কোনো নির্দিষ্ট পরীক্ষার জন্য নির্দিষ্ট ন্যূনতম নমুনা আকার নেই; এটি প্রভাবের আকার (effect size), আত্মবিশ্বাসের মাত্রা ও পরীক্ষার ক্ষমতার (power) উপর নির্ভর করে। পর্যাপ্ত নমুনা ছাড়া প্রকৃত পার্থক্য শনাক্ত করা সম্ভব হয় না।

ভুল পদ্ধতি নির্বাচনের প্রভাব

একটি উদাহরণ: ২০টি করে নিয়ন্ত্রণ ও চিকিৎসা গোষ্ঠীর systolic blood pressure (mean ± SD) যথাক্রমে ১২৬.৪৫ ± ৮.৮৫ ও ১২১.৮৫ ± ৫.৯৬। Independent t‑test (সঠিক পদ্ধতি) দিলে P = ০.০৬১ (অর্থহীন), কিন্তু paired t‑test (ভুল) দিলে P = ০.০১১ (অর্থপূর্ণ) আসে। ভুল পদ্ধতি ব্যবহার করে আমরা এমন পার্থক্য পেয়ে যাই যা প্রকৃতপক্ষে নেই।

সুতরাং সঠিক পদ্ধতি নির্বাচন শুধু ফলাফল নয়, গবেষণার সিদ্ধান্তকেও সঠিক রাখে।

সঠিক পরিসংখ্যানিক পদ্ধতি নির্বাচন মানসম্পন্ন গবেষণার ভিত্তি। গবেষকের উচিত পদ্ধতির অন্তর্নিহিত অনুমান (assumptions) বোঝা, ডেটার প্রকৃতি যাচাই করা, এবং প্রয়োজন হলে বিশেষজ্ঞের পরামর্শ নেওয়া। এতে গবেষণার ফলাফল হবে নির্ভরযোগ্য, পুনরুৎপাদনযোগ্য ও প্রমাণ-ভিত্তিক চর্চার উপযোগী।

উচ্চশিক্ষা গবেষণা শিক্ষাব্যবস্থা স্কলারশিপ

Rafsan Daily

কখন প্যারামেট্রিক, কখন নন-প্যারামেট্রিক টেস্ট ব্যবহার করবেন?