নন-প্যারামেট্রিক টেস্ট: কখন ও কেন?

নন-প্যারামেট্রিক টেস্ট: কখন ও কেন? | গবেষক ডায়েরি
পরিসংখ্যান বিশ্লেষণ: গ্রাফ, চার্ট ও কম্পিউটার

নন-প্যারামেট্রিক টেস্ট: কখন ও কেন?

যখন ডেটা নরমাল হয় না, তখন পরিসংখ্যানের নির্ভরযোগ্য সঙ্গী।

গবেষণা করতে গিয়ে একটা সময় প্রায় সব গবেষকই একই অভিজ্ঞতার মুখোমুখি হন। অনেক কষ্ট করে ডেটা সংগ্রহ করার পর এনালাইসিস শুরু করতে গেলে দেখা যায় ডেটা normal distribution ফলো করছে না। এসব ক্ষেত্রে আমরা সাধারণত non-parametric test করে থাকি। তার আগে একটু বোঝা দরকার কেন ডেটা normal না হলেও বা ডেটায় outlier থাকলেও non-parametric test ব্যবহার করতে সাধারণত সমস্যা হয় না।

কেন নন-প্যারামেট্রিক টেস্ট স্থিতিশীল?

এর মূল কারণ হলো, non-parametric test বেশিরভাগ ক্ষেত্রেই ডেটার আসল সংখ্যাগুলোকে সরাসরি ব্যবহার করে না। বরং এগুলো ডেটাকে rank বা order‑এ রূপান্তর করে বিশ্লেষণ করে। অর্থাৎ কোন মানটা বড়, কোনটা ছোট – এই ক্রমটাই এখানে বেশি গুরুত্বপূর্ণ হয়ে যায়।

উদাহরণ: ধরা যাক একটি ক্লাসে পাঁচজন শিক্ষার্থীর নম্বর হলো ৪৫, ৫০, ৫২, ৫৫ এবং ৯৫। এখানে ৯৫ একটি outlier। সরাসরি সংখ্যা দিয়ে analysis করলে ৯৫ গড়কে অনেকটা প্রভাবিত করে। কিন্তু ডেটাকে rank‑এ রূপান্তর করলে এগুলো হবে ১, ২, ৩, ৪, ৫। তখন ৯৫ আর অস্বাভাবিক প্রভাব ফেলে না, কারণ শুধু তার অবস্থানটাই বিবেচনা করা হচ্ছে। এই কারণেই non-parametric test distribution‑এর উপর খুব বেশি নির্ভর করে না।

১. Mann-Whitney U test

যখন দুটি আলাদা গ্রুপের মধ্যে পার্থক্য দেখতে চাই তখন আমরা এই টেস্ট করে থাকি। এটি Independent samples t‑test‑এর নন-প্যারামেট্রিক বিকল্প।

উদাহরণ: একটি ক্লাসে দুইটি সেকশন A ও B। আপনি জানতে চান পরীক্ষার নম্বরের দিক থেকে এই দুই সেকশনের মধ্যে কোনো পার্থক্য আছে কি না। যদি নম্বরগুলো normal distribution অনুসরণ না করে, তাহলে Mann-Whitney test ব্যবহার করা যেতে পারে।

২. Wilcoxon Signed-Rank test

এটা ব্যবহার করা হয় একই গ্রুপের আগে-পরে পরিবর্তন দেখতে (paired samples)। Paired t‑test‑এর নন-প্যারামেট্রিক বিকল্প।

উদাহরণ: ২০ জন রোগীকে একটি ওষুধ দেওয়ার আগে এবং পরে তাদের রক্তচাপ পরিবর্তন হয়েছে কি না – এই ক্ষেত্রে Wilcoxon Signed-Rank test ব্যবহার করি।

৩. Kruskal-Wallis test

এটাকে one‑way ANOVA‑এর নন-প্যারামেট্রিক বিকল্প হিসাবে ধরা হয়। যখন তিন বা তার বেশি স্বাধীন গ্রুপ তুলনা করতে হয় এবং ডেটা normal না, তখন এই টেস্ট ব্যবহার করা হয়।

উদাহরণ: তিনটি ভিন্ন ক্লাসের শিক্ষার্থীদের পরীক্ষার নম্বর তুলনা করা।

৪. Friedman test

এই টেস্ট repeated measures ANOVA‑এর নন-প্যারামেট্রিক বিকল্প। অর্থাৎ একই ব্যক্তির উপর একাধিক সময়ে measurement নেওয়া হলে এবং ডেটা normal না হলে এই টেস্ট ব্যবহার করা যায়।

উদাহরণ: একই রোগীদের তিনটি ভিন্ন সময়ে চিকিৎসার ফলাফল দেখা (মাস ১, মাস ২, মাস ৩)।

৫. Spearman’s rank correlation

দুটি ভেরিয়েবলের মধ্যে সম্পর্ক আছে কি না তা দেখতে ব্যবহৃত হয়, বিশেষ করে যখন ডেটা normal না বা ডেটা rank আকারে থাকে। এই টেস্টে ডেটাকে আগে rank বা ক্রমে সাজানো হয়, তারপর সেই র‌্যাংকের ভিত্তিতে সম্পর্ক নির্ণয় করা হয়। এটি Pearson correlation‑এর নন-প্যারামেট্রিক বিকল্প।

উদাহরণ: একজন শিক্ষার্থী দিনে কত ঘণ্টা পড়াশোনা করে এবং পরীক্ষার ফলাফলের মধ্যে কোনো সম্পর্ক আছে কি না।

৬. Kendall’s Tau

এটাও দুটি ভেরিয়েবলের মধ্যে সম্পর্ক পরিমাপ করতে ব্যবহার করা হয়, বিশেষ করে যখন ডেটা ranked এবং অনেক tie value থাকে। Tie value বলতে বোঝায় যখন একাধিক পর্যবেক্ষণের র‌্যাংক একই হয় (যেমন দুইজন শিক্ষার্থী পরীক্ষায় একই নম্বর পেয়ে একই অবস্থানে থাকে)। এই ধরনের পরিস্থিতিতে Kendall’s Tau অনেক সময় Spearman correlation‑এর তুলনায় বেশি স্থিতিশীল ফলাফল দিতে পারে।

উদাহরণ: একটি সমীক্ষায় অংশগ্রহণকারীদের আয়ের rank এবং শিক্ষার স্তরের rank‑এর মধ্যে সম্পর্ক – যেখানে অনেক সমান rank থাকতে পারে।

নন-প্যারামেট্রিক টেস্ট আমাদের ডেটার প্রকৃতি নিয়ে কম চিন্তা করতে শেখায়। এরা র‌্যাঙ্কিংয়ের মাধ্যমে outlier ও non‑normality‑র প্রভাব কমিয়ে আনে। সঠিক টেস্ট নির্বাচন করুন, আপনার গবেষণা হোক আরও নির্ভরযোগ্য।

লেখক Md. Rafsan

মো. রাফছান একজন লেখক, কলামিস্ট, সংগঠক ও গ্রাফিক্স ডিজাইনার। তিনি চট্টগ্রাম বিশ্ববিদ্যালয়ের ইনস্টিটিউট অব মেরিন সায়েন্স-এর শিক্ষার্থী এবং তরুণ কলাম লেখক ফোরাম, চবি-র প্রতিষ্ঠাতা ও উপদেষ্টা। সমাজে ইতিবাচক পরিবর্তন আনার লক্ষ্যে তরুণদের সঙ্গে কাজ করছেন। সঠিক তথ্য, সচেতনতা এবং সহযোগিতার মাধ্যমে একটি সমতা ও মানবিকতা-ভিত্তিক সমাজ গড়াই তাঁর মূল উদ্দেশ্য।

0 Comments:

একটি মন্তব্য পোস্ট করুন