مقادیر گمشده ای که کاربر مشخص می کند.
مقادیر گمشده کاربر مقادیری است که می بایست از تحلیل حذف شوند. ما این کار را بوسیله مشخص کردن مقادیری بعنوان مقادیر از دست رفته در SPSS انجام میدهیم. برای متغیر های ترتیبی ما معمولاً پاسخ هایی نظیر "نمی دانم" یا "غیر عملی" است را به عنوان مقادیر گمشده محسوب می کنیم. برای متغیر های متریک معمولاً مقادیر پرت که بسیار بالا و یا بسیار پایین هستند را بعنوان متغیر گمشده در نظر می گیریم. حال این سوال مطرح است که چگونه بدانیم که آیا یک متغیر شامل مقادیر گمشده هست یا نه؟ جهت انجام این کار، برای متغیر های ترتیبی از جداول فراوانی و نمودار میله ای استفاده می کنیم و برای متغیر های متریک از نمودار هیستوگرام می توان استفاده کرد. به چند مثال توجه کنید.
اجرای جداول فراوانی و نمودار میله ای با استفاده از دستورات پنجره Syntax
ابتدا نگاهی به متغیر ضضq2 می اندازیم. این یک متغیر ترتیبی است. ما جدول فراوانی و نمودار میله ای این متغیر را رسم می کنیم. دستورات مربوطه در پنجره Syntax نشان داده شده است.
نتیجه اجرای این دستور در شکل زیر نشان داده شده است.
ابتدا توجه کنید که در خصوص امکانات هتل مقادیر بالاتر به نظر مثبت تر اشاره دارد. اما گزینه 6 (بدون جواب) به معنای نظر مثبت تر نسبت به گزینه 5 نیست. پس ما آنرا به عنوان یک مقدار گمشده در نظر می گیریم.
.missing values q2 6
حال اگر مجدداً نمودار میله ای را اجرا کنیم می بینیم که گزینه "بدون جواب" از گزینه های معتبر حذف گردیده است.
حال قصد داریم متغیر rprice که یک متغیر متریک است را از نظر مقادیر پرت بررسی کنیم. پس دستور زیر را برای رسم نمودار هیستوگرام اجرا می کنیم.
.frequencies rprice/histogram
نتیجه در شکل زیر نشان داده شده است. این نتیجه تا حدی عجیب است زیرا نشان می دهد که برخی از مردم برای اتاقهای هتل مبلغ 999,999 یورو پرداخت می کنند. همچنین توجه داشته باشید که قیمت متوسط پرداختی برای اتاقهای هتل 3400 یورو است.
مشکلی که وجود دارد ان است که احتمالاً عدد 999999 یک کد است که نشان می دهد 999999 پوند یک داده پرت است. پس ما آن را بوسیله دستور زیر به عنوان یک داده گمشده در نظر می گیریم.
.missing values rprice 999999
حال اگر نمودار هیستوگرام را دوباره اجرا کنیم نتایج منطقی تری را خواهیم داشت و میبینیم که متوسط قیمت یک اتاق هتل در حدود 80 پوند است.
من در این آموزش از جداول فراوانی و نمودار میله ای برای همه متغیر های دسته بندی شده و از نمودار هیستوگرام برای متغیر های متریک استفاده کردم تا ببینم که آیا نیازی هست که برخی از مقادیر را به عنوان مقادیر گمشده در نظر بگیرم یا نه. بعد از انجام این کار تعدادی از مقادیر گمشده را بررسی کردیم (مقادیر گمشده سیستمی و مقادیر گمشده کاربر) . نکته مهم این است که متغیر هایی که شامل تعداد زیادی از مقادیر گمشده باشد یک متغیر نامطلوب است و می بایست از تحلیل حذف گردد.
برای مثال بیایید متغیرq3 را بررسی کنیم. این یک متغیر ترتیبی است بنابراین ما جدول فراوانی و نمودار میله آنرا رسم می کنیم.
.frequencies q3/barchart
نتیجه در جدول زیر نشان داده شده است.
دقت کنید که 96.5% از مقادیر، مقادیر گمشده سیستمی هستند و ما تعداد کمی جواب های واقعی داریم که می توانیم در مجموع این متغیر را حذف نماییم.
از توجه شما سپاسگزارم.
دکتر مجتبی فیاض: مدرس دوره های تحقیق، پژوهش و تحلیل اماری
آدرس ایمیل من: mojtaba_fayaz@yahoo.com
شماره همراه: 09131171497