ورود کاربر

تحلیل آماری با spss

شما اینجا هستید

خانه

آماده سازی داده ها 4- تعیین مقادیر گمشده

مقادیر گمشده ای که کاربر مشخص می کند.

مقادیر گمشده کاربر مقادیری است که می بایست از تحلیل حذف شوند. ما این کار را بوسیله مشخص کردن مقادیری بعنوان مقادیر از دست رفته در SPSS انجام میدهیم. برای متغیر های ترتیبی ما معمولاً پاسخ هایی نظیر "نمی دانم" یا "غیر عملی" است را به عنوان مقادیر گمشده محسوب می کنیم. برای متغیر های متریک معمولاً مقادیر پرت که بسیار بالا و یا بسیار پایین هستند را بعنوان متغیر گمشده در نظر می گیریم. حال این سوال مطرح است که چگونه بدانیم که آیا یک متغیر شامل مقادیر گمشده هست یا نه؟ جهت انجام این کار، برای متغیر های ترتیبی از جداول فراوانی و نمودار میله ای استفاده می کنیم و برای متغیر های متریک از نمودار هیستوگرام می توان استفاده کرد. به چند مثال توجه کنید.

اجرای جداول فراوانی و نمودار میله ای با استفاده از دستورات پنجره Syntax

ابتدا نگاهی به متغیر ضضq2 می اندازیم. این یک متغیر ترتیبی است. ما جدول فراوانی و نمودار میله ای این متغیر را رسم می کنیم. دستورات مربوطه در پنجره Syntax   نشان داده شده است.

 

Description: http://www.spss19.ir/image/s%20syntax%20frequency%20and%20chart%20bar.png

نتیجه اجرای این دستور در شکل زیر نشان داده شده است.

Description: http://www.spss19.ir/image/s%20spss-user-missing-values-in-frequency-table.png

ابتدا توجه کنید که در خصوص امکانات هتل مقادیر بالاتر به نظر مثبت تر  اشاره دارد. اما گزینه 6 (بدون جواب) به معنای نظر مثبت تر نسبت به گزینه 5 نیست. پس ما آنرا به عنوان یک مقدار گمشده در نظر می گیریم.

.missing values q2 6

حال اگر مجدداً نمودار میله ای را اجرا کنیم می بینیم که گزینه "بدون جواب" از گزینه های معتبر حذف گردیده است.

نمودار هیستو گرام

حال قصد داریم متغیر rprice که یک متغیر متریک است را از نظر مقادیر پرت بررسی کنیم. پس دستور زیر را برای رسم نمودار هیستوگرام اجرا می کنیم.

.frequencies rprice/histogram

نتیجه در شکل زیر نشان داده شده است. این نتیجه تا حدی عجیب است زیرا نشان می دهد که برخی از مردم برای اتاقهای هتل مبلغ 999,999 یورو پرداخت می کنند. همچنین توجه داشته باشید که قیمت متوسط پرداختی برای اتاقهای هتل 3400 یورو است.

Description: http://www.spss19.ir/image/s%20spss-histogram-with-user-missing-values.png

مشکلی که وجود دارد ان است که احتمالاً عدد 999999 یک کد است که نشان می دهد 999999 پوند یک داده پرت است. پس ما آن را بوسیله دستور زیر به عنوان یک داده گمشده در نظر می گیریم.

.missing values rprice 999999

حال اگر نمودار هیستوگرام را دوباره اجرا کنیم نتایج منطقی تری را خواهیم داشت و می‌بینیم که متوسط قیمت یک اتاق هتل در حدود 80 پوند است.

مقادیر گمشده در متغیر ها

من در این آموزش از جداول فراوانی و نمودار میله ای برای همه متغیر های دسته بندی شده و از نمودار هیستوگرام  برای متغیر های متریک استفاده کردم تا ببینم که آیا نیازی هست که برخی از مقادیر را به عنوان مقادیر گمشده در نظر بگیرم یا نه. بعد از انجام این کار تعدادی از مقادیر گمشده را بررسی کردیم (مقادیر گمشده سیستمی و مقادیر گمشده کاربر) . نکته مهم این است که متغیر هایی که شامل تعداد زیادی از مقادیر گمشده باشد یک متغیر نامطلوب است و می بایست از تحلیل حذف گردد.

برای مثال بیایید متغیرq3  را بررسی کنیم. این یک متغیر ترتیبی است بنابراین ما جدول فراوانی و نمودار میله آنرا رسم می کنیم.

.frequencies q3/barchart

نتیجه در جدول زیر نشان داده شده است.

Description: http://www.spss19.ir/image/s%20spss-system-missing-values-in-frequency-table.png

دقت کنید که 96.5% از مقادیر، مقادیر گمشده سیستمی هستند و ما تعداد کمی جواب های واقعی داریم که می توانیم در مجموع این متغیر را حذف نماییم.

 

از توجه شما سپاسگزارم.

دکتر مجتبی فیاض: مدرس دوره های تحقیق، پژوهش و تحلیل اماری

آدرس ایمیل من: mojtaba_fayaz@yahoo.com

شماره همراه: 09131171497

ارتباط با ما

دکتر مجتبی فیاض

همراه : ۰۹۱۳۱۱۷۱۴۹۷

ایمیل:mojtaba_fayaz@yahoo.com

سامانه پیام کوتاه:۳۰۰۰۶۱۳۲۰۰۸۰۰۰

کانال تلگرام: spss19withfayaz@

اینترنت پر سرعت ایران گیت