ورود کاربر

تحلیل آماری با spss

شما اینجا هستید

خانه

آماره های توصیفی برای متغیرهای سطح بندی شده

هنگام گزارش دادن در باره داده ها، ما معمولاً داده ها را خلاصه می کنیم. ساده‌ترین راه برای انجام این کار مشاهده توزیع فراوانی داده ها است. در این مورد مشاهده نمودار هیستوگرام یک بینش سریع در خصوص متغیر ها به ما خواهد داد به خصوص هنگامی که تعداد زیادی مقادیر متمایز وجود داشته باشد.

با این حال توزیع فراوانی ها اغلب جزییات بیشتری از آنچه به آن نیاز داریم در اختیار ما می‌گذارد. برخی از اوقات ما فقط می خواهیم که میانگین متغیر را بدانیم زیرا دانستن همین آماره برای مقایسه دو متغیر کافیست و مقایسه دو عدد، نسبت به مقایسه دو جدول کار آسانتری است.همین موضوع در مورد گروهی از داده ها (سطرها و یا ستونها) نیز صادق است. برای مثال پاسخ دهندگان مرد در مقابل پاسخ دهندگان زن.

اما اینکه کدام آماره برای خلاصه سازی متغیر داده شده مناسب است به سطوح اندازه گیری متغیر بستگی دارد. در این آموزش قصد دارم به بررسی متغیرهای اسمی بپردازم.

مد

یک آماره مناسب برای برخی از متغیر ها (مانند متغیرهای اسمی) آماره مد است. مد مقداری است که بیشترین فراوانی را در بین داده ها دارد. توجه کنید که در برخی از موارد ممکن است دو و یا حتی چند مقدار دارای بیشتربن فراوانی باشند، در این موارد متغیر ما دارای دو و یا چند مد است. چنانچه در فایل employee data  متغیر Education Type  را بررسی کنیم می بینیم که مد این متغیر "Law" است. مقدار فراوانی این گزینه 4 است و فراوانی مابقی گزینه ها  از این مقدار کمتر است.

برای متغیر هایی با تعداد زیادی مقادیر متمایز، مد اغلب به یک بازه از داده ها اشاره دارد (بیشترین درآمد بین 2000 تا 2250 دلار است). چگونگی گروه بندی مقادیر در بازه های مختلف بستگی به نظر تحلیلگر دارد. اگر بازه گروه‌بندی تغییر کند، مد متفاوتی از مد قبلی خواهیم داشت.

در صدها

از درصد برای متغیر های ترتیبی و متریک استفاده می کنیم. اجازه دهید که در فایل فوق توزیع فراوانی متغیر Experience را در نظر بگیریم. دقت کنید که مقادیر از کم به زیاد مرتب شده اند و ما در صد تجمعی را نیز به جدول اضافه کرده ایم.

Description: http://www.spss19.ir/image/s%20Table%20Experience.png

با توجه به ستون در صد تجمعی می بینیم که 50% از پاسخ دهندگان 1 یا 2 سال تجربه دارند. بنابراین می توانیم نتیجه بگیریم که 50% مابقی دارای سه سال تجربه کاری و یا بیشتر از سه سال می باشند.

میانه

میانه مقداری است که 50 درصد (نیمی ) مشاهدات از آن کوچکتر و 50 درصد (نیمی ) مشاهدات از آن بزرگتر هستند. برخی از افراد معمولاً میانه را با میانگین اشتباه می‌گیرند. برای مثال جمله "نیمی از مردم درآمدی کمتر از متوسط درآمد دارند" درست نیست. بلکه جمله درست این است: "نیمی از مردم درآمدی کمتر از میانه درآمد دارند".

این موضوع را بوضوح در جدول سالهای تجربه کاری که در بالا ارائه کردیم می بینید. میانگین سالهای تجربه 3.1 سال است. و تفریباً 70%  از کارکنان تجربه ای کمتر از میانگین سالهای تجربه دارند. در خصوص میانگین در آموزش های بعدی بطور مفصل تر صحبت خواهیم کرد. ان شاءالله

آنالیز متغیر های سطح بندی شده بطور جداگانه

هنگام تحلیل داده ها، در برخی از موارد فقط می خواهیم اطلاعاتی در باره متغیرها بطور جداگانه داشته باشیم. اولین گام برای دسترسی به این اطلاعات ایجاد جداول و نمودارهای مناسب است. در این آموزش نحوه انجام این کا را  برای متغیرهای دو وجهی و متغیر های سطح بندی شده نشان خواهم داد. برای یادگیری بهتر توصیه می کنم فایل smartphone_users.sav را دانلود کرده و با این آموزش همراه باشید.

Description: http://www.spss19.ir/image/s%20spss-smartphone-users-data-view.png

جداول فراوانی در SPSS

در این فایل داده می خواهیم بدانیم کدامیک از برند گوشی های هوشمند در سال 2011 محبوبیت بیشتری داشته است. فایل داده، حاوی متغیری بنام brand_2011 است که داده های مربوطه را در خود دارد. از آنجائیکه این یک متغیر سطح بندی شده است، جدول مناسب، یک جدول فراوانی ساده است که با فرمان FREQUENCIES بدست می آید. شکل زیر چگونگی انجام آن را نشان می دهد.

Description: http://www.spss19.ir/image/s%20syntax%20show%20value%20labels.png

 

نتیجه اجرای فرامین فوق در شکل زیر نشان داده شده است.

Description: http://www.spss19.ir/image/s%20spss-frequency-table-3.png

نوجه داشته باشید که تعدادی مقادیر گمشده سیستمی وجود دارد. فرض براین است که پاسخ دهندگان ابتدا از گوشی هوشمند استفاده نمی کردند. ما گزارش خود را بر اساس درصد بیان می کنیم.

نتیجه: در سال 2011، 33% از پاسخ دهندگان از گوشی هوشمند سامسونگ استفاده می‌کردند که این موضوع مشخص می کند که گوشی سامسونگ محبوب ترین گوشی در سال 2011 بوده است.

نمودار میله ای برای متغیر های سطح بندی شده

دیدیم که جدول فراوانی اطلاعات ضروری را به ما خواهد داد اما برای نتیجه گیری باید نگاه دقیقتری به این اطلاعات داشته باشیم. انجام این کار رسم بوسیله نمودار میله ای ساده از فراوانی ها میسر است. سریعترین راه برای انجام آن استفاده از فرمان FREQUENCIES  می باشد اما این فرمان به ما اجازه اضافه کردن عنوان برای نمودار را نمی دهد. بنابراین ما نمودار را به شکل متفاوتی رسم خواهیم کرد. مراحل انجام آن در شکل زیر نشان داده شده است.

Description: http://www.spss19.ir/image/s%20spss-create-bar-chart-1a.png

Description: http://www.spss19.ir/image/s%20spss-creat-bar-chart-2a.png

مثال برای فرامین Syntax نمودار میله ای

Description: http://www.spss19.ir/image/s%20syntax%20bar%20chart%20with.png

نتیجه اجرای فرامین Syntax

Description: http://www.spss19.ir/image/s%20spss-bar-chart-basic-1.png

ما اکنون برای ارائه گزارش، یک نمودار میله ای داریم با این حال ممکن است بخواهید که نمودار بهتری را برای استفاده در فایل گزارش داشته باشید. در این صورت می توانید از الگوهای SPSS برای رسم نمودارها استفاده کنید.

مقادیر گمشده سیستمی

تا کنون ما به سادگی مقادیر گمشده سیستمی که در جدول فراوانی وجود داشت را نادیده گرفتیم. برای متغیرهای اسمی می توان مقادیر گمشده سیستمی را تحت عنوان یک دسته دیگر در نظر گرفت. فرامین Syntax  زیر آنرا برای متغیر برند ها انجام می دهد. ابتدا بررسی می کنیم که چه مقادیری برای دسته های مختلف وجود دارد. سپس برای مقادیر گمشده سیستمی مقداری را که در بین مقادیر وجود نداشته باشد در نظر می گیریم. در این مورد ما عدد 6 را برای مقادیر گمشده سیستمی در نظر می گیریم.

مثال برای فرمان Syntax کدگذاری در SPSS

Description: http://www.spss19.ir/image/s%20syntax%20show%20values%20and%20value.png

نتایج اجرای فرامین بالا

Description: http://www.spss19.ir/image/s%20spss-frequency-table-2.png

دقت کنید که جدول فراوانی دیگر شامل هیچ مقدار گمشده ای است. مقادیر گمشده با عدد 6 نشان داده شده است که برچسب آن (No answer) است و فراوانی آن 30 می‌باشد. می بینیم که کد گذاری مقادیر گمشده سیستمی باعث می شود تا جدول فراوانی ما بهتر شود اما مزیت دیگری نیز وجود دارد که متغیرهای برند حاوی هیچ مقدار گمشده‌ای نیستند و نمودار میله ای آنها بر اساس همان پاسخ دهنده است. این ترفند نیاز به تعیین دوباره تعداد پاسخ دهندگان در عنوان را از بین می برد. بنابراین براحتی می توانیم با copy و paste  فرامین Syntax قبلی آن را براحتی ویرایش و اجرا کنیم. Syntax زیر این روش را نشان می دهد.

مثال Syntax نمودار میله ای

Description: http://www.spss19.ir/image/s%20syntax%20create%20bar%20charts%20for.png

نتایج به قرار زیر است.

Description: http://www.spss19.ir/image/s%20spss-bar-chart-basic-2.png

 

 

 

از توجه شما سپاسگزارم.

دکتر مجتبی فیاض: مدرس دوره های تحقیق، پژوهش و تحلیل اماری

آدرس ایمیل من: mojtaba_fayaz@yahoo.com

شماره همراه: 09131171497

ارتباط با ما

دکتر مجتبی فیاض

همراه : ۰۹۱۳۱۱۷۱۴۹۷

ایمیل:mojtaba_fayaz@yahoo.com

سامانه پیام کوتاه:۳۰۰۰۶۱۳۲۰۰۸۰۰۰

کانال تلگرام: spss19withfayaz@

اینترنت پر سرعت ایران گیت