لازم است گاهی ...

لازم است گاهی از خانه بیرون بیایی و خوب فکر کنی ببینی باز هم می‌خواهی به آن خانه برگردی یا نه ؟!

 

 

لازم است گاهی از مسجد ، کلیسا و... بیرون بیایی و ببینی پشت سر اعتقادت چه میبینی، ترس یا حقیقت ؟!

 

 

لازم است گاهی از ساختمان اداره بیرون بیایی، فکر کنی که چقدر شبیه آرزوهای نوجوانیت است ؟

 

 

لازم است گاهی درختی، گلی را آب بدهی، حیوانی را نوازش کنی، غذا بدهی ببینی هنوز از طبیعت چیزی در وجودت هست یا نه ؟!

 

 

لازم است گاهی پای کامپیوترت نباشی، گوگل و ایمیل و فلان و بهمان را بی‌خیال شوی، با خانواده‌ات دور هم بنشینید، یا گوش به درد دل رفیقت بدهی و ببینی زندگی فقط همین آهن‌پارۀ برقی است یا نه ؟!

 

 

لازم است گاهی بخشی از حقوقت را بدهی به یک انسان محتاج، تا ببینی در تقسیم عشق در نهایت تو برنده‌ای یا بازنده ؟!

 

لازم است گاهی عیسی باشی، ایوب باشی، انسان باشی ببینی می‌شود یا نه ؟!

 

و بالاخره لازم است گاهی از خود بیرون آمده و از فاصله‌ای دورتر به خودت بنگری و از خود بپرسی که سال‌ها سپری شد تا آن بشوم که اکنون هستم... آیا ارزشش را داشت...؟!   

 

 زیبائی در فراتر رفتن از روزمره‌گی‌هاست... 

مختصری درباره تاریخچه آمار

 

منشأ ظهور آمار به صورت توصیف اطلاعات را می توان سرشماری‌هایی که حدود 4000 سال قبل از میلاد مسیح توسط بابلی‌ها و مصری‌ها و بعداً توسط امپراتوری‌های روم و ایران درباره اطلاعات مربوط به زاد و ولد و دارائی‌های افراد جامعه زیر سلطه خود انجام می‌گرفته، به حساب آورد. در آن زمان بود که روش‌هایی برای جمع آوری، تنظیم و تلخیص داده‌ها ابداع گردید. در قرن چهاردهم برای محاسبه نرخ بیمه، جمع آوری اطلاعات درباره تولد و وفات، تصادفات و حوادث رایج گردید.

در اواسط قرن شانزدهم اولین کتاب احتمال توسط کاردن با عنوان "بازی‌ها و شانس" نوشته شد، او در این کتاب روش‌های تقلب در بازی‌های قمار را ارائه داد. بعلاوه، موضوع پیش‌بینی در نتایج حاصل از انجام آزمایش‌ها را مطرح نمود. یکی از کارهای او پیش‌بینی روز وفات خودش بود که برای اثبات صحت پیش‌بینی در آن روز خودکشی نمود. 

در اواسط قرن هفدهم پاسکال و فرما اولین کسانی بودند که مطالعه احتمال را به طور علمی شروع نمودند. در همین سال‌ها به طور همزمان مطالعات آماری به صورت توصیفی انجام می‌گرفت. مثلاً گرونت با مطالعه تعداد متولدین کشف نمود که تعداد پسرها از دخترها کمی بیشتر است، اما سال‌های اول زندگی تعداد بیشتری از پسرها فوت می‌کنند. استفاده از احتمال در آمار، در اواخر قرن هفدهم شروع شد، که در این باره می‌توان به مطالعات مندل در مورد قانون وراثت، گالتون در بکارگیری همبستگی و ارتباط بین صفات، و به ویژه فیشر در ابداع روش‌های مختلف استنباط آماری اشاره نمود. از شروع قرن بیستم همه ساله روش‌های متعددی برای جمع آوری، تجزیه و تحلیل اطلاعات ارائه گردیده که همچنان ادامه دارد. مفهوم آمار از کلمه لاتینی ،به معنی شرط ، استخراج شده است. مدت‌های مدید، این علم، محدود به کار در این حوزه بود، و تنها در دهه‌های اخیر از این انحصار جدا شد و به کمک نظریه احتمال، شروع به بررسی روش‌های تحلیل داده‌های آماری و اثبات فرض‌های آماری کرد. روش‌های این آمار ریاضی با آشکار کردن قوانین جدید، به ابزاری موثر در علوم طبیعی و تکنولوژی تبدیل شد. 

تاریخچه علم آمار در ایران

آمار، امار، هامار، شمار و شماره از مصدر اوستايي « مر » معني حساب، شمردن، شمارش، به ياد داشتن، از برداشتن. بنابراين آمار يك كلمه پارسي است كه در ادوار مختلف با گويش هاي متفاوت به كار رفته است.در مفهوم كلي، آمار مجموعه داده‌هاي عددي مربوط به يك موضوع است. تا قبل از قرن 19 از آمار در زمينه‌هاي محدود نظير مسايل مالياتي و نظامي استفاده شده و با شروع قرن 19 همراه با تحولات اجتماعي-اقتصادي كه در اروپا و سپس در ساير نقاط جهان پديد آمد انجام خدمات اجتماعي به عنوان يك وظيفه براي كشورها مطرح و بدنبال آن ضرورت برنامه‌ريزي براي ارايه اين خدمات كاربرد آمار را به طور فزاينده گسترش داد تا آن جا كه امروزه در كليه زمينه‌هاي اجتماعي-اقتصادي به عنوان اصلي‌ترين وسيله شناخت نيازها و امكانات و مهمترين ابزار برنامه‌ريزي به شمار مي‌رود.آمار و آمارگيري و سرشماري از دير باز در كشورهاي مختلف جهان سابقه داشته و عموماً به منظور جمع آوري اطلاعات در زمينه امور مالياتي و نظامي استفاده شده است. واژه آمار ریشه در تاریخ، زبان و فرهنگ کهن ایرانی دارد و قدمت آن به زمان هخامنشیان می رسد. در زمان هخامنشيان آمار و آمارگيري و سرشماري از جهات مختلف مورد توجه بوده و كراراً براي تعيين تعداد نفوس و ميزان محصولات كشاورزي انجام شده است و تا اواسط دوره اشکانیان واژه هامار یا آمار به معنی شمار و واژه شاهامار به معنی سرشماری به کار می‌رفته است. به گواه سنگ نوشته‌ها و آثار مورخان شرق شناس، در زمان داریوش، به منظور جمع آوری آمار، تشکیلات منظمی وجود داشته است و با استفاده از اطلاعات جمع آوری شده، دفاتر مالیاتی و نظامی تدوین می‌یافته و بودجه مملکتی بر اساس آن تنظیم می‌شده است. در زمان کوروش نیز آمارگیری در مقیاس وسیع و در تمام پهنه ممالک تابعه حکومت مرکزی ایران انجام می‌شده و اخذ هرگونه تصمیم درباره ولایات بایستی مبتنی بر شناسائی‌های محلی و اطلاع دقیق بر کثرت و یا قلّت جمعیت و قدرت و توانایی‌های مالی آن ولایات باشد. ساسانیان توجه بیشتری به آمار داشتند و امور مالی، کشاورزی و صنعتی و بازرگانی خود را بر اساس آمارها و اطلاعاتی که مأموران سرشماری جمع آوری می‌کردند، به انجام می‌رساندند. به گونه‌ای که در زمان خسرو انوشیروان، برای اخذ مالیات سرانه، ضمن انجام سرشماری نفوس، سن افراد و میزان ثروت آنها تعیین می‌شد و حتی میزان محصول درختانی مثل نخل، زیتون و تاک تعیین می‌گردید و بر اساس آن برای افرادی که سن آنها بین 20 تا 50 سال بود، مطابق ثروت و مکنتی که داشتند، مالیات تعیین می‌گردید.بعد از ظهور اسلام در ايران، آمارهاي جمعيتي بيشتر به منظور تعيين تعداد پيروان اديان مختلف جمع آوري مي‌شد و در همين دوران ثبت جمع آوري آمارهاي مربوط به ورود و خروج مسافران و مهاجران و ميزان صادرات و واردات شهرها از طريق دروازه‌بانها و ماموران حكومتي در دروازه‌ها انجام مي‌گرفت.در سال 1297 هجري شمسي به منظور ثبت وقايع چهارگانه اداره ثبت احوال كشور تأسيس و با ثبت اطلاعات مرتبط با تولد، فوت، ازدواج و طلاق توسط اداره مذكور ضرورت اطلاع از جمعيت كشور و تعيين سازماني كه موظفاً به جمع آوري اين اطلاعات بپردازد مورد توجه قرار گرفت و منجر به آن شد تا در سال 1303 هجري شمسي آيين نامه‌اي به تصويب برسد و در اين آيين نامه اداره مسئول آمار و وظايف آن مشخص گردد. براساس اين مصوبه مسئوليت جمع آوري و مركزيت بخشيدن به آمارهاي مورد نياز بر عهده وزارت كشور گذاشته شد.در خرداد ماه 1318 هجري شمسي اولين قانون سرشماري از تصويب مجلس شوراي ملي گذشت و در اجراي اين قانون، سرشماري نفوس از همان سال در شهر تهران و در سال 1319 و 1320 هجري شمسي در 33 شهر كشور بتدريج به اجرا درآمد ولي ادامه آن به خاطر وقايع شهريور 1320 معوق ماند.در اسفند ماه سال 1331 هجري شمسي سازمان همكاري آمار عمومي تشكيل و در فروردين ماه سال 1332 قانون آمار و ثبت احوال متنوع و به سازمان همكاري آمار عمومي ملحق شد و به اين ترتيب براي اولين بار سازماني كه منحصراً وظيفه جمع آوري آمار را به عهده داشت به وجود آمد كه در سال 1344 به اداره آمار عمومي وابسته به وزارت كشور تغيير نام و اين اداره در سال 1335 هجري شمسي اولين سرشماري عمومي نفوس را در كل كشور به اجرا درآورد.نياز روز افزون دستگاه‌هاي برنامه‌ريزي كشور به آمار و اطلاعات و ضرورت همكاري بسيار نزديك سازمان اصلي توليد كننده آمار با دستگاه برنامه‌ريزي موجب شد تا براساس قانون سال 1344 اداره آمار عمومي از وزارت كشور جدا و با نام مركز آمار ايران به سازمان برنامه و بودجه وابسته شده و اين مركز به عنوان اولين اقدام سرشماري عمومي نفوس و مسكن را طبق قانون در آبان ماه 1345 به مرحله اجرا درآورد و فعاليت‌هاي ديگري مثل آمارگيري از هزينه و درآمد خانوارهاي شهري و روستايي، آمارگيري نمونه‌اي كشاورزي روستايي، سرشماري عشاير و سرشماري از كارگاه‌هاي بزرگ و صنعتي و غيره را انجام داد. مطابق قانون تأسيس اين مركز، سرشماري كه منظور آمارگيري‌هايي كه كليه افراد و واحدهاي جامعه مورد مطالعه را در بر گيرد و در مواعد مشخص به منظور جمع آوري اطلاعات در زمينه فعاليت‌هاي اقتصادي و اجتماعي مانند نفوس، مسكن، كشاورزي، صنعت، ساختمان- بازرگاني-فرهنگي و ساير فعاليت‌ها صورت مي‌گيرد را انجام مي‌دهد و همچنين آمارگيري نمونه‌اي كه در واقع جمع آوري اطلاعات آماري از تعدادي افراد يا واحدهاي جامعه براساس روش‌هاي علمي آماري كه نتايج آن قابل تعميم باشد را عهده دار است.

 

منابع:

1- http://daneshnameh.roshd.ir
2- 
http://www.cityonline.5u.com
3- 
http://stats.blogfa.com
4-
http://sepideh_statistic.persianblog.ir


نوشته شده از  http://rasekhoon.net

معرفی روش تحلیل تکینی طیفی (SSA) - زمینه سری‌های زمانی

                                   

 

 با توجه به اینکه در زمینۀ تحلیل سری‌های زمانی تلاش‌های زیادی برای معرفی روش‌های توانمند شده است اکثر این روش‌ها فرض‌های محدود کننده‌ای مانند نرمال و خطی بودن مشاهده‌ها را در نظر می‌گیرند.

راه حلی برای این معضل، برداشتن فرض‌های محدود كننده و تلاش در جهت یافتن روشی ناپارامتری است كه در عین برخوردار بودن از توانمندی بالا، نسبت به نوفۀ موجود در مشاهده‌های زمانی استوار باشد. در حال حاضر برای برازش مدل به داده‌های دارای نوفه دو رهیافت متفاوت وجود دارد. در رهیافت اول بدون در نظر گرفتن وجود نوفه، مستقیماً یک مدل به داده‌های دارای نوفه برازش داده می‌شود اما در رهیافت دوم ابتدا داده‌ها را با استفاده از صافی‌های مناسب خالص نموده تا سطح نوفۀ داده‌ها کاهش یابد و سپس به داده‌های با نوفه کمتر مدل برازش داده می‌شود. حال چنانچه نوفه به میزان قابل توجهی از داده‌ها حذف شود، انتظار می‌رود که نتایج رهیافت دوم بهتر از رهیافت اول باشد.

روش‌های کاهش نوفۀ متعددی وجود دارد که در بین آنها روش‌های مبتنی بر تجزیۀ مقدار تکین از توانمندی بیشتری برخوردارند. برای تحلیل سری‌های زمانی و پردازش سیگنال‌ها روش‌های متعددی كه مبتنی بر

تجزیۀ مقدار تکین ماتریس‌های خاصی هستند، معرفی شده است؛ اما اكثر آنها مبتنی بر مانا بودن سری زمانی اصلی هستند. چند منبع در این خصوص معرفی نموده‌اند كه برای اطلاعات بیشتر می‌توان به آنها مراجعه كرد (گولیندینا و همکاران،2001).

تحلیل تکینی طیفی(SSA)یكی از روش‌های ناپارامتری جدید و قدرتمند (مبتنی بر تجزیۀ مقدار تکین) برای تحلیل داده‌ها است که هم برای کاهش سطح نوفه و هم برای مدل‌سازی مورد استفاده قرار می‌گیرد.

این روش با در نظر گرفتن ویژگی‌های مسایل کاربردی متنوعی مانند مطالعه سری‌های زمانی کلاسیک، آمار چندمتغیره، هندسه چندمتغیره، سیستم‌های دینامیکی و پردازش سیگنال، طراحی شده است و لذا گسترۀ كاربرد آن شامل علوم متنوعی است. با این وجود از لحاظ آمار نظری هنوز كار قابل توجهی در خصوص این روش صورت نگرفته است و از این جهت در بین آماردانان ناشناخته‌تر است.

اولین کار در رابطه با این روش در ایران، توسط نادر نجاری (در سطح کارشناسی ارشد) و رحیم محمودوند (در سطح دکتری) در دانشگاه شهید بهشتی تهران زیر نظر آقای دکتر محمد ذکایی انجام شده است.

 

مقدمه ای بر نرم افزار R

 

 R يك نرم‎افزار آماري با قابليت برنامه‌نویسی است که شباهت زيادي به نرم‎افزار S-PLUS دارد و برای انواع محاسبات آماری طراحی شده است. نرم‎افزار R توسط دو فرد به نام‌های رابرت جنتلمن و راس ایحاکا (این نرم‌افزار به‌خاطر اینکه نام‌ این دو پژوهشگر با حرف R شروع شده به این نام، نام‌گذاری شده است!) در گروه آمار دانشگاه آوکلند نیوزلند در سال 1995 طراحی شده است.

نشانی صفحه وب این نرم‌افزار http://www.r-project.orgاست و آدرس اینترنتی  http://cran.um.ac.irجهت دانلود فایل اجرایی نرم‌افزار و بسته‌های آن است.

 

مزایای مهم نرم‌افزار R

·        رایگان بودن و کد باز (Open Source) بودن

·        قابلیت نصب روی اکثر سیستم‌های عامل از جمله توزیع‌های مختلف لینوکس، ویندوز و مک.

·        سرعت در دست‌یابی به تکنیک‌های جدید در قالب کتابخانه‌ها و توابع آماده

·        کمک به یادگیری ادبیات جدید آمار با توجه به استفادۀ گسترده متخصصان برجستۀ آمار از R

·        قابلیت اضافه کردن و نوشتن برنامه‌های جدید در R

 

طریقه نصب بر روی سیستم عامل ویندوز و به‌روز کردن  R

اگر برای اولین بار است که می‌خواهید R را بر روی سیستم عامل ویندوز خود نصب نمایید، ابتدا فایل اجرایی R را از  مسیر http://cran.um.ac.ir دانلود کرده و مراحل نصب آن را همانند دیگر نرم‌افزارها دنبال می‌کنیم. با اتمام مراحل نصب آیکونی به شکل  R در صفحه میزکار قرار می‌گیرد. با دوبار کلیک بر روی این آیکون، پنجره‌ای باز می‌شود که شامل قسمت‌های زیر است:

·        پنجره R Console که مربوط به محیط برنامه‌نویسی و خروجی‌های حاصل از اجرای فرامین است.

·        نوار  منو که شامل منوهای  ذخیره و بازیابی، ویرایش، بارگذاری بسته‌ها، راهنما و ... است.

·        نوار ابزار که شامل برخی آیکون‌های میانبر برای فرمان‌های پرکاربرد R است.

در صورتی که قبلا R را بر روی سیستم عامل ویندوز خود نصب کرده‌اید و اکنون با ورود نسخه جدیدی از R  مایل به به‌روز کردن نرم‌افزار R خود هستید، کافی است به مسیر C:\Program Files\R\R-2.xx.x، رفته و محتویات پوشۀ library را در محل دیگری خارج از این مسیر کپی نمایید. سپس نسخه قبلی را uninstall نموده و نسخه جدید را به روشی که در بالا عنوان شد، نصب کنید. حال محتویات فایل library که قبلا کپی نموده‌اید را در مسیر نصب R جدید در پوشه library  کپی می‌کنیم و دستور زیر را برای به‌روز کردن کتابخانه‌های نصب شده در نسخه قبلی اجرا می‌کنیم.

>update.packages(ask=F,repos="http://cran.um.ac.ir")

با این‌کار تمامی کتابخانه‌هایی که قبلا نصب کرده‌اید به صورت به‌روز شده قابل دسترسی و اسفاده خواهند بود.. از گزینه‌های موجود در منویPackages، که در قسمت نوار ابزار قرار دارد، نیز می‌توان برای اینکار استفاده کرد.

 

نکات قابل توجه در R

ــ  خط فرمان در R به صورت < و به رنگ قرمز است. در صورتی که دستور یا برنامه‌ای ناقص باشد این علامت به علامت + تبدیل می‌شود.

ــ  پاک کردن صفحه با کلیدهای میان‌بر Ctrl+L انجام می‌شود.

ــ  فراخوانی دستورات نوشته شده با استفاده از کلیدهای جهت‌نمای بالا و پایین امکان پذیر است.

 ــ  پاسخ عبارت یا دستور در R، در مقابل اعلان جدیدی ([ ]) به رنگ آبی نمایش داده می‌شود.

ــ  R نسبت به کوچک و بزرگ بودن حروف حساس است و از فاصله‌های اضافی چشم‌پوشی می‌کند.

ــ  برای انتساب نام به یک دستور یا شی، از <-(یا گاهی  از =) استفاده می‌کنیم؛ بنابراین برای فراخوانی آن شی یا دستور، از نام انتساب داده شده به آن استفاده می‌کنیم. به مثال زیر توجه کنید:

> d<-30

با این دستور  برای عدد 30، نام d انتساب داده می‌شود و با دستور

    > d

 

d را فراخوانی می‌کنیم. با اجرای این دستور عدد 30 در خروجی به شکل زیر نمایش داده می‌شود.

[1] 30

 ــ  برای توقف اجرای یک دستور یا برنامه، از کلید ESc استفاده می‌کنیم.

ــ R مقادیر عددی بی‌نهایت را با Inf (یا به ترتیب با Infو Inf) نشان می‌دهد.

ــ  هر شی در R حداقل دارای دو خصوصیت زیر است:

·        ویژگی mode: نوع عناصر شی را مشخص می‌کند که 4 نوع عمده آن عبارت است از: است: عددی، کاراکتری، منطقی و مختلط.

·        ویژگی length: طول (تعداد) عناصر شی را مشخص می‌کند.

ــ  مقادیر گم‌شده در R، با NA نشان داده می‌شود و نماد NaN به مفهوم آن است که مقدار محاسبه شده، عدد مبهمی مثل 0/0 و یا لگاریتم یک عدد منفی و یا ... است..

ــ  پس از اجرای دستورات مربوط به رسم نمودار در R، پنجرۀ جدیدی در R باز می‌شود و نمودار در آن نمایش داده می‌شود. برای کپی یا ذخیره کردن نمودار، روی آن کلیک راست نموده و گزینۀ Copy as metafile یا Copy as bitmap را برای کپی کردن فایل  و گزینۀ Save as metafile…و گزینۀ Save as postscript…را  به ترتیب برای ذخیرۀ فایل با پسوند .emf و پسوند .epsاستفاده می‌کنیم. با ذخیره کردن فایل با پسوند .eps فایل با حجم خیلی کم ذخیره می‌شود.

ــ  برای استفاده از کدهای برنامه‌‌ی یک تابع موجود در R، اغلب کافی است نام تابع را فراخوانی کنیم. به عنوان مثال دستور زیر کدهای برنامه تابع arima را فراخوانی می‌کند.

 arima <

 ــ  راهنمای R

·        منوی Help از چندین قسمت تشکیل شده است. قسمت Manuals (in PDF)شامل فایل‌های راهنمایی در قالبpdf است که هم برخی از دستورات R و هم مبانی نظری و روش‌های آماری را در بر می‌گیرد.

·        استفاده از دستور (نام تابع یا "کاراکتر")help یا به‌جای آن از (نام تابع یا "کاراکتر")؟. برای مثال، دستور help(plot)، راهنمایی‌های لازم را برای تابع plotفراهم می‌کند. البته متذكر مي­شويم كه اين دستور در صورتي قابل استفاده است كه نام تابع را به طور دقيق بدانيم. در غير اين صورت از روشی که در ادامه گفته شده است، استفاده مي­شود.

·        استفاده از دستور (نام تابع یا "کاراکتر"help.search یا به‌جای آن از (نام تابع یا "کاراکتر")؟؟، برای جستجو و یافتن صفحات در موضوعات مبهم استفاده می‌شود. با اجرای این دستور، جستجو در تمام مستندات، عناوین، کلمات کلیدی و ... که به نحوی با نام تابعِ مورد جستجو در ارتباط هستند نمایش داده می‌شود. برای مثال، دستور garch؟؟، کلیۀ مواردی را که به نحوی با تابع garch در ارتباط است نمایش داده می‌شود.

برای اطلاعات بیشتر و یادگیری این نرم‌افزار به کتاب 

مقدمه‌اي بر نرم‌افزار آماري R(در حدود 120 صفحه)
 تالیف: نادر نجاری-رحیم محمودوند با ویراستاری علمی دکتر جواد فردمال (انتشارات صانعی)
مراجعه کنید. این کتاب کلیه مطالب لازم برای یادگیری و برنامه‌نویسی این نرم‌افزار را شامل می‌باشد.
 
   

برآورد مصرف روزانه بنزین شهر تهران

برآورد مصـرف روزانـه بنزیـن توسـط

خانوارهـای شهـر تهـران

چکیــــده

در این طرح ما برای برآورد مصرف بنزین روزانه خانوارهای شهر تهران، اقدام به نمونه گیری دو مرحله ای کرده ایم . در مرحلۀ اوّل کل شهر تهران را بدون توجه به حدود مناطق با عنایت به اینکه تعداد خانوار را به عنوان متغیر اندازه در نظر گرفته ایم ، چنان خوشه بندی کرده ایم که دارای خوشه هایی ، با تعداد خانوار برابر باشند . پس از این کار از بین این خوشه ها، n خوشه بصورت تصادفی ساده بدون جایگذاری انتخاب و در مرحلۀ دوّم هم در داخل این n خوشه منتخب ، از نمونه گیری با احتمال متغیر (با در نظر گرفتن تعداد خانوار بلوکها به عنوان متغیر اندازه) استفاده کرده  و nبلوک را از خوشه iام منتخب در مرحلۀ اوّل انتخاب کرده ایم. سپس با توجه به اینکه  حجم پرسشنامه کم می باشد، این بلوکهای منتخب را سرشماری نموده ایم .
هدف کلی
هدف برآورد کل مصرف روزانه بنزین توسط خانوار های شهر تهران است .
جامعۀ آماری
کل خانوارهایی که در شهر تهران زندگی می کنند، جامعۀ آماری ما را تشکیل می دهد .
واحد آماری
واحد آماری ما در این طرح یک خانوار ساکن شهر تهران می باشد.
توجه : شرکتها و موسسات .کارخانجات جزو این جامعۀ آماری ما نیستند.
زمان آمارگیری
زمان آمارگیری را ما هر فصلی که میزان مهاجرت خانوارهای شهر تهران کم باشد (مثلاً پاییز )، توسعه می کنیم .
زمان آماری (دوره آماری)
ما دورۀ آماری را دورۀ یک ماهه در نظر گرفته ایم یعنی مصرف بنزین یک ماه اخیر خانوارها را در نظر گرفته ایم.
روش جمع آوری اطلاعات
جمع آوری اطلاعات در این طرح از طریق مراجعه مستقیم مامور آمارگیر به واحد آماری و تکمیل پرسشنامه صورت می گیرد .
شیوه‌ی اجرای نمونه گیری
در این طرح ما از نمونه گیری دو مرحله ای استفاده کرده ایم .در مرحلۀ اول ما از بین ٣٠ خوشه 
که نحوۀ تعیین آنها را بیان خواهیم کرد، n خوشه را به طور تصادفی ساده(مثلاً با استفاده از جدول  اعداد تصادفی) انتخاب می کنیم . در مرحلۀ دوّم از هر یک از خوشه های منتخب در مرحلۀ اوّل ni بلوک را با استفاده از روش تجمعی کلی (Cumulative Total Method) که نوعی شیوه‌ی اجرای طرح نمونه گیری PPS می باشد، انتخاب می کنیم و سپس داخل این بلوکها را سر شماری می کنیم .
چارچوب آماری
چارچوب آماری ما در مرحلۀ اوّل فهرست ٣٠ خوشه میباشد که شهر تهران را با آنها افراز کرده ایم و چارچوب آماری مرحلۀ دوّم فهرست تمام بلوکهای آماری در داخل خوشه های منتخب در مرحلۀ اوّل می باشد که ما با توجه به سرشماری سال ١٣٨٥ فهرست این بلوک های آماری به همراه تعداد خانوار هر بلوک شهر تهران را در اختیار داریم .البته باید این فهرست با استفاده از تصاویر ماهواره ای یا نقشه برداری زمینی یا دیگر روشها بهنگام سازی شود ...
 
 با کارشناسان این وبلاگ تماس بگیرید

تحلیل عاملی (Factor Analysis)

 

تحلیل عاملی (Factor Analysis)

معمولاً در تحقیقات به دلایل مختلف با حجم زیادی از متغیرها رو به رو هستیم. برای تحلیل دقیق‌تر داده‌ها از روش تحلیل عاملی یا Factor Analysis جهت پی بردن به متغیرهای زیر بنایی یک پدیده یا تلخیص مجموعه ای از داده‌ها استفاده می‌شود. داده‌های اولیه برای تحلیل عاملی، ماتریس همبستگی بین متغیرها است. تحلیل عاملی، متغیرهای وابسته از قبل تعیین شده ای ندارد.

تحلیل عاملی دارای کاربردهای متعددی است که عبارتند از:

کاهش داده‌ها (Data Reduction)

شناسایی ساختار ( Structure Detection)

سنجش اعتبار (روایی) پرسشنامه با یک مقیاس

موارد استفاده تحلیل عاملی را به دو دسته کلی می‌توان تقسیم کرد:

مقاصد اکتشافی و مقاصد تاییدی. اگر شما هیچ حدسی از ساختار روابط میان گویه ها نداشته باشید از تحلیل عاملی اکتشافی استفاده می شود. اما اگر گویه ها را براساس ابعاد شناسائی کرده باشید باید از تحلیل عاملی تائیدی استفاده کنید.

- تحلیل عاملی اکتشافی (EFA) 
در تحلیل اکتشافی یا Exploratory factor analysis پژوهشگر به دنبال بررسی داده‌های تجربی به منظور کشف و شناسایی شاخصها و نیز روابط بین آنهاست. در اینجا از پیش مدل معینی وجود ندارد. به بیان دیگر تحلیل اکتشافی علاوه بر آنکه ارزش تجسسی یا پیشنهادی دارد می‌تواند ساختارساز، مدل ساز یا فرضیه ساز باشد. تحلیل اکتشافی وقتی به کار می‌رود که پژوهشگر شواهد کافی قبلی و پیش تجربی برای تشکیل فرضیه درباره تعداد عاملهای زیربنایی داده‌ها نداشته و به واقع مایل باشد درباره تعیین تعداد یا ماهیت عامل‌هایی که همپراشی بین متغیرها را توجیه می‌کنند داده‌ها را بکاود. بنابراین تحلیل اکتشافی بیشتر به عنوان یک روش تدوین و تولید تئوری و نه یک روش آزمون تئوری در نظر گرفته می‌شود.

 تحلیل عاملی تائیدی (CFA) 
در تحلیل عاملی تاییدی یاConfirmatory factor analysis پژوهشگر به دنبال تهیه مدلی است که فرض می‌شود داده‌های تجربی را بر پایه چند پارامتر نسبتاً اندک، توصیف تبیین یا توجیه می‌کند. این مدل مبتنی بر اطلاعات پیش تجربی درباره ساختار داده‌ها است که می‌تواند به شکل یک تئوری یا فرضیه، یک طرح طبقه بندی کننده معین برای گویه‌ها در انطباق با ویژگیهای عینی شکل و محتوا،شرایط معلوم تجربی و یا دانش حاصل از مطالعات قبلی درباره دادههای وسیع باشد. روشهای تاییدی (آزمون فرضیه) تعیین می‌کنند که داده‌ها با یک ساختار عاملی معین (که در فرضیه آمده) هماهنگ هستند یا نه.

برگرفته از کتاب لیزرل آرش حبیبی

چنانچه در تحلیل خود نیازمند این آزمون هستید با کارشناسان این وبلاگ تماس بگیرید

 

آزمون های ناپارامتریک

 

آزمون های ناپارامتریک

آمار ناپارامتریک که در خلال جنگ جهانی دوم شکل گرفت در برابر آمار پارامتریک قرار می گیرد. آمار پارامتریک مستلزم پیش فرضهائی در مورد جامعه ای که از آن نمونه گیری صورت گرفته می باشد. به عنوان مهمترین پیش فرض در آمار پارامترک فرض می شود که توزیع جامعه نرمال است اما آمار ناپارامتریک مستلزم هیچگونه فرضی در مورد توزیع نیست. به همین خاطر بسیاری از تحقیقات علوم انسانی که با مقیاس های کیفی سنجیده شده و فاقد توزیع (Free of distribution) هستند از شاخصهای آمارا ناپارامتریک استفاده می کنند.

فنون آمار پارامتریک شدیداً تحت تاثیر مقیاس سنجش متغیرها و توزیع آماری جامعه است. اگر متغیرها از نوع اسمی و ترتیبی بوده حتما از روشهای ناپارامتریک استفاده می شود. اگر متغیرها از نوع فاصله ای و نسبی باشند در صورتیکه فرض شود توزیع آماری جامعه نرمال یا بهنجار است از روشهای پارامتریک استفاده می شود در غیراینصورت از روشهای ناپارامتریک استفاده می شود.

خلاصه آزمونهای ناپارامتریک

آزمون کروسکال- والیس:

آزمون کروسکال- والیس یک آزمون غیر پارامتری و از سری آزمون های آنالیز واریانس محسوب می شود كه برای مقایسه های سه و بيشتر از سه گروه از آن استفاده مي کنیم. آناليز واريانس يك طرفه كروسكال-واليس با استفاده از رتبه ها، آزمون فوق العاده مفيدي براي تصميم گيري در باره اين است كه آيا k گروه نمونه مستقل، از جامعه هاي آماري مختلف آمده اند يا نه؟ بديهي است كه نمونه ها بدون استثنا اختلافاتي با يكديگر خواهند داشت. ولي سوال اين است كه آيا اختلافات مشاهده شده در نمونه ها نماينده اختلافات موجود در جوامع هستند يا ناشي از شانس و تصادف اند؟ 

آزمون مك نمار:

آزمون مك نمار مانند آزمون علامت که قبلا مطرح شد، براي معني دار بودن تغييرات به ويژه براي طرحهاي «قبل از/ بعد از» استفاده مي شود كه در آن هر فرد يا آزمودني به عنوان گواه خود به كار مي رود و در آن يافته ها به صورت اسمي يا رتبه اي هستند. از اين آزمون براي بررسي ميزان تاثير يك «مقاله، كتاب، سخنراني، دوره آموزشي، ملاقات هاي فردي و ...» استفاده مي شود. 

آزمون علامت:

آزمون علامت از دسته آزمون هاي دو نمونه اي وابسته به هم است و نام آزمون علامت از اين حقيقت ناشي مي شود كه در اين آزمون به جاي مقادير عددي، از علامت هاي (+ و -) به عنوان مشاهدات آن استفاده مي شود. اين آزمون بويژه در مواردي كه مقادير عددي امكان ندارد يا مناسب نيست، بسيار مفيد است. مثلا اگر يك پژوهشگر آزمون مهارت هاي زندگي را در بين چند همسر جوان قبل و بعد از يك دوره آموزشي ارزيابي و مقايسه كند، آزمون علامت آزمون مناسبی برای تحلیل اینگونه اطلاعات است.

آزمون ویلکاکسون:

این آزمون از آزمونهای ناپارامتری است که برای ارزیابی همانندی دو نمونه وابسته با مقیاس رتبه ای به کار می‌رود.همچون آزمون مک نمار، این آزمون نیز مناسب طرحهای ماقبل و مابعد است (یک نمونه در دو موقعیت مختلف)، و یا دو نمونه که از یک جامعه باشند. این آزمون اندازه تفاوت میان رتبه ها را در نظر می‌گیرد بنابراین متغیرها می‌توانند دارای جوابهای متفاوت و یا فاصله ای باشند. این آزمون متناظر با آزمون t دو نمونه ای وابسته است و در صورت وجود نداشتن شرایط آزمون t جانشین خوبی برای آن است. نمونه های به کار برده شده در این آزمون باید نسبت به سایر صفت هایشان جور شده (جفت شده) باشند. آزمون ویلکاکسون وقتی است که داده‌‌ها پیوسته باشند مثل زمان و در این آزمون اختلاف رتبه‌ها و جهت اختلاف رتبه‌ها  در نظر گرفته می‌شود.

آزمون کلموگروف - اسمیرنوف:

فرض کنید محققی نمونه ای از انداره های کمی در اختیار دارد و می خواهد تعیین کند که آیا این نمونه از جامعه ای با توزیع نرمال بدست آمده است یا خیر؟ 
آزمون کلموگروف - امیرنوف یک آزمون تطابق توزیع برای داده های کمی است و با استفاده از این آزمون می توانید تعیین کنید که آیا داده های نمونه از یک توزیع خاص نظری مانند نرمال پیروی می کنند. در نرم افزار spss از این آزمون برای تطابق چهار توزیع مختلف نرمال، پواسن، نمایی و یکنواخت استفاده شده است .اساس این روش بر اختلاف بین فراوانی تجمعی نسبی مشاهدات با مقدار مورد انتظار تحت فرض صفر است. فرض صفر می‌گوید که نمونه‌ی انتخاب شده دارای توزیع نرمال (یا یکنواخت یا نمایی یا پواسن است). آزمون کلموگروف – اسمیرنوف برای تطابق توزیع، احتمال‌های تجمعی مقادیر در مجموعه‌ی داده‌ها را با احتمال‌های تجمعی همان مقادیر در یک توزیع نظری خاص مقایسه می‌کند. اگر اختلاف آن به قدر کافی بزرگ باشد این آزمون نشان خواهد داد که داده‌ها با توزیع خاص مورد نظر مطابقت ندارند.

آزمون فریدمن:

آزمون فریدمن یک آزمون ناپارامتری، معادل آنالیز واریانس با اندازه های تکراری (درون گروهی) است که از آن برای مقایسه میانگین رتبه ها در بین K متغير (گروه) استفاده می‌کنیم. فرض کنید می‌خواهیم از يك نمونه شامل 10 نفر در مورد 5 کالا نظرخواهی کنیم - یعنی از آنها بخواهیم که به هر یک از کالاها از نظر کیفیت امتیاز بدهند- سپس ميانگين امتيازات كالاها را با هم مقايسه و بررسي كنيم كه اگر اختلاف امتيازات كالاها معني دار است؛ كدام كالا بيشترين امتياز و كدام كالا كمترين امتياز را كسب كرده است.  در چنین حالتی شما با 5 متغیر روبرو هستید که این متغیرها به لحاظ آماری به یکدیگر وابسته هستند زیرا اندازه هایی هستند که توسط هر نمونه تکرار شده اند.

آزمون من – ویتنی

آزمون من – ویتنی یک آزمون مقایسه ای برای مقایسه وضعیت دو گروه مستقل است و وقتي داده‌های يك مطالعه به صورت كيفي ترتيبي باشند بهتر است از این آزمون که یک آزمون غیر پارامتری و معادل آزمون دو نمونه مستقل t است، استفاده كرد. در اين حال از آزمون t دو نمونه مستقل استفاده نمي كنيم زيرا ميانگين متغيري كه در مقياس ترتيبي اندازه گيري شده باشد، به علت يكسان نبودن فاصله واحدها، معني و مفهوم واقعي ميانگين را نخواهد داشت. 

آزمون تقارن توزيع :

 در اين آزمون شکل توزيع مورد سوال قرار مي گيرد. فرض بديل آن است که توزيع متقارن نيست.

آزمون ميانه :

 جهت مقايسه ميانه دو جامعه استفاده مي شود و براي k جامعه نيز قابل تعميم است.

آزمون Q کوکران:

 تعميم آزمون مک نمار در k نمونه وابسته است. 

آزمون همبستگی:

رابطه‌ی همبستگی به بررسی ارتباط بین دو یا چند متغیر می‌پردازد و ضریب آن را محاسبه می‌کند، همبستگی بین متغیرها ممکن است مثبت یا منفی باشد. اگر تغییرات یک متغیر با تغییرات دیگری همراه باشد و افزایش یکی با افزایش دیگری و بالعکس کاهش یکی با کاهش دیگری همراه باشد می‌گوییم همبستگی بین آن‌ها مثبت است. و اگر افزایش یکی با کاهش دیگری همراه باشد گفته می‌شود که همبستگی بین آن‌ها منفی است. مقدار ضریب همبستگی بین -1 تا +1 است.

اگر بین دو متغیر رابطه‌ای وجود نداشته باشد ضریب همبستگی بین آن‌ها صفر است.

ضريب همبستگي پیرسون:

اگر هر دو متغیر تصادفی پیوسته و نرمال باشند، ضریب همبستگی با استفاده از روشی تحت عنوان ضریب همبستگی پیرسون براي محاسبه همبستگي دو مجموعه داده استفاده مي شود. ولی اگر یک یا هر دو متغیر غیرپیوسته و یا غیرنرمال باشند، ضریب همبستگی پیرسون قابل استفاده نخواهد بود.

ضريب همبستگي اسپيرمن:

براي محاسبه همبستگي دو مجموعه داده که به صورت ترتيبي قرار دارند استفاده مي شود. از ضریب همبستگی اسپیرمن هنگامی استفاده کنید که از نرمال بودن دو متغیر تصادفی مطمئن نیستید و همچنین تعداد طبقات متغیرهای تصادفی 5 طبقه یا بیشتر است.

چنانچه در تحلیل‌های خود نیازمند این آزمون‌ها هستید با کارشناسان این وبلاگ تماس بگیرید

 

آزمون‌های آماری پارامتریک

 

آزمون آماری

موضوع آزمون آماری زمانی مطرح می شود که محقق در صدد کشف، تبین و کنترل پدیده ها باشند. بنابراین، زمانی که قصد داریم صرفا به توصیف داده ها بپردازیم، موضوع آزمون آماری اعراب ندارد و هیچ گاه نمی توانیم از آزمون های آماری استفاده کنیم. آزمون های آماری این احتمال را بیان می کنند که آیا نتایج تحقیق در اثر شانس بوده است یا خیر. تمامی این آزمون های آماری به یک مقدار  P-value یا مقدار احتمال ختم می شوند که این مقدار P  اساس پذیرش معنی داری آماری نتایج می باشد. بدین صورت که زمانی به احتمال ÷ایین شانسی بودن نتایج پی می بریم که مقدار P از مقدار مورد توافق چامعه علمی یعنی ۰/۵  کوچک تر  باشد. تنها در صورتی که مقدار P به دست آمده از ۰/۵ کوچک تر باشد، می توانیم به ارائه یک تفسیر علمی از نتایج مبادرت نماییم. پس، زمانی که مقدار P از ۰/۵ بزرگتر باشد، آن گاه باید گفت که نتایج در اثر شانس حاصل شده اند و لذا نمی توان تفسیر علمی از نتایج ارائه داد.

آزمون های آماری، بر اساس ملاک هایی مانند مقیاس داده ها، توزیع داده ها و..، به دو دسته کلی آزمون های آماری پارامتری و آزمون های  آماری ناپارامتری تقسیم می شوند که هر یک شرایط کاربرد خاص خود را دارند. شناخت نوع آزمون آماری برای فرضیه تحقیق، از فاکتورهای مهمی است که به محققین در دست یابی به نتایج متقن کمک می کند.

  آزمون های آماری پارامتری (Parametric Tests)

آزمون های آماری پارامتری را می توان موثرترین نوع آزمون ها دانست. برای استفاده از آزمون های پارامتری، پیش فرض هایی لازم است که باید در اجرا رعایت کنیم. این پیش فرض ها به چگونگی توزیع نمرات داده ها و نوع مقیاس مورد استفاده بستگی دارد:

۱٫ هر یک از موارد مشاهده شده مستقل از هم هستند. یعنی انتخاب یک مورد، به انتخاب هیچ مورد دیگری وابسته نیست.

۲٫ واریانس نمونه ها برابر یا تقریبا برابر است. این مطلب، زمانی که حجم نمونه کم است، از اهمیت خاصی برخوردار است.

۳٫ داده ها در سطح سنجش فاصله های و نسبی می باشند( یعنی کمی هستند) داده های اسمی و ترتیبی برای استفاده از آزمون های پارامتری مناسب نیستند.

۴٫ توزیع داده ها در جامعه، نرمال ( بهنجار) و یا نزدیک به نرمال است

۵٫ تمامی آزمون های آماری پارامتری، میانگین یک یا چند متغیر را در یک گروه یا بیش تر مقایسه می کنند.

خلاصه آزمون های پارامتریک

آزمون t تک نمونه :

پبرای آزمون فرض پیرامون میانگین یک جامعه استفاده می شود. در بیشتر پژوهش هائی که با مقیاس لیکرت انجام می شوند جهت بررسی فرضیه های پژوهش و تحلیل سوالات تخصصی مربوط به آنها از این آزمون استفاده می شود.

آزمون t وابسته :

برای آزمون فرض پیرامون دو میانگین از یک جامعه استفاده می شود. برای مثال اختلاف میانگین رضایت کارکنان یک سازمان قبل و بعد از تغییر مدیریت یا زمانی که نمرات یک کلاس با پیش آزمون و پس آزمون سنجش می شود.

آزمون t دو نمونه مستقل:

جهت مقایسه میانگین دو جامعه استفاده می شود. در آزمون t برای دو نمونه مستقل فرض می شود واریانس دو جامعه برابر است. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس جنسیت در خصوص هر یک از فرضیه های پژوهش استفاده میشود.

آزمون t ولچ:

این آزمون نیز مانند آزمون t دو نمونه جهت مقایسه میانگین دو جامعه استفاده می شود. در آزمون t ولچ فرض می شود واریانس دو جامعه برابر نیست. برای نمونه به منظور بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس جنسیت در خصوص هر یک از فرضیه های پژوهش استفاده میشود.

آزمون t هتلینگ :

برای مقایسه چند میانگین از دو جامعه استفاده می شود. یعنی دو جامعه براساس میانگین چندین صفت مقایسه شوند.

تحلیل واریانس (ANOVA)

از این آزمون به منظور بررسی اختلاف میانگین چند جامعه آماری استفاده می شود. برای نمونه جهت بررسی معنی دار بودن تفاوت میانگین نمره نظرات پاسخ دهندگان بر اساس سن یا تحصیلات در خصوص هر یک از فرضیه های پژوهش استفاده می شود.

تحلیل واریانس چندعاملی(MANOVA) :

 از این آزمون به منظور بررسی اختلاف چند میانگین از چند جامعه آماری استفاده می شود.

تحلیل کوواریانس چندعاملی (MANCOVA):

چنانچه در MANOVA بخواهیم اثر یک یا چند متغیر کمکی را حذف کنیم استفاده می شود.

ضریب همبستگی گشتاوری پیرسون:

برای محاسبه همبستگی دو مجموعه داده استفاده می شود.

چنانچه در تحلیل‌های خود نیازمند این آزمون‌ها هستید با کارشناسان این وبلاگ تماس بگیرید