اندازه گیری سازه ها

گزاره های نظری از روابط بین سازه های انتزاعی تشکیل شده اند. تئوری‌های آزمایشی (یعنی گزاره‌های نظری) نیاز به اندازه‌گیری دقیق، صحیح و علمی این سازه‌ها دارند، قبل از اینکه قدرت روابط آنها آزمایش شود. اندازه گیری به مشاهدات دقیق و عمدی از دنیای واقعی اشاره دارد و جوهره تحقیقات تجربی است. در حالی که برخی از ساختارها در تحقیقات علوم اجتماعی، مانند سن، وزن، یا اندازه یک شرکت، ممکن است به راحتی قابل اندازه گیری باشند، سایر سازه ها مانند خلاقیت، تعصب یا بیگانگی، ممکن است به طور قابل توجهی سخت تر باشد. در این فصل، فرآیندهای مربوط به مفهوم‌سازی و عملیاتی‌سازی برای ایجاد معیارهای چنین سازه‌هایی را بررسی خواهیم کرد.

مفهوم سازی

مفهوم سازی فرآیند ذهنی است که در آن سازه ها (مفاهیم) فازی و غیردقیق و اجزای تشکیل دهنده آنها به صورت عینی و دقیق تعریف می شوند. به عنوان مثال، ما اغلب از کلمه “تعصب” استفاده می کنیم و این کلمه تصویر خاصی را در ذهن ما تداعی می کند. با این حال، اگر از ما خواسته شود دقیقاً معنای این واژه را تعریف کنیم، ممکن است با مشکل مواجه شویم. اگر کسی در مورد سایر گروه های نژادی چیزهای بدی بگوید، آیا این تعصب نژادی است؟ اگر زنان برای همان شغل کمتر از مردان درآمد دارند، آیا این تعصب جنسیتی است؟ اگر کلیساها معتقدند که غیر ایمانداران در جهنم خواهند سوخت، آیا این تعصب مذهبی است؟ آیا انواع مختلفی از تعصب وجود دارد، و اگر چنین است، آنها کدامند؟ آیا سطوح مختلفی از تعصب وجود دارد، مانند بالا یا پایین؟ پاسخ به همه این سوالات کلید اندازه گیری درست ساختار تعصب است.

فرآیند مفهوم سازی به دلیل عدم دقت، ابهام و ابهام بسیاری از ساختارهای علوم اجتماعی اهمیت بیشتری دارد. به عنوان مثال، آیا “شفقت” همان “همدلی” یا “احساس گرایی” است؟ اگر گزاره‌ای دارید که بیان می‌کند «شفقت به طور مثبت با همدلی مرتبط است»، نمی‌توانید آن گزاره را آزمایش کنید، مگر اینکه بتوانید از لحاظ مفهومی همدلی را از شفقت جدا کنید و سپس به‌طور تجربی این دو ساختار بسیار مشابه را به درستی اندازه‌گیری کنید. اگر افراد عمیقاً مذهبی معتقدند که برخی از اعضای جامعه خود مانند غیر مؤمنان، همجنس‌بازان و پزشکان سقط جنین به خاطر گناهان خود در جهنم خواهند سوخت و به زور سعی در تغییر رفتار «گناهکاران» برای جلوگیری از رفتن آنها به جهنم دارند. آیا آنها به شیوه ای تعصب آمیز عمل می کنند یا به شیوه ای دلسوزانه؟ تعریف ما از چنین سازه هایی مبتنی بر هیچ معیار عینی نیست، بلکه بر اساس توافق مشترک («بین الاذهانی») بین تصاویر (مفهوم) ذهنی ما از این سازه ها است.

هنگام تعریف سازه هایی مانند تعصب یا شفقت، باید درک کنیم که گاهی اوقات، این سازه ها واقعی نیستند یا می توانند به طور مستقل وجود داشته باشند، بلکه صرفاً خلاقیت های خیالی در ذهن ما هستند. به عنوان مثال، ممکن است قبایل خاصی در جهان وجود داشته باشند که فاقد تعصب هستند و حتی نمی توانند تصور کنند که این مفهوم شامل چه مواردی می شود. اما در زندگی واقعی، ما تمایل داریم که این مفهوم را واقعی بدانیم. فرآیند واقعی تلقی کردن سازه های ذهنی را شیء سازی می نامند که در تعریف سازه ها و شناسایی متغیرهای قابل اندازه گیری برای اندازه گیری آنها نقش اساسی دارد.

یک تصمیم مهم در مفهوم سازی سازه ها، مشخص کردن تک بعدی و چند بعدی بودن آنهاست. سازه های تک بعدی آنهایی هستند که انتظار می رود یک بعد زیربنایی واحد داشته باشند. این سازه ها را می توان با استفاده از یک اندازه گیری یا آزمایش اندازه گیری کرد. مثال‌ها شامل سازه‌های ساده‌ای مانند وزن فرد، سرعت باد، و احتمالاً حتی سازه‌های پیچیده مانند عزت نفس (اگر عزت‌نفس را متشکل از یک بعد واحد تصور کنیم، که البته ممکن است یک فرض غیر واقعی باشد) می‌شود. سازه های چند بعدی از دو یا چند بعد زیربنایی تشکیل شده اند. به عنوان مثال، اگر استعداد تحصیلی یک فرد را متشکل از دو بعد – توانایی ریاضی و کلامی – تصور کنیم، استعداد تحصیلی یک ساختار چند بعدی است.

عملیاتی شدن

هنگامی که یک سازه نظری تعریف شد، دقیقاً چگونه آن را اندازه گیری کنیم؟ عملیاتی سازی به فرآیند توسعه شاخص ها یا موارد برای اندازه گیری این سازه ها اشاره دارد. به عنوان مثال، اگر یک ساختار نظری غیرقابل مشاهده مانند وضعیت اجتماعی-اقتصادی به عنوان سطح درآمد خانواده تعریف شود، می توان آن را با استفاده از شاخصی عملیاتی کرد که از پاسخ دهندگان این سوال را می پرسد: درآمد سالانه خانواده شما چقدر است؟ با توجه به سطح بالای ذهنی و عدم دقت ذاتی در ساختارهای علوم اجتماعی، ما تمایل داریم که بیشتر این سازه ها (به جز چند ساختار جمعیت شناختی مانند سن، جنسیت، تحصیلات و درآمد) را با استفاده از چند شاخص اندازه گیری کنیم. این فرآیند به ما اجازه می دهد تا نزدیکی بین این شاخص ها را به عنوان ارزیابی صحت (قابلیت اطمینان) آنها بررسی کنیم.

بر خلاف سازه ها که در سطح نظری مفهوم سازی می شوند، شاخص ها در سطح تجربی عمل می کنند. ترکیبی از شاخص‌ها در سطح تجربی که یک ساختار معین را نشان می‌دهند، متغیر نامیده می‌شود. همانطور که در فصل قبل ذکر شد، متغیرها ممکن است مستقل، وابسته، واسطه یا تعدیل کننده باشند، بسته به اینکه چگونه در یک مطالعه تحقیقاتی به کار گرفته می شوند. همچنین هر نشانگر ممکن است چندین صفت (یا سطح) داشته باشد و هر مشخصه نشان دهنده یک مقدار باشد. به عنوان مثال، یک متغیر “جنسیت” ممکن است دو ویژگی داشته باشد: مذکر یا زن. به همین ترتیب، یک مقیاس رضایت مشتری ممکن است برای نشان دادن پنج ویژگی ساخته شود: “به شدت ناراضی”، “تا حدودی ناراضی”، “خنثی”، “تا حدودی راضی” و “به شدت راضی”. مقادیر صفات ممکن است کمی (عددی) یا کیفی (غیر عددی) باشند. داده های کمی را می توان با استفاده از تکنیک های تحلیل داده های کمی، مانند رگرسیون یا مدل سازی معادلات ساختاری، تجزیه و تحلیل کرد، در حالی که داده های کیفی به تکنیک های تجزیه و تحلیل داده های کیفی مانند کدگذاری نیاز دارند. توجه داشته باشید که بسیاری از متغیرها در تحقیقات علوم اجتماعی کیفی هستند، حتی اگر به صورت کمی ارائه شوند. به عنوان مثال، ما می توانیم یک شاخص رضایت مشتری با پنج ویژگی ایجاد کنیم: به شدت ناراضی، تا حدودی ناراضی، خنثی، تا حدودی راضی و به شدت راضی هستم و اعداد 1 تا 5 را به ترتیب برای این پنج ویژگی اختصاص دهیم تا بتوانیم از ابزارهای آماری پیچیده استفاده کنیم. تجزیه و تحلیل داده های کمی با این حال، توجه داشته باشید که اعداد فقط برچسب‌هایی هستند که با ارزیابی شخصی پاسخ‌دهندگان از رضایت خود مرتبط هستند.

شاخص ها ممکن است منعکس کننده یا شکل دهنده باشند. یک شاخص بازتابی معیاری است که یک ساختار زیربنایی را “بازتاب” می کند. به عنوان مثال، اگر دینداری به عنوان ساختاری تعریف شود که میزان دینداری یک فرد را می سنجد، شرکت در مراسم مذهبی ممکن است یک شاخص بازتابی از دینداری باشد. شاخص شکل‌دهنده معیاری است که یک ساختار زیربنایی را «شکل می‌دهد» یا به آن کمک می‌کند. چنین شاخص هایی ممکن است ابعاد مختلفی از سازه مورد علاقه را نشان دهند. به عنوان مثال، اگر دینداری به عنوان ترکیبی از یک بعد اعتقادی، یک بعد عبادی و یک بعد مناسکی تعریف شود، شاخص هایی که برای اندازه گیری هر یک از این ابعاد مختلف انتخاب می شوند، شاخص های تکوینی محسوب می شوند.

سطوح اندازه گیری

اولین تصمیمی که در عملیاتی کردن یک سازه گرفته می شود، تصمیم گیری در مورد سطح مورد نظر اندازه گیری است. سطوح اندازه‌گیری، که مقیاس‌های رتبه‌بندی نیز نامیده می‌شوند، به مقادیری اشاره دارد که یک شاخص می‌تواند بگیرد (اما چیزی در مورد خود شاخص نمی‌گوید). به عنوان مثال، مرد و زن (یا M و F، یا 1 و 2) دو سطح از شاخص “جنس” هستند. استنلی اسمیت استیونز روانشناس (1946) در مقاله اصلی خود با عنوان “در مورد نظریه مقیاس های اندازه گیری” که در Science در سال 1946 منتشر شد، چهار نوع مقیاس درجه بندی عمومی را برای اندازه گیری های علمی تعریف کرد: مقیاس های اسمی، ترتیبی، فاصله ای و نسبتی. ویژگی های آماری این مقیاس ها در جدول 6.1 نشان داده شده است.

جدول 6.1. ویژگی های آماری مقیاس های رتبه بندی
مقیاس گرایش مرکزی آمار تحولات
اسمی حالت Chi-square یک به یک (برابری)
ترتیبی میانه آمار صدک، ناپارامتریک افزایش یکنواخت (ترتیب)
فاصله میانگین حسابی، محدوده، انحراف معیار همبستگی، رگرسیون، تحلیل واریانس خطی مثبت (آفین)
نسبت میانگین هندسی، میانگین هارمونیک ضریب تغییر شباهت های مثبت (ضربی، لگاریتمی)

توجه: تمام مقیاس های مرتبه بالاتر می توانند از هر یک از آمارها برای مقیاس های مرتبه پایین استفاده کنند.

مقیاس های اسمی که مقیاس های طبقه ای نیز نامیده می شوند، داده های طبقه بندی را اندازه گیری می کنند. این مقیاس‌ها برای متغیرها یا شاخص‌هایی استفاده می‌شوند که دارای ویژگی‌های منحصر به فرد هستند. به عنوان مثال می توان به جنسیت (دو ارزش: مرد یا زن)، نوع صنعت (تولید، مالی، کشاورزی و غیره) و وابستگی مذهبی (مسیحی، مسلمان، یهودی و غیره) اشاره کرد. حتی اگر اعداد منحصربه‌فردی را به هر مقدار اختصاص دهیم، به عنوان مثال 1 برای مرد و 2 برای زن، اعداد واقعاً معنایی ندارند (یعنی 1 کمتر یا نصف 2 نیست) و می‌توانستند به راحتی نشان داده شوند. از نظر عددی، مانند M برای مرد و F برای زن. مقیاس های اسمی فقط نام ها یا برچسب هایی را برای مقادیر مشخصه های مختلف ارائه می دهند. معیار مناسب گرایش مرکزی یک مقیاس اسمی حالت است و نه میانگین و نه میانه قابل تعریف نیست.

مقیاس‌های ترتیبی، مقیاس‌هایی هستند که داده‌های مرتب‌شده را اندازه‌گیری می‌کنند، مانند رتبه‌بندی دانش‌آموزان در یک کلاس به‌عنوان اول، دوم، سوم و غیره، بر اساس معدل یا نمرات آزمون. با این حال، مقادیر واقعی یا نسبی ویژگی ها یا تفاوت در مقادیر ویژگی ها قابل ارزیابی نیستند. به عنوان مثال، رتبه بندی دانش آموزان در کلاس چیزی در مورد معدل واقعی یا نمرات آزمون دانش آموزان، یا اینکه چگونه آنها نسبت به یکدیگر خوب عمل کرده اند، نمی گوید. یک مثال کلاسیک در علوم طبیعی، مقیاس سختی معدنی Moh است که سختی کانی های مختلف را با توانایی آنها در خراش دادن سایر کانی ها مشخص می کند. به عنوان مثال، الماس می تواند سایر مواد معدنی طبیعی روی زمین را خراش دهد و از این رو الماس “سخت ترین” ماده معدنی است. با این حال، مقیاس سختی واقعی این کانی ها را نشان نمی دهد یا حتی ارزیابی نسبی سختی آنها را ارائه نمی دهد. مقیاس‌های ترتیبی همچنین می‌توانند از برچسب‌های مشخصه‌ای مانند «بد»، «متوسط» و «خوب» یا «به‌شدت ناراضی»، «تا حدودی ناراضی»، «خنثی» یا «تا حدودی راضی» و «به‌شدت راضی» استفاده کنند. “. در مورد دوم، می توان گفت که پاسخ دهندگانی که «تا حدودی راضی» هستند نسبت به کسانی که «به شدت راضی هستند» رضایت کمتری دارند، اما ما نمی توانیم سطح رضایت آنها را کمی کنیم. معیار گرایش مرکزی یک مقیاس ترتیبی می تواند میانه یا حالت آن باشد و میانگین ها قابل تفسیر نیستند. از این رو، تحلیل‌های آماری ممکن است شامل صدک‌ها و تحلیل‌های ناپارامتریک باشد، اما تکنیک‌های پیچیده‌تر مانند همبستگی، رگرسیون و تحلیل واریانس مناسب نیستند.

مقیاس‌های فاصله‌ای آنهایی هستند که مقادیر اندازه‌گیری شده نه تنها به ترتیب رتبه‌بندی شده‌اند، بلکه از ویژگی‌های مجاور نیز فاصله دارند. به عنوان مثال، مقیاس دما (بر حسب فارنهایت یا سانتیگراد)، که در آن تفاوت بین 30 و 40 درجه فارنهایت مشابه بین 80 و 90 درجه فارنهایت است. به همین ترتیب، اگر مقیاسی دارید که درآمد سالانه پاسخ دهندگان را با استفاده از ویژگی های زیر می پرسد: 0 تا 10،000 دلار، 10،000 دلار تا 20،000، 20،000 دلار تا 30،000، و غیره، این نیز یک مقیاس فاصله ای است، زیرا نقطه میانی هر محدوده (یعنی 5000 دلار، 15000 دلار، 25000 دلار و غیره) از یکدیگر فاصله دارند. مقیاس بهره هوشی (IQ) نیز یک مقیاس فاصله ای است، زیرا این مقیاس به گونه ای طراحی شده است که تفاوت بین نمرات IQ 100 و 110 قرار است با 110 تا 120 یکسان باشد (اگرچه ما واقعاً نمی دانیم که آیا واقعاً چنین است یا خیر). مقیاس فاصله ای به ما اجازه می دهد تا بررسی کنیم که “چقدر بیشتر” یک ویژگی در مقایسه با ویژگی دیگر است، که با مقیاس های اسمی یا ترتیبی امکان پذیر نیست. معیارهای تمایل مرکزی مجاز شامل میانگین، میانه، یا حالت، و همچنین معیارهای پراکندگی، مانند محدوده و انحراف معیار هستند. تحلیل‌های آماری مجاز شامل همه موارد مجاز برای مقیاس‌های اسمی و ترتیبی، به علاوه همبستگی، رگرسیون، تحلیل واریانس و غیره است. تبدیل مقیاس مجاز خطی مثبت است. توجه داشته باشید که مقیاس رضایت که قبلاً مورد بحث قرار گرفت، صرفاً مقیاس فاصله ای نیست، زیرا نمی توانیم بگوییم که آیا تفاوت بین «به شدت راضی» و «تا حدودی راضی» با تفاوت بین «خنثی» و «تا حدودی راضی» یا بین «تا حدودی ناراضی» و «به شدت ناراضی» یکی است. با این حال، محققان علوم اجتماعی اغلب «تظاهر می‌کنند» (به اشتباه) این تفاوت‌ها برابر هستند تا بتوانیم از تکنیک‌های آماری برای تجزیه و تحلیل داده‌های مقیاس‌بندی ترتیبی استفاده کنیم.

مقیاس‌های نسبت آنهایی هستند که تمام کیفیت‌های مقیاس اسمی، ترتیبی و فاصله‌ای را دارند و علاوه بر این، یک نقطه «صفر واقعی» نیز دارند (که در آن مقدار صفر دلالت بر فقدان یا در دسترس نبودن ساختار زیربنایی دارد). بیشتر اندازه‌گیری‌ها در علوم طبیعی و مهندسی، مانند جرم، شیب هواپیما، و بار الکتریکی، از مقیاس‌های نسبت استفاده می‌کنند، مانند برخی از متغیرهای علوم اجتماعی مانند سن، مدت تصدی در یک سازمان، و اندازه شرکت (اندازه‌گیری شده به عنوان تعداد کارکنان یا در آمد ناخالص). به عنوان مثال، یک شرکت با اندازه صفر به این معنی است که هیچ کارمند یا درآمدی ندارد. مقیاس دمای کلوین نیز یک مقیاس نسبت است، بر خلاف مقیاس فارنهایت یا سانتیگراد، زیرا نقطه صفر در این مقیاس (معادل 273- است. 15 درجه سانتیگراد) یک مقدار دلخواه نیست بلکه حالتی را نشان می دهد که ذرات ماده در این دما انرژی جنبشی صفر دارند. این مقیاس ها مقیاس های «نسبت» نامیده می شوند زیرا نسبت های دو نقطه در این مقیاس ها معنادار و قابل تفسیر هستند. به عنوان مثال، یک شرکت با اندازه 10 کارمند دو برابر یک شرکت با اندازه 5 است، و همین امر را می توان برای یک شرکت با 10000 کارمند نسبت به یک شرکت متفاوت با 5000 کارمند گفت. همه اندازه گیری های گرایش های مرکزی، از جمله میانگین های هندسی و هارمونیک، برای مقیاس های نسبت مجاز هستند، مانند اندازه گیری های نسبت، مانند محدوده دانشجویی یا ضریب تغییرات. تمام روش های آماری مجاز است. تبدیل پیچیده مانند مشابه مثبت (به عنوان مثال، ضربی یا لگاریتمی) نیز مجاز است. این مقیاس‌ها را مقیاس‌های «نسبت» می‌نامند، زیرا نسبت‌های دو نقطه روی این معیارها معنادار و قابل تفسیر هستند. به عنوان مثال، یک شرکت با اندازه 10 کارمند، دو برابر یک شرکت با اندازه 5 است، و همین را می توان برای یک شرکت با 10000 کارمند نسبت به یک شرکت متفاوت با 5000 کارمند گفت. تمام معیارهای گرایش های مرکزی، از جمله میانگین های هندسی و هارمونیک، برای مقیاس های نسبت مجاز هستند، مانند اندازه گیری های نسبت، مانند محدوده دانشجویی یا ضریب تغییرات. تمام روش های آماری مجاز است. تبدیل پیچیده مانند مشابه مثبت (به عنوان مثال، ضربی یا لگاریتمی) نیز مجاز است. این مقیاس ها مقیاس های «نسبت» نامیده می شوند زیرا نسبت های دو نقطه در این مقیاس ها معنادار و قابل تفسیر هستند. به عنوان مثال، یک شرکت با اندازه 10 کارمند دو برابر یک شرکت با اندازه 5 است، و همین امر را می توان برای یک شرکت با 10000 کارمند نسبت به یک شرکت متفاوت با 5000 کارمند گفت. همه اندازه گیری های گرایش های مرکزی، از جمله میانگین های هندسی و هارمونیک، برای مقیاس های نسبت مجاز هستند، مانند اندازه گیری های نسبت، مانند محدوده دانشجویی یا ضریب تغییرات. تمام روش های آماری مجاز است. تبدیل پیچیده مانند مشابه مثبت (به عنوان مثال، ضربی یا لگاریتمی) نیز مجاز است. 000 کارمند همه اندازه گیری های گرایش های مرکزی، از جمله میانگین های هندسی و هارمونیک، برای مقیاس های نسبت مجاز هستند، مانند اندازه گیری های نسبت، مانند محدوده دانشجویی یا ضریب تغییرات. تمام روش های آماری مجاز است. تبدیل پیچیده مانند مشابه مثبت (به عنوان مثال، ضربی یا لگاریتمی) نیز مجاز است. 000 کارمند همه اندازه گیری های گرایش های مرکزی، از جمله میانگین های هندسی و هارمونیک، برای مقیاس های نسبت مجاز هستند، مانند اندازه گیری های نسبت، مانند محدوده دانشجویی یا ضریب تغییرات. تمام روش های آماری مجاز است. تبدیل پیچیده مانند مشابه مثبت (به عنوان مثال، ضربی یا لگاریتمی) نیز مجاز است.

بر اساس چهار نوع مقیاس عمومی که در بالا مورد بحث قرار گرفت، می‌توانیم مقیاس‌های رتبه‌بندی خاصی را برای تحقیقات علوم اجتماعی ایجاد کنیم. مقیاس‌های رتبه‌بندی رایج شامل مقیاس‌های باینری، لیکرت، تفاوت معنایی یا مقیاس گاتمن است. سایر مقیاس های کمتر رایج در اینجا مورد بحث قرار نمی گیرند.

مقیاس های باینری مقیاس‌های دودویی مقیاس‌های اسمی متشکل از آیتم‌های باینری هستند که یکی از دو مقدار ممکن مانند بله یا خیر، درست یا نادرست و غیره را در نظر می‌گیرند. به عنوان مثال، یک مقیاس باینری معمولی برای ساختار “کنشگری سیاسی” ممکن است از شش مورد دودویی نشان داده شده در جدول 6.2 تشکیل شود. هر آیتم در این مقیاس یک آیتم باینری است و تعداد کل “بله” نشان داده شده توسط پاسخ دهنده (مقدار از 0 تا 6) می تواند به عنوان معیار کلی برای فعالیت سیاسی آن شخص استفاده شود. برای درک چگونگی استخراج این موارد، به بخش «مقیاس‌سازی» در ادامه این فصل مراجعه کنید. مقیاس‌های باینری همچنین می‌توانند از مقادیر دیگری مانند مرد یا زن برای جنسیت، تمام وقت یا پاره وقت برای وضعیت شغلی و غیره استفاده کنند. اگر یک مورد وضعیت شغلی به گونه ای اصلاح شود که بیش از دو مقدار ممکن (به عنوان مثال، بیکار، تمام وقت، پاره وقت و بازنشسته) مجاز باشد.

 جدول 6.2. مقیاس دودویی شش ماده ای برای سنجش کنشگری سیاسی
آیا تا به حال به یک مقام دولتی نامه ای نوشته اید آره خیر
آیا تا به حال یک طومار سیاسی را امضا کرده اید؟ آره خیر
آیا تا به حال به یک هدف سیاسی کمک مالی کرده اید؟ آره خیر
آیا تا به حال به نامزدی که برای پست دولتی شرکت می کند کمک مالی کرده اید آره خیر
آیا تا به حال نامه ای سیاسی به سردبیر روزنامه یا مجله نوشته اید؟ آره خیر
آیا تا به حال کسی را متقاعد کرده اید که برنامه های رای گیری خود را تغییر دهد آره خیر

مقیاس لیکرت این مقیاس که توسط رنسیس لیکرت طراحی شده است، یک مقیاس رتبه بندی بسیار محبوب برای اندازه گیری داده های ترتیبی در تحقیقات علوم اجتماعی است. این مقیاس شامل آیتم‌های لیکرت است که عبارت‌های ساده‌ای هستند که پاسخ‌دهندگان می‌توانند میزان موافقت یا مخالفت خود را در مقیاس پنج یا هفت درجه‌ای از «کاملاً مخالفم» تا «کاملاً موافق» نشان دهند. یک مثال معمولی از یک مقیاس لیکرت شش گزینه ای برای ساختار “عزت نفس استخدامی” در جدول 6.3 نشان داده شده است. مقیاس‌های لیکرت مقیاس‌های جمع‌بندی می‌شوند، به این معنا که نمره مقیاس کلی ممکن است مجموع مقادیر ویژگی‌های هر آیتم باشد که توسط پاسخ‌دهنده انتخاب شده است.

جدول 6.3. مقیاس لیکرت شش گزینه ای برای سنجش عزت نفس شغلی
کاملا مخالف تا حدودی مخالفم خنثی تا حدودی موافقم کاملا موافقم
نسبت به شغلم احساس خوبی دارم 1 2 3 4 5
در محل کار با دیگران خوب کنار می آیم 1 2 3 4 5
من به رابطه ام با سرپرستم در محل کار افتخار می کنم 1 2 3 4 5
می توانم بگویم که افراد دیگر در محل کار از حضور من در آنجا خوشحال هستند 1 2 3 4 5
می توانم بگویم که همکارانم به من احترام می گذارند 1 2 3 4 5
احساس می کنم در کار کمک مفیدی می کنم 1 2 3 4 5

آیتم های لیکرت به جزئیات بیشتر (پاسخ دقیق تر) نسبت به موارد باینری اجازه می دهند، از جمله اینکه آیا پاسخ دهندگان نسبت به عبارت بی طرف هستند یا خیر. ممکن است از سه یا نه مقدار (اغلب “لنگر” نامیده می شود) استفاده شود، اما استفاده از تعداد فرد از مقادیر برای اجازه دادن به یک لنگر “خنثی” (یا “نه موافق و نه مخالف”) مهم است. برخی از مطالعات از «رویکرد انتخاب اجباری» برای وادار کردن پاسخ‌دهندگان به موافقت یا مخالفت با عبارت لیکرت با حذف نقطه میانی خنثی و استفاده از تعداد زوج استفاده کرده‌اند، اما این استراتژی خوبی نیست زیرا ممکن است برخی افراد واقعاً خنثی باشند. به یک بیانیه داده شده و رویکرد انتخاب اجباری این فرصت را برای آنها فراهم نمی کند تا موضع بی طرف خود را ثبت کنند. یکی از ویژگی های کلیدی مقیاس لیکرت این است که حتی اگر گزاره ها در آیتم ها یا شاخص های مختلف متفاوت باشند، لنگرها (“کاملاً مخالفم” تا “کاملاً موافقم”) ثابت می مانند. مقیاس‌های لیکرت مقیاس‌های ترتیبی هستند، زیرا لنگرها لزوماً از هم فاصله ندارند، حتی اگر گاهی اوقات آنها را مانند مقیاس‌های فاصله‌ای در نظر بگیریم.

 جدول 6.4. مقیاس افتراقی معنایی برای سنجش نگرش نسبت به بیمه سلامت ملی      
نظر خود را در مورد بیمه سلامت ملی چگونه ارزیابی می کنید؟
خیلی زیاد تاحدی هیچ کدام تاحدی خیلی زیاد
خوب بد
مفید بلا استفاده
مراقبت بی توجه
جالب هست حوصله سر بر

مقیاس تفاضلی معنایی این یک مقیاس ترکیبی (چند آیتمی) است که در آن از پاسخ دهندگان خواسته می شود نظرات یا احساسات خود را نسبت به یک عبارت واحد با استفاده از جفت های مختلف صفت که به عنوان متضادهای قطبی قاب می شوند، نشان دهند. به عنوان مثال، ساختار “نگرش نسبت به بیمه سلامت ملی” را می توان با استفاده از چهار مورد نشان داده شده در جدول 6.4 اندازه گیری کرد. همانند مقیاس لیکرت، نمره کلی مقیاس ممکن است مجموع نمرات آیتم های فردی باشد. توجه داشته باشید که در مقیاس لیکرت، عبارت تغییر می کند اما لنگرها در بین آیتم ها یکسان می مانند. با این حال، در مقیاس‌های دیفرانسیل معنایی، گزاره ثابت می‌ماند، در حالی که لنگرها (جفت‌های صفت) در بین آیتم‌ها تغییر می‌کنند. اعتقاد بر این است که تفاوت معنایی یک تکنیک عالی برای اندازه گیری نگرش یا احساسات افراد نسبت به اشیا، رویدادها یا رفتارها است.

مقیاس گاتمن این مقیاس کامپوزیتی که توسط لوئیس گاتمن طراحی شده است، از مجموعه ای از آیتم ها استفاده می کند که به ترتیب افزایش شدت ساختار مورد نظر، از کم شدت به شدیدترین، مرتب شده اند. به عنوان مثال، ساختار “نگرش نسبت به مهاجران” را می توان با استفاده از پنج مورد نشان داده شده در جدول 6.5 اندازه گیری کرد. هر آیتم در مقیاس گاتمن فوق دارای وزنی است (که در بالا نشان داده نشده است) که با شدت آن آیتم تغییر می کند و ترکیب وزنی هر پاسخ به عنوان معیار کلی یک مشاهده استفاده می شود.

جدول 6.5. مقیاس پنج ماده ای گاتمن برای اندازه گیری نگرش نسبت به مهاجران  
 نظرات خود را در مورد اظهارات زیر در مورد مهاجران چگونه ارزیابی می کنید؟  
آیا نگران هستید که مهاجران شهروند کشور شما باشند؟ آره خیر
آیا به مهاجرانی که در محله شما زندگی می کنند اهمیت نمی دهید؟ آره خیر
آیا دوست دارید در همسایگی یک مهاجر زندگی کنید؟ آره خیر
آیا دوست دارید یک مهاجر به عنوان دوست صمیمی خود داشته باشید؟ آره خیر
آیا اگر فردی در خانواده شما با یک مهاجر ازدواج کند مشکلی ندارید؟ آره خیر

مقیاس بندی

در بخش قبل چگونگی اندازه‌گیری پاسخ‌های پاسخ‌دهندگان به آیتم‌های از پیش طراحی‌شده یا شاخص‌های متعلق به یک ساختار اساسی بحث شد. اما چگونه خود شاخص ها را ایجاد کنیم؟ فرآیند ایجاد اندیکاتورها را مقیاس بندی می نامند. به طور رسمی‌تر، مقیاس‌بندی شاخه‌ای از اندازه‌گیری است که شامل ساخت معیارها از طریق مرتبط کردن قضاوت‌های کیفی درباره ساختارهای غیرقابل مشاهده با واحدهای متریک کمی و قابل اندازه‌گیری است. استیونز (1946) می گوید: “مقیاس بندی عبارت است از تخصیص اشیا به اعداد طبق یک قانون.” این فرآیند اندازه‌گیری مفاهیم انتزاعی در شرایط عینی یکی از دشوارترین وظایف در تحقیقات تجربی علوم اجتماعی است.

نتیجه فرآیند مقیاس‌بندی مقیاسی است که ساختاری تجربی برای اندازه‌گیری آیتم‌ها یا شاخص‌های یک ساختار معین است. بدانید که «مقیاس‌ها»، همانطور که در این بخش مورد بحث قرار گرفت، کمی با «مقیاس‌های رتبه‌بندی» که در بخش قبل بحث شد متفاوت است. یک مقیاس رتبه‌بندی برای نشان دادن واکنش‌های پاسخ‌دهندگان به یک آیتم خاص استفاده می‌شود، برای مثال، مانند یک آیتم با مقیاس اسمی واکنش بله/خیر را نشان می‌دهد و یک آیتم مقیاس‌شده فاصله‌ای مقداری بین «کاملاً مخالفم» تا «کاملاً موافق» را نشان می‌دهد. ضمیمه کردن مقیاس رتبه‌بندی به یک عبارت یا ابزار، مقیاس‌پذیری نیست. در عوض، مقیاس‌بندی فرآیند رسمی توسعه آیتم‌های مقیاس است، قبل از اینکه مقیاس‌های رتبه‌بندی به آن آیتم‌ها متصل شوند.

مقیاس ها می توانند یک بعدی یا چند بعدی باشند، بر اساس اینکه ساختار زیربنایی یک بعدی است (به عنوان مثال، وزن، سرعت باد، اندازه شرکت) یا چند بعدی (به عنوان مثال، استعداد تحصیلی، هوش). مقیاس تک بعدی ساختارها را در امتداد یک مقیاس واحد اندازه گیری می کند که از بالا تا پایین متغیر است. توجه داشته باشید که برخی از این مقیاس‌ها ممکن است شامل چندین آیتم باشند، اما همه این موارد سعی می‌کنند یک بعد اساسی را اندازه‌گیری کنند. این امر به ویژه در مورد بسیاری از سازه های علوم اجتماعی مانند عزت نفس، که فرض می شود دارای یک بعد واحد است که از پایین به بالا می رود، صادق است. از سوی دیگر، مقیاس‌های چند بعدی، از آیتم‌ها یا آزمون‌های مختلفی برای اندازه‌گیری هر بعد سازه به طور جداگانه استفاده می‌کنند و سپس امتیازات هر بعد را برای ایجاد مقیاس کلی از ساختار چند بعدی ترکیب می‌کنند. برای مثال، استعداد تحصیلی را می توان با استفاده از دو آزمون مجزا از توانایی ریاضی و کلامی دانش آموزان سنجید و سپس با ترکیب این نمرات معیاری کلی برای استعداد تحصیلی ایجاد کرد. از آنجایی که بیشتر مقیاس‌های مورد استفاده در تحقیقات علوم اجتماعی یک‌بعدی هستند، سه رویکرد بعدی برای ایجاد مقیاس‌های تک بعدی را بررسی خواهیم کرد.

روش‌های مقیاس‌بندی تک‌بعدی در نیمه اول قرن بیستم توسعه یافتند و به نام خالقان آن نامگذاری شدند. محبوب‌ترین روش‌های مقیاس‌بندی یک‌بعدی عبارتند از: (1) مقیاس‌گذاری با ظاهر برابر تورستون، (2) مقیاس‌بندی خلاصه لیکرت و (3) مقیاس‌گذاری تجمعی گاتمن. این سه رویکرد از بسیاری جهات مشابه هستند، با تفاوت‌های کلیدی رتبه بندی آیتم‌های مقیاس توسط داوران و روش‌های آماری مورد استفاده برای انتخاب آیتم‌های نهایی. در ادامه به هر یک از این روش ها پرداخته می شود.

روش پوسته‌گذاری با ظاهر برابر تراستون. لوئیس ترستون. یکی از اولین و مشهورترین نظریه پردازان مقیاس بندی، روش فواصل ظاهری برابر را در سال 1925 منتشر کرد. این روش با یک تعریف مفهومی روشن از سازه علاقه شروع می شود. بر اساس این تعریف، آیتم های مقیاس بالقوه برای اندازه گیری این سازه تولید می شوند. این آیتم ها توسط کارشناسانی تولید می شوند که چیزی در مورد سازه در حال اندازه گیری می دانند. مجموعه اولیه آیتم‌های نامزد (به طور ایده‌آل 80 تا 100 مورد) باید به شیوه‌ای مشابه بیان شود، به‌عنوان مثال، با قالب‌بندی آنها به عنوان عباراتی که پاسخ‌دهندگان ممکن است با آن موافق یا مخالف باشند (و نه به عنوان سؤال یا چیزهای دیگر). در مرحله بعد، هیئتی از داوران برای انتخاب آیتم‌های خاص از این مجموعه نامزد برای نشان دادن ساختار مورد علاقه، استخدام می‌شوند. داوران ممکن است شامل دانشگاهیان آموزش دیده در فرآیند ساخت ابزار یا یک نمونه تصادفی از پاسخ دهندگان مورد علاقه (یعنی افرادی که با این پدیده آشنا هستند) باشند. فرآیند انتخاب به این صورت انجام می شود که هر داور به طور مستقل به هر مورد در مقیاسی از 1 تا 11 بر اساس میزان نزدیکی که به نظر آنها آن آیتم ساختار مورد نظر را منعکس می کند (1 نشان دهنده بسیار نامطلوب و 11 نشان دهنده بسیار مطلوب است) انجام می شود. برای هر آیتم، محدوده میانه و بین چارکی را محاسبه کنید (تفاوت بین صدک 75 و 25 – معیاری از پراکندگی)، که بر روی یک هیستوگرام ترسیم شده است، همانطور که در شکل 6.1 نشان داده شده است. آیتم های مقیاس نهایی به عنوان عباراتی انتخاب می شوند که در فواصل مساوی در طیفی از میانه ها قرار دارند. این را می توان با گروه بندی اقلام با یک میانه مشترک انجام داد، و سپس آیتمی را با کمترین محدوده بین چارکی در هر گروه میانه انتخاب کنید. با این حال، به جای تکیه کامل بر تجزیه و تحلیل آماری برای انتخاب آیتم، یک استراتژی بهتر ممکن است بررسی موارد نامزد در هر سطح و انتخاب بیانیه ای باشد که واضح ترین و منطقی ترین باشد. مقدار میانه هر آیتم مقیاس نشان دهنده وزنی است که باید برای تجمیع اقلام در یک نمره مقیاس ترکیبی که نشان دهنده سازه مورد نظر است استفاده شود. ما اکنون مقیاسی داریم که شبیه یک خط کش است، با یک آیتم یا عبارت در هر یک از 11 نقطه روی خط کش (و به عنوان وزن). از آنجایی که آیتم ها در کل محدوده 11 نقطه ای مقیاس به طور مساوی ظاهر می شوند، این تکنیک مقیاس ظاهری برابر نامیده می شود. به جای تکیه کامل بر تجزیه و تحلیل آماری برای انتخاب آیتم، یک استراتژی بهتر ممکن است بررسی موارد نامزد در هر سطح و انتخاب بیانیه ای باشد که واضح ترین و منطقی ترین باشد. مقدار میانه هر آیتم مقیاس نشان دهنده وزنی است که باید برای تجمیع اقلام در یک نمره مقیاس ترکیبی که نشان دهنده سازه مورد نظر است استفاده شود. ما اکنون مقیاسی داریم که شبیه یک خط کش است، با یک آیتم یا عبارت در هر یک از 11 نقطه روی خط کش (و به عنوان وزن). از آنجایی که آیتم ها در کل محدوده 11 نقطه ای مقیاس به طور مساوی ظاهر می شوند، این تکنیک مقیاس ظاهری برابر نامیده می شود. به جای تکیه کامل بر تجزیه و تحلیل آماری برای انتخاب آیتم، یک استراتژی بهتر ممکن است بررسی موارد نامزد در هر سطح و انتخاب بیانیه ای باشد که واضح ترین و منطقی ترین باشد. مقدار میانه هر آیتم مقیاس نشان دهنده وزنی است که باید برای تجمیع اقلام در یک نمره مقیاس ترکیبی که نشان دهنده سازه مورد نظر است استفاده شود. ما اکنون مقیاسی داریم که شبیه یک خط کش است، با یک آیتم یا عبارت در هر یک از 11 نقطه روی خط کش (و به عنوان وزن). از آنجایی که آیتم ها در کل محدوده 11 نقطه ای مقیاس به طور مساوی ظاهر می شوند، این تکنیک مقیاس ظاهری برابر نامیده می شود. مقدار میانه هر آیتم مقیاس نشان دهنده وزنی است که باید برای تجمیع اقلام در یک نمره مقیاس ترکیبی که نشان دهنده سازه مورد نظر است استفاده شود. ما اکنون مقیاسی داریم که شبیه یک خط کش است، با یک آیتم یا عبارت در هر یک از 11 نقطه روی خط کش (و به عنوان وزن). از آنجایی که آیتم ها در کل محدوده 11 نقطه ای مقیاس به طور مساوی ظاهر می شوند، این تکنیک مقیاس ظاهری برابر نامیده می شود. مقدار میانه هر آیتم مقیاس نشان دهنده وزنی است که باید برای تجمیع اقلام در یک نمره مقیاس ترکیبی که نشان دهنده سازه مورد نظر است استفاده شود. ما اکنون مقیاسی داریم که شبیه یک خط کش است، با یک آیتم یا عبارت در هر یک از 11 نقطه روی خط کش (و به عنوان وزن). از آنجایی که آیتم ها در کل محدوده 11 نقطه ای مقیاس به طور مساوی ظاهر می شوند، این تکنیک مقیاس ظاهری برابر نامیده می شود.

تورستون همچنین دو روش اضافی برای ساخت مقیاس‌های تک بعدی ایجاد کرد – روش فواصل متوالی و روش مقایسه‌های زوجی – که هر دو بسیار شبیه به روش فواصل ظاهری مساوی هستند، به جز اینکه چگونه از قضات خواسته می‌شود به داده‌ها امتیاز دهند. برای مثال، روش مقایسه زوجی هر قاضی را ملزم می‌کند که بین هر جفت گزاره قضاوت کند (به جای اینکه هر عبارت را به طور مستقل در مقیاس 1 تا 11 رتبه بندی کند). از این رو، روش مقایسه زوج نام. با اظهارات زیاد، این رویکرد در مقایسه با روش فواصل ظاهری برابر می تواند بسیار وقت گیر و سخت باشد.

 

شکل 6.1. هیستوگرام برای آیتم های مقیاس ترستون

روش مقیاس بندی جمعی لیکرت. روش لیکرت، یک روش مقیاس‌بندی تک‌بعدی که توسط مورفی و لیکرت (1938) توسعه یافته است، احتمالاً محبوب‌ترین روش از سه رویکرد مقیاس‌بندی توصیف‌شده در این فصل است. همانند روش ترستون، روش لیکرت نیز با تعریف روشنی از سازه مورد علاقه و با استفاده از مجموعه‌ای از متخصصان برای تولید حدود 80 تا 100 آیتم مقیاس بالقوه شروع می‌شود. این آیتم ها سپس توسط داوران در مقیاس رتبه بندی 1 تا 5 (یا 1 تا 7) به شرح زیر رتبه بندی می شوند: 1 برای کاملاً مخالفم با مفهوم، 2 برای تا حدودی مخالفم با مفهوم، 3 برای بلاتکلیف، 4 برای تا حدودی موافقم با مفهوم. و 5 برای اینکه کاملاً با این مفهوم موافق است. پس از این رتبه بندی، موارد خاصی را می توان برای مقیاس نهایی انتخاب کرد که می توان به یکی از چندین روش انتخاب کرد: (1) با محاسبه همبستگی‌های دو متغیره بین رتبه‌بندی داوران از هر آیتم و کل آیتم (که با جمع کردن همه موارد منفرد برای هر پاسخ‌دهنده ایجاد می‌شود)، و حذف موارد با همبستگی‌های کم (مثلاً کمتر از 0.60) آیتم به کل، یا (2) با میانگین رتبه بندی برای هر آیتم برای چارک بالا و چارک پایین داوران، انجام آزمون t برای تفاوت میانگین ها، و انتخاب مواردی که دارای مقادیر t بالا هستند (یعنی مواردی که بهترین تمایز را بین پاسخ های چارک بالا و پایین). در پایان، قضاوت محقق ممکن است برای به دست آوردن مجموعه ای نسبتاً کوچک (مثلاً 10 تا 15) از آیتم ها استفاده شود که دارای همبستگی بین آیتم به کل و تمایز زیاد (یعنی مقادیر t بالا) هستند. را 60) همبستگی آیتم به کل، یا (2) با میانگین رتبه بندی برای هر آیتم برای چارک بالا و چارک پایین داوران، انجام آزمون t برای تفاوت میانگین ها و انتخاب مواردی که دارای t- بالا هستند. مقادیر (یعنی آنهایی که بهترین تمایز را بین پاسخ چارک بالا و پایین قائل می شوند). در پایان، قضاوت محقق ممکن است برای به دست آوردن مجموعه ای نسبتاً کوچک (مثلاً 10 تا 15) از آیتم ها استفاده شود که دارای همبستگی بین آیتم به کل و تمایز زیاد (یعنی مقادیر t بالا) هستند. را 60) همبستگی آیتم به کل، یا (2) با میانگین رتبه بندی برای هر آیتم برای چارک بالا و چارک پایین داوران، انجام آزمون t برای تفاوت میانگین ها و انتخاب مواردی که دارای t- بالا هستند. مقادیر (یعنی آنهایی که بهترین تمایز را بین پاسخ چارک بالا و پایین قائل می شوند). در پایان، قضاوت محقق ممکن است برای به دست آوردن مجموعه ای نسبتاً کوچک (مثلاً 10 تا 15) از آیتم ها استفاده شود که دارای همبستگی بین آیتم به کل و تمایز زیاد (یعنی مقادیر t بالا) هستند. را قضاوت محقق ممکن است برای به دست آوردن مجموعه ای نسبتاً کوچک (مثلاً 10 تا 15) از اقلام که دارای همبستگی بین آیتم به کل و تمایز زیاد (یعنی مقادیر t بالا) هستند، استفاده شود. را قضاوت محقق ممکن است برای به دست آوردن مجموعه ای نسبتاً کوچک (مثلاً 10 تا 15) از اقلام که دارای همبستگی بین آیتم به کل و تمایز زیاد (یعنی مقادیر t بالا) هستند، استفاده شود. را

روش لیکرت وزن‌های یکسانی را برای همه آیتم‌ها در نظر می‌گیرد و از این رو، پاسخ‌های پاسخ‌دهنده به هر آیتم را می‌توان برای ایجاد یک نمره ترکیبی برای آن پاسخ‌دهنده جمع‌بندی کرد. از این رو به این روش مقیاس جمعی می گویند. توجه داشته باشید که هر آیتمی با معنای معکوس از جهت اصلی ساختار باید قبل از جمع‌بندی، کد معکوس شود (یعنی 1 تبدیل به 5، 2 تبدیل به 4 و غیره) شود.

روش مقیاس بندی تجمعی گاتمن. طراحی شده توسط گاتمن (1950)، روش مقیاس بندی تجمعی بر اساس تکنیک فاصله اجتماعی Emory Bogardus است، که فرض می کند تمایل افراد برای مشارکت در روابط اجتماعی با افراد دیگر در درجه های شدت متفاوت است و شدت آن را با استفاده از فهرستی از موارد مرتب شده اندازه گیری می کند. از “کمترین شدت” به “شدیدترین”. ایده این است که افرادی که با یک مورد در این لیست موافق هستند با تمام موارد قبلی نیز موافق هستند. در عمل، ما به ندرت مجموعه ای از موارد را پیدا می کنیم که کاملاً با این الگوی تجمعی مطابقت داشته باشد. تجزیه و تحلیل اسکالوگرام برای بررسی اینکه چگونه مجموعه ای از موارد با ایده تجمعی مطابقت دارد استفاده می شود.

مانند روش‌های مقیاس‌بندی قبلی، روش گاتمن نیز با تعریف روشنی از ساختار مورد علاقه شروع می‌شود و سپس از متخصصان برای توسعه مجموعه‌ای از آیتم‌های کاندید استفاده می‌کند. سپس گروهی از داوران به هر یک از اقلام نامزد به عنوان “بله” امتیاز می دهند، اگر آنها مورد را برای سازه مطلوب ارزیابی می کنند و اگر آنها مورد را نامطلوب می بینند، “خیر”. سپس، یک ماتریس یا جدولی ایجاد می‌شود که پاسخ‌های داوران را به همه موارد نامزد نشان می‌دهد. این ماتریس به ترتیب نزولی از قضات با «بله» بیشتر در بالا تا کسانی که «بله» کمتر در پایین دارند مرتب شده است. قضات با تعداد “بله” یکسان، اظهارات را می توان از چپ به راست بر اساس اکثر تعداد توافقات به حداقل طبقه بندی کرد. ماتریس حاصل شبیه جدول 6.6 خواهد بود. توجه داشته باشید که مقیاس در حال حاضر تقریباً تجمعی است هنگامی که از چپ به راست خوانده می شود (در سراسر موارد). با این حال، ممکن است چند استثنا وجود داشته باشد، همانطور که در جدول 6.6 نشان داده شده است، و از این رو مقیاس کاملاً تجمعی نیست. برای تعیین مجموعه ای از آیتم هایی که به بهترین وجه خاصیت تجمعی را تقریب می زند، می توان از تکنیک تجزیه و تحلیل داده ها به نام تحلیل اسکالوگرام استفاده کرد (یا اگر تعداد آیتم ها کم باشد، می توان این کار را به صورت بصری انجام داد). تکنیک آماری همچنین امتیازی را برای هر آیتم تخمین می زند که می تواند برای محاسبه نمره کلی پاسخ دهنده در کل مجموعه آیتم ها استفاده شود. Y استثناهایی را نشان می دهد که از تجمع کامل این ماتریس جلوگیری می کند.

جدول 6.6. ماتریس رتبه بندی مرتب شده برای مقیاس گاتمن      
 پاسخگو  مورد 12 مورد 5 مورد 3 مورد 22 مورد 8 مورد 7
29 Y Y Y Y Y Y
7 Y Y Y Y
15 Y Y Y Y
3 Y Y Y Y
32 Y Y Y
4 Y Y Y
5 Y Y
23 Y Y
11 Y Y

شاخص ها

شاخص یک امتیاز ترکیبی است که از تجمیع معیارهای ساختارهای متعدد (به نام مؤلفه ها) با استفاده از مجموعه ای از قوانین و فرمول ها به دست می آید. با مقیاس ها متفاوت است زیرا مقیاس ها مقیاس ها را نیز جمع می کنند، اما این معیارها ابعاد مختلف یا همان ابعاد یک سازه را اندازه گیری می کنند. یک مثال شناخته شده از یک شاخص، شاخص قیمت مصرف کننده (CPI) است که هر ماه توسط اداره آمار کار وزارت کار ایالات متحده محاسبه می شود. CPI معیاری است که نشان می دهد مصرف کنندگان چقدر باید برای کالاها و خدمات بپردازند و به هشت دسته اصلی تقسیم می شود (مواد غذایی و آشامیدنی، مسکن، پوشاک، حمل و نقل، مراقبت های بهداشتی، تفریحی، آموزش و ارتباطات، و «کالاهای دیگر و خدمات»)، که بیشتر به بیش از 200 مورد کوچکتر تقسیم می شوند. هر ماه، کارمندان دولت برای دریافت قیمت فعلی بیش از 80000 قلم کالا با سراسر کشور تماس می گیرند. با استفاده از یک طرح وزنی پیچیده که مکان و احتمال خرید هر کالا را در نظر می‌گیرد، این قیمت‌ها توسط تحلیلگران ترکیب می‌شوند، که سپس با استفاده از یک سری فرمول‌ها و قوانین در یک امتیاز شاخص کلی ترکیب می‌شوند.

نمونه دیگری از شاخص، وضعیت اجتماعی-اقتصادی (SES) است که به آن شاخص اجتماعی-اقتصادی دانکن (SEI) نیز می گویند. این شاخص ترکیبی از سه سازه درآمد، تحصیلات و شغل است. درآمد بر حسب دلار، تحصیلات بر حسب سالها یا مدارک تحصیلی اندازه گیری می شود و شغل بر اساس وضعیت به دسته ها یا سطوح طبقه بندی می شود. این معیارهای بسیار متفاوت برای ایجاد یک امتیاز کلی شاخص SES با استفاده از ترکیب وزنی از «تحصیلات شغلی» (درصد افراد در آن شغل که یک یا چند سال تحصیلات دانشگاهی داشته‌اند) و «درآمد شغلی» (درصد افراد در آن شغل) ترکیب می‌شوند. شغلی که بیش از یک درآمد سالانه خاص به دست آورده است). با این حال، اندازه گیری شاخص SES بحث و اختلاف نظر زیادی را در بین محققان ایجاد کرده است.

فرآیند ایجاد شاخص شبیه به مقیاس است. ابتدا، شاخص و اجزای تشکیل دهنده آن را مفهوم سازی کنید (تعریف کنید). اگرچه این ساده به نظر می رسد، اما ممکن است بین قضات در مورد اینکه چه اجزایی (سازه ها) باید از یک شاخص گنجانده یا حذف شوند، اختلاف نظر وجود داشته باشد. به عنوان مثال، در شاخص SES، آیا درآمد با تحصیلات و شغل مرتبط نیست، و اگر چنین است، آیا باید فقط یک جزء را لحاظ کنیم یا هر سه جزء را؟ بررسی ادبیات، استفاده از نظریه ها، و/یا مصاحبه با کارشناسان یا سهامداران کلیدی ممکن است به حل این مشکل کمک کند. دوم، عملیاتی کردن و اندازه گیری هر جزء. به عنوان مثال، چگونه مشاغل را دسته بندی می کنید، به ویژه از آنجایی که برخی از مشاغل ممکن است با گذشت زمان تغییر کرده باشند (مثلاً هیچ توسعه دهنده وب قبل از اینترنت وجود نداشت). سوم، یک قانون یا فرمول برای محاسبه امتیاز شاخص ایجاد کنید. باز هم، این فرآیند ممکن است شامل ذهنیت های زیادی باشد. در نهایت، امتیاز شاخص را با استفاده از داده های موجود یا جدید تأیید کنید.

اگرچه شاخص‌ها و مقیاس‌ها یک امتیاز عددی یا مقدار واحد را نشان می‌دهند که یک سازه مورد علاقه را نشان می‌دهد، اما از بسیاری جهات متفاوت هستند. اولاً، شاخص‌ها اغلب شامل مؤلفه‌هایی هستند که بسیار متفاوت از یکدیگر هستند (مثلاً درآمد، تحصیلات و شغل در شاخص SES) و به روش‌های مختلفی اندازه‌گیری می‌شوند. با این حال، مقیاس‌ها معمولاً شامل مجموعه‌ای از موارد مشابه هستند که از مقیاس رتبه‌بندی یکسانی (مانند مقیاس پنج درجه‌ای لیکرت) استفاده می‌کنند. دوم، شاخص‌ها اغلب ارزش‌های قابل اندازه‌گیری عینی مانند قیمت‌ها یا درآمد را ترکیب می‌کنند، در حالی که مقیاس‌ها برای ارزیابی ساختارهای ذهنی یا قضاوتی مانند نگرش، تعصب یا عزت نفس طراحی می‌شوند. برخی استدلال می کنند که پیچیدگی روش مقیاس بندی مقیاس ها را از شاخص ها متفاوت می کند، در حالی که برخی دیگر پیشنهاد می کنند که روش نمایه سازی می تواند به همان اندازه پیچیده باشد. با این اوصاف،

گونه شناسی ها

مقیاس ها و شاخص ها معیارهای ترتیبی سازه های تک بعدی را تولید می کنند. با این حال، محققان گاهی اوقات مایلند اقدامات دو یا چند ساختار را برای ایجاد مجموعه‌ای از دسته‌ها یا انواع به نام گونه‌شناسی خلاصه کنند. بر خلاف مقیاس ها یا شاخص ها، گونه شناسی ها چند بعدی هستند اما فقط شامل متغیرهای اسمی هستند. به عنوان مثال، می توان یک گونه شناسی سیاسی از روزنامه ها را بر اساس جهت گیری آنها به سمت سیاست داخلی و خارجی ایجاد کرد، همانطور که در ستون های سرمقاله آنها بیان شده است، همانطور که در شکل 6.2 نشان داده شده است. این گونه‌شناسی می‌تواند برای دسته‌بندی روزنامه‌ها به یکی از چهار نوع ایده‌آل (A تا D)، شناسایی توزیع روزنامه‌ها در این انواع ایده‌آل، و شاید حتی ایجاد یک مدل طبقه‌بندی برای طبقه‌بندی روزنامه‌ها به یکی از این چهار نوع ایده‌آل بسته به استفاده شود. روی سایر صفات

 

شکل 6.2. گونه شناسی چند بعدی روزنامه ها

خلاصه

در پایان، ساخت مقیاس (یا شاخص) در تحقیقات علوم اجتماعی یک فرآیند پیچیده است که شامل چندین تصمیم کلیدی است. برخی از این تصمیمات عبارتند از:

  • آیا باید از مقیاس، شاخص یا نوع شناسی استفاده کنید؟
  • چگونه می خواهید داده ها را تجزیه و تحلیل کنید؟
  • سطح مورد نظر شما از اندازه گیری (اسمی، ترتیبی، فاصله ای یا نسبت) یا مقیاس رتبه بندی چیست؟
  • از چند ویژگی مقیاس باید استفاده کنید (مثلاً 1 تا 10؛ 1 تا 7؛ -3 تا +3)؟
  • آیا باید از تعداد فرد یا زوج از ویژگی ها استفاده کنید (یعنی می خواهید مقدار خنثی یا نقطه میانی داشته باشید)؟
  • چگونه می خواهید ویژگی های مقیاس (به ویژه برای مقیاس های تفاضلی معنایی) را برچسب گذاری کنید؟
  • در نهایت، از چه رویه ای برای تولید آیتم های مقیاس (مثلاً روش تورستون، لیکرت یا گاتمن) یا مؤلفه های شاخص استفاده می کنید؟

این فصل به بررسی فرآیند و نتایج توسعه مقیاس می پردازد. فصل بعدی چگونگی ارزیابی پایایی و اعتبار مقیاس های توسعه یافته با استفاده از رویکردهای فوق را بررسی خواهد کرد.

بدون نظر

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *