Oddiy logistik regressiya: bitta uzluksiz mustaqil o'zgaruvchi

Bizning qiziqish o'zgaruvchimiz, to'liq vaqtda o'qishga kirish, ikkita toifaga ega. Natijada, biz logistik regressiya yordamida modellashtirishimiz mumkin, natijada ikkilik o'zgaruvchini talab qiladi. Birinchidan, biz s2q10qaram o'zgaruvchi va s1gcseptsnewmustaqil o'zgaruvchi sifatida logistik regressiya modelini moslashtira olamiz . Ammo, ishni boshlashdan oldin, biz s1gcseptsnewva s2q10o'rtasidagi munosabatlar haqida javob olish uchun ikki tomonlama tahlilni olib borishimiz kerak .

Chunki s1gcseptsnewdoimiy, biz o'rta maktabdan keyin ta'lim to'la vaqt tahsil qilganlar va qilganlar uchun o'rtacha GCSE ballar bir statistik muhim farq bor yoki yo'qligini aniqlash uchun ikki misol T sinovlaridan ishlating. Bu, barcha kashfiyot tahlillari singari, bu o'zgaruvchilar uchun logistik regressiya modelini o'rnatishga arziydimi yoki yo'qligini aniqlashga yordam beradi. Agar s2q10 bo'yichaGCSE o'rtacha baliningfarqi ahamiyatsiz bo'lsa, logistika regressiyasini ishlatish bizning vaqtimizdan unumlifoydalanmaydi, chunki natijalarimiz ahamiyatli bo'lmaydi.

Bizning tahlilimiz to'g'ri yo'lda ekanligimizni aytishimiz bilan bir qatorda, bu oddiy t testini o'tkazish bizga "ha" deb javob berganlar va "yo'q" deb javob berganlarning chastotalarini ham beradi, bu bizga hisoblash imkonini beradi. ro'yxatga olingan va kunduzgi o'qishga kirmagan respondentlarning foizi.

O'tish tahlil, vositalari solishtiring, so'ngra mustaqil-namunalari T test.

Move s1gcseptsnewichiga sinov argumentlarni (lar)qutisiga va s2q10ichiga guruhlash O'zgaruvchiqutisiga.

Bosing Guruhlar aniqlangva kiriting 1yilda 1-guruhqutisiga va 2yilda guruh 21 = Ha va 2 = No chunki, qutisiga s2q10bizning ma'lumotlar majmui ichida. (Buni Ctrl + F tugmalarbirikmasiyordamida s2q10ni O'zgaruvchilar ko'rinishidagio'zgarmaydiganlar ro'yxatidan topish mumkin va s2q10qatoridagi qiymatlarkatakchasini ochish uchun bosing . Bu s2q10toifasidagi har bir toifaga qanday qiymatlar berilganligini ko'rsatadi). Bosing Continue. Mustaqil namunalar T testidialog oynasini yopish uchun OKni bosing .

Sizning chiqishingiz o'ngdagi jadvalga o'xshash bo'lishi kerak.

Quyidagi savollarga javob berish uchun t test chiqish jadvallaridagi ma'lumotlarni ishlatishingiz mumkin:

To'liq kunduzgi ta'limga yozilgan respondentlar uchun GCSE ning o'rtacha bahosi qanday?

To'liq vaqtda o'qishga kirmagan respondentlar uchun GCSE ning o'rtacha bahosi qanday?

Mustaqil namuna testiningchiqish qutisidagi ahamiyatlilik darajasini ko'rib chiqing . To'liq vaqtda o'qishga kirgan s2q10respondentlar va o'qimaganlaruchun GCSE o'rtacha ballari o'rtasida sezilarli farq bormi? GCSEning

o'rtacha respondent ballari o'rtasida muhim farq borligini kashf qilganimiz uchun, biz bilamizki, s2q10va s1gcseptsnewo'rtasida bog'liqlik bor. Endi biz bu munosabatlarni yanada chuqurroq o'rganish uchun logistik regressiya modelini o'rnatishni davom ettira olamiz.

Tanlang tahlil, orqagakeyin, va ikkilik logistika.

Muloqot oynasining chap tomonidagi o'zgarmaydiganlar ro'yxatidan s2q10o'zgaruvchisini toping va unga bog'liqmatn maydonini o'tkazing. S1gcseptsnewo'zgaruvchisini topingva uni Covariatesmatn maydoniga o'tkazing. Bosing OK.

Sizda Chiqish Viewer -da bir nechta chiqish jadvallari ochiladi. Keling, ularni ko'rib chiqaylik.

Ishlarni ko'rib chiqishning qisqacha mazmunideb nomlangan birinchi jadval bizga shuni ko'rsatadiki, ushbu logistika regressiyasiga 9705 ta holat kiritilgan va 4298 tasi yo'qolgan deb kodlangan.

Ma'lumotlar bazamizda, s2q10o'zgaruvchisida "Ha" "1", "Yo'q" esa "2" deb kodlangan. "Yo'q" degan javob o'zboshimchalik bilan katta raqamli kod bilan berilgan (chunki 2 1dan katta). SPSS -dagi logistika regressiyasida katta raqam bilan kodlangan o'zgaruvchilar toifasi (bu holda "Yo'q") bizning regressiyamiz ehtimollarni bashorat qiladigan hodisaga aylanadi. Boshqacha qilib aytganda, "Yo'q" natijasi ma'lumotlar to'plamida "2" sifatida kodlanganligi sababli, logistika regressi respondentning "Yo'q" deb javob berish ehtimolini oldindan aytib beradi. Chunki biz hozirda respondentning "Yo'q" deb javob berish ehtimolini bashorat qilyapmiz, bu bizning modelimizdagi muvaffaqiyat yoki "1" ga aylanadi. "Ha" javobi muvaffaqiyatsiz yoki "0". Qaram o'zgarmaydigan KodlashJadval shuni ko'rsatadiki, "Ha" va "Yo'q" ning asl qiymatlari ( s2q10javoblari ) bu tahlilda "0" va "1" sifatida kodlangan.

Chiqish oynasida ko'rib turganingizdek, SPSS sizga ko'plab jadvallarni beradi, ularning aksariyati sizni tashvishga solmaydi. Bu erda biz faqat asosiy fikrlarni ta'kidlaymiz. Boshqa jadvallar siz chuqurroq tahlil qilganingiz sari yanada foydali bo'ladi-biz hozir ular haqida qayg'urmasligimiz kerak.

0-blok: Boshlang'ich blokdagichiqish jadvallari modelga bizning mustaqil o'zgaruvchimiz s1gcseptsnewqo'shilishidan oldin to'liq vaqtda o'qishga qabul qilish bashoratini ko'rsatadi . 0 -blok bizga GCSE balining ta'sirisiz respondentning to'liq vaqtda o'qishga kirmasligini ko'rsatadi.

0 -blok: Boshlanish bloki

Yilda Equation o'zgaruvchilarstol, biz to'liq ta'lim qabul qilinmoqda emas raqam ko'rish mumkin. Bu koeffitsientlar nisbati ushbu jadvalda Exp (B)chiqishi sifatida keltirilgan. Bu erda biz GCSE balini qo'shmasdan, respondentni kunduzgi o'qishga yozilmaslik ehtimoli 0,237, respondentning kunduzgi o'qishga yozilish ehtimoli borligini ko'ramiz.

Yilda emas, Equation o'zgaruvchilarstol, biz o'zgaruvchan uchun bashorat ahamiyatga ko'rish s1gcseptsnew. Agar p S1gcseptsnewo'z ichiga olgan logistika regressiyasiga o'tishdan oldin, biz uchun bu erda berilgan ma'lumotlarni ko'rib chiqing.

Bu modeldagi s1gcseptsnewuchun bashorat qilingan p-qiymati 0.000 ga teng ekanligini ko'rishimiz mumkin .

Sizningcha, bizning tushuntirish o'zgaruvchisining qo'shilishi bizning modelimizga nima beradi? Bu logistika regressiyasini yaxshilaydi? Biz o'z modelimizga s1gcseptsnewni qo'shganimizda, ehtimollarni oldindan ko'ra olamizmi? Nega yoki nima uchun?

Keling, 1-blokga o'taylik : Method = Enter, va bizning mustaqil o'zgaruvchimiz to'liq o'qishga yozilmasligi ehtimoli qanday o'zgarishini (agar mavjud bo'lsa) ko'rib chiqing.

1 -blok: Usul = Kirish

Model koeffitsiyentlarini Omnibus Testlarstol namoyishlari bizga chi-kvadrat sinov natijalari. Bu gipoteza testi GCSE balining o'rta maktabdan keyin to'liq vaqtda o'qishga kirishini bashorat qilishda statistik jihatdan ahamiyatli ta'siri bor yoki yo'qligini tekshiradi. GCSE balining kunduzgi o'qishga kirishga statistik jihatdan muhim ta'sir ko'rsatishini qabul qilish uchun p qiymati 0,05 dan past bo'lishi kerak.

Yuqoridagi natijalarga asoslanib, sizningcha, GCSE ballari kunduzgi o'qishga kirishni bashorat qilishga statistik jihatdan muhim ta'sir ko'rsatadimi?

Biz Quyidagi Modellar Xulosachiqish jadvalida hisoblangan Cox & Snell r 2statistikasidan foydalanamiz, bu vaqtda o'qishga kunduzgi o'qishning qancha o'zgarishi tushuntirilgan va shuning uchun bizning modelimiz ma'lumotlarimizga qanchalik mos keladi. Bu misolda r 2 0,168 ga teng. Bu shuni ko'rsatadiki, o'qishga qabul qilishdagi o'zgarishlarning 16,8% GCSE ballari bilan izohlanadi (0,168 X 100 = 16,8). Bu shuni ko'rsatadiki, respondentning kunduzgi o'qishga kirishiga boshqa omillar ta'sir ko'rsatadi.

Bizning logistika regressiya modeli yaxshimi? Qanday qilib ayta olasiz?

Yilda Equation o'zgaruvchilarstol, biz uchun p-qiymati, deb ko'rish mumkin s1gcseptsnewbu tushish P = 0.000 bo'lgan, bu o'zgaruvchilar ma'no to'liq ta'lim javobgar ro'yxatdan o'tishingiz ustida mazmunli ta'sir qiladi.

Ko'rib turganingizdek, aslida logistika regressiyasini ishga tushirish muammo emas - ikkilik natija o'zgaruvchisini SPSS -dagi to'g'ri maydonga qo'yishni eslasangiz, xato qilish qiyin! Biroq, natijalarning talqini biroz murakkabroq - va talqin sizni haqiqatan ham qiziqtiradi.

Yuqorida ta'kidlab o'tilganidek, biz respondentning GCSE ballari va to'liq ro'yxatga olish o'rtasidagi bog'liqlik ahamiyatli ekanligini osongina ko'rishimiz mumkin (p qiymati 0,05 dan past). Ammo bu munosabatlar nima? GCSE balining har bir punktga oshishi uchun, kunduzgi o'qishga kirmagan odamning imkoniyatlari 0,010 birlikka kamayadi. Bu talqin nuqtai nazaridan ko'p narsani anglatmaydi, bu afsuski, chunki logistika regressiyasi haqiqatan ham log -modda bo'yicha tahlil o'tkazadi. Buni talqin qilishning eng yaxshi usuli - bu jadvalning oxirgi ustunidagi Exp (B) ustuniga kiritilgan koeffitsientlar nisbati. Bizning misolimizda koeffitsientlar nisbati 0,990. Chunki s1gcseptsnewuzluksiz o'zgaruvchidir, aytishimiz mumkinki, GCSE balining har bir punkti ortishi bilan o'rta maktabdan so'ng to'liq vaqtda o'qishga kirmaslik ehtimoli 0,990 ga ko'payadi. 0.990 1dan kichik bo'lgani uchun, 0.990 ga ko'paytiriladigan har qanday koeffitsient kamayadi. Shuning uchun, GCSE ballari oshgani sayin, kunduzgi ta'limga yozilmaslik ehtimoli kamayadi. GCSE ballari yuqori bo'lgan yoshlar o'rta maktabni tugatgandan so'ng kunduzgi o'qishga ko'proq kirishadi.

Logistik regressiya natijalarini ehtimolliklar sifatida talqin qilish mumkin - lekin biz bu erda bu ishni qilmaymiz.

GCSE balining bu farqi, biz ushbu logistik regressiyani ishga tushirishdan oldin biz hisoblagan s1gcseptsn yangi respondentlar uchun o'rtacha GCSE ballarida o'z aksini topgan. O'qishga kunduzgi o'qishga "Ha" deb javob bergan respondentlar uchun GCSE ning o'rtacha bahosi 432.85 edi. O'qishga kunduzgi o'qishga "Yo'q" deb javob bergan respondentlar uchun GCSE ning o'rtacha bahosi 290.70 edi.

Xulosa

Birinchidan, s1gcseptsnew uzluksiz mustaqil o'zgaruvchimiz va s2q10 toifali bog'liq o'zgaruvchimiz o'rtasida statistik ahamiyatga ega bog'liqlik bor yoki yo'qligini aniqlash uchun siz mustaqil namuna (yoki ikkita namunali) t testidan foydalangansiz. So'ngra, oddiy logistika regressiyasidan foydalanib, siz GCSE ballari bo'yicha o'rta maktabdan keyin to'liq vaqtda o'qishga kirmagan respondentning imkoniyatlarini bashorat qildingiz. Siz logistika regressiyasi natijalari birinchi navbatda log-odds sifatida taqdim etilganini, lekin bu natijalar ko'pincha talqin qilishda muammo tug'dirishini bilib oldingiz. Logistik regressiya modelining natijalarini ehtimollik sifatida talqin qilish mumkin bo'lsa -da, natijalarni ta'riflashning eng qulay usuli bu Tenglama chiqish jadvalidagi o'zgarmaydiganlarning Exp (B) ustunida SPSS tomonidan taqdim etilgan koeffitsientlardan foydalanish.

Eslatma: ma'lumotlar bazasiga o'zgartirishlar kiritayotganimizda, biz ushbu bo'limning qolgan qismida foydalanishni davom ettiramiz, iltimos, SPSSni yopishdan oldin, o'zgarishlarni saqlaganingizga ishonch hosil qiling. Bu sizni tugatgan bo'limlarni takrorlashdan qutqaradi.