R da multinomial va ordinal logistik regressiyadan qanday foydalanish kerak?

Ko'pchiligimiz regressiya haqida cheklangan bilimga egamiz. Chiziqli va logistik regressiya - bu biz uchun eng yoqqanlari. Qizig'i shundaki, regressiya har xil turdagi o'zgaruvchilar bilan ishlash imkoniyatlarini kengaytirdi. Bilasizmi, regressiyada ko'p darajali qaram o'zgaruvchilar bilan ishlash qoidalari mavjudmi? Ishonchim komilki, siz qilmadingiz. Men ham shunday qilmadim. Menga regressiyaning bu tomonini o'rganishga majbur bo'lgunga qadar.

Ko'p darajali qaram o'zgaruvchilar uchun siz uchun vazifani bajaradigan ko'plab mashinalarni o'rganish algoritmlari mavjud; sodda Bayes, qaror daraxti, tasodifiy o'rmon va hk. Boshlanuvchilar uchun bu algoritmni tushunish biroz qiyin bo'lishi mumkin. Ammo, agar siz logistika regressiyasini yaxshi tushunsangiz, regressiyaning bu yangi tomonini o'zlashtirish siz uchun oson bo'lishi kerak!

Ushbu maqolada men multinomial va tartibli regressiyadan foydalanish usulini tushuntirdim. Bundan tashqari, amaliy maqsadda men bu algoritmni R.da asta -sekin ko'rsatdim. Bu maqola batafsil maqoladan ilhom oladi. Men bunga o'z fikrimni qo'shdim.

Eslatma: Ushbu maqola logistika regressiyasi haqida oldindan ma'lumotga ega bo'lgan R foydalanuvchilari uchun eng mos keladi. Ammo, agar siz pythondan foydalansangiz, siz hali ham ushbu regressiya usuli haqida umumiy tushuncha olishingiz mumkin.

Multinomial regressiya nima?

Multinomial Logistik Regressiya (MLR) - bu chiziqli regressiya tahlilining bir shakli, agar qaram o'zgaruvchi ikki darajadan ortiq nominal bo'lsa. Ma'lumotlarni tasvirlash va bitta qaram nominal o'zgaruvchi va bir yoki bir necha doimiy darajali (interval yoki nisbat shkalasi) mustaqil o'zgaruvchilar o'rtasidagi munosabatni tushuntirish uchun ishlatiladi. Siz nominal o'zgaruvchini ichki tartibsiz o'zgaruvchi sifatida tushunishingiz mumkin.

Masalan: O'rmonlarning turlari: "Doimiy yashil o'rmon", "Bargli o'rmon", "Yomg'irli o'rmon". Ko'rib turganingizdek, ularda ichki tartib yo'q, lekin har bir o'rmon o'ziga xos toifani ifodalaydi. Boshqacha qilib aytganda, multinomial regressiya - bu ikkilamchi (ikkilik) qaramlarni tahlil qiladigan logistika regressiyasining kengaytmasi.

Multinomial regressiya qanday ishlaydi?

Multinomial logistika regressiyasi har bir qo'g'irchoqli o'zgaruvchi uchun alohida ikkilik logistik regressiya modelini baholaydi. Natijada M-1 ikkilik logistik regressiya modellari. Har bir model, mos yozuvlar toifasiga qaraganda, ushbu toifadagi muvaffaqiyat ehtimoliga bashoratchilar ta'sirini ko'rsatadi.

Har bir modelning o'ziga xos kesish va regressiya koeffitsientlari bor - bashoratchilar har bir toifaga turlicha ta'sir ko'rsatishi mumkin. Keling, bu qismni bizning klassiklarimiz bilan solishtiraylik - chiziqli va logistik regressiya.

Standart chiziqli regressiya qaram o'zgaruvchining doimiy darajali (intervalli yoki nisbatli) shkalada bo'lishini talab qiladi. Biroq, logistika regressiyasi qaram o'zgaruvchini stoxastik hodisa deb faraz qilib, bo'shliqni oshiradi. Va qaram o'zgaruvchi zichlik funktsiyasi bilan bu stokastik hodisaning natijasini tasvirlaydi (0 dan 1 gacha bo'lgan to'plangan ehtimolliklar funktsiyasi).

Statistlar, agar ehtimol 0,5dan kichik bo'lsa, bitta hodisa sodir bo'lishini va ehtimol 0,5dan katta bo'lganida, teskari hodisa sodir bo'lishini ta'kidlaydilar.

Endi bilamizki, MLR ikkilik logistika modelini ko'p toifali (qaram o'zgaruvchida) modelga kengaytiradi. Biroq, uning bitta cheklovi bor. Natija tegishli bo'lgan toifada hech qanday tartib yo'q. Misol uchun, agar bizda N toifasi bo'lsa, hamma teng ehtimolga ega. Aslida, toifalar tabiiy tartibga ega bo'lgan muammolarga duch kelamiz.

Xo'sh, qaram o'zgaruvchilar toifasida tabiiy tartib bo'lsa, nima qilishimiz kerak? Bunday vaziyatda oddiy regressiya bizga yordam beradi.

Oddiy regressiya nima?

Oddiy regressiya (oddiy logistik regressiya deb ham ataladi) binomial logistika regressiyasining yana bir kengaytmasi. Oddiy regressiya "buyurtma qilingan" bir nechta toifalar va mustaqil o'zgaruvchilar bilan bog'liq o'zgaruvchini bashorat qilish uchun ishlatiladi. Boshqacha qilib aytganda, u bir yoki bir nechta mustaqil o'zgaruvchilar bilan bog'liq bo'lgan o'zgaruvchilarning o'zaro ta'sirini osonlashtirish uchun ishlatiladi.

Masalan: so'rovnoma o'tkazildi deb faraz qilaylik. Biz javob beruvchiga savol berdik, ularning javobi rozi yoki rozi emas . Shunday qilib to'plangan javoblar bizga yaxshi umumlashtirishga yordam bermadi. Keyinchalik, biz qat'iyan rozi emasman, rozi emasman, qo'shilaman, qat'iyan roziman kabi javob darajalarini qo'shdik.

Bu bizga toifadagi tabiiy tartibni kuzatishimizga yordam berdi. Bizning regressiya modeli real bo'lishi uchun, biz MLRda bo'lgani kabi sodda emas, balki bu tartibni qadrlashimiz kerak. Oddiy logistika regressiyasi bu haqiqatni ko'rib chiqadi. Ordinal toifalar tartibini bildiradi.

Misollar

Bu algoritmni Rda bajarishdan oldin, keling, quyidagi holatlar yordamida aniq tushuncha olganimizga ishonch hosil qilaylik:

1 -holat (Multinomial regressiya)

O'rta maktab o'quvchilari tomonidan tanlov dasturlarini modellashtirish Multinomial logit yordamida amalga oshirilishi mumkin. Dastur tanlovi umumiy dastur, kasb -hunar dasturi va akademik dasturdir. Ularning tanlovini yozish ballari va ijtimoiy iqtisodiy maqomi yordamida modellashtirish mumkin.

Ijtimoiy maqom, kanal turi, talabalar tomonidan berilgan mukofotlar va mukofotlar, jinsi, iqtisodiy holati va berilgan fanlarda o'qish va yozish qobiliyati kabi turli xil atributlarga asoslanib, dastur turini tanlash mumkin. bashorat qilgan. Ko'p darajali (tartiblanmagan) dasturlarni tanlash bog'liq o'zgaruvchidir. Bu holat ko'p bosqichli logistik regressiya texnikasidan foydalanish uchun javob beradi.

2 -holat (oddiy regressiya)

Tadqiqot aspiranturaga hujjat topshirish to'g'risida qaror qabul qilishga ta'sir qiluvchi omillarni ko'rib chiqadi. Kollej o'quvchilaridan aspiranturaga hujjat topshirish ehtimoli yo'qmi yoki yo'qmi deb so'raladi. Shunday qilib, bizning natija o'zgaruvchimiz uchta toifaga ega: ehtimol, ehtimol, ehtimol va juda katta.

Ota -onalarning ta'lim holati, muassasa sinfi (xususiy yoki davlat boshqaruvi), joriy GPA to'g'risidagi ma'lumotlar ham to'planadi. Tadqiqotchilar bu uch nuqta orasidagi "masofalar" teng emas deb ishonish uchun asos bor. Masalan, "mumkin emas" va "biroz ehtimol" o'rtasidagi "masofa" "biroz ehtimol" va "juda ehtimol" orasidagi masofadan qisqa bo'lishi mumkin. Bunday holda, biz oddiy regressiyadan foydalanamiz.

Multinomial logistik regressiya (MLR), R

>kutubxona ("xorijiy")

>ml

## id ayol ses schtyp prog o'qish matematika fanidan yozing

## 1 45 ayol kam jamoatchilikka 34 35 41 29 26

## 2 108 erkak o'rta jamoat generali 34 33 41 36 36

## 3 15 erkak yuqori jamoatchilik talabi 39 39 44 26 42

## 4 67 erkaklar kam jamoatchilikka bo'lgan talablari 37 37 42 33 32

## 5 153 erkak o'rta jamoatchilik kasblari 39 31 40 39 51

## 6 51 ayol oliy general 42 36 42 31 39

## faxriy mukofotlar cid

## 1 ro'yxatga olinmagan 0 1

## 2 yozilmagan 0 1

## 3 yozilmagan 0 1

## 4 yozilmagan 0 1

## 5 yozilmagan 0 1

## 6 yozilmagan 0 1

>ml $ prog2

Endi biz ikkita mustaqil o'zgaruvchiga ega multinomial regressiyani amalga oshiramiz.

>kutubxona ("nnet")

>test

ses + yozish, ma'lumotlar = ml)

## # og'irliklar: 15 (8 o'zgaruvchi)

## boshlang'ich qiymati 219.722458

## iter 10 qiymati 179.982880

## yakuniy qiymati 179.981726

## birlashtirilgan

## Qo'ng'iroq:

## multinom (formula = prog2

ses + write, data = ml)

##

## Koeffitsientlar:

## (Intercept) sesmiddle seshigh write

## general 2.852198 -0.5332810 -1.1628226 -0.0579287

## kasb 5.218260 0.2913859 -0.9826649 -0.1136037

##

## Std. Xatolar:

## (Intercept) sesmiddle seshigh yozish

## umumiy 1.166441 0.4437323 0.5142196 0.02141097

## kasb 1.163552 0.4763739 0.5955665 0.02221996

##

## Qoldiq og'ish: 359.9635

## AIC: 375.9635

Tushuntirish

1. Modelning bajarilish natijasi ba'zi iteratsiya tarixini ko'rsatadi va 179.981726-sonli salbiy jurnal ehtimolini o'z ichiga oladi. Bu qiymat qoldiq deviance sifatida model xulosasida ko'rsatilgandek ikkiga ko'paytiriladi.

2. Xulosa chiqarishda koeffitsientlar bloki va boshqa standart xatolar bloki mavjud. Har bir blokda bitta model tenglamasiga mos keladigan qiymatlar qatori mavjud. Koeffitsientlar blokida biz birinchi qatorni prog = "general" bilan bizning boshlang'ich prog = "akademik" va ikkinchi qatorni prog = "kasbiy" bilan bizning boshlang'ich prog = "akademik" darajamizga solishtirayotganini ko'ramiz.

3. Bir-qism o'sish yoz 0.0579 tomonidan o'quv dasturi va boshqalar umumiy dasturda bo'lish log tikish kamayadi

4. Bir-qism o'sish yoz 0.1136 tomonidan o'quv dasturi va boshqalar kasb dasturida bo'lish log tikish kamayadi

5. Umumiy dasturda bo'lish ehtimoli akademik dasturga qaraganda 1.163 ga kamayadi, agar ses = "past" dan ses = "yuqori" ga o'tilsa.

6. Boshqa tomondan, umumiy dasturda bo'lish ehtimoli akademik dasturga qaraganda 0,5332 ga kamayadi, agar ses = "past" dan ses = "o'rtasiga" o'tilsa.

7. "Ses =" past "dan" ses "=" yuqori "darajasiga o'tilsa, kasbiy dastur va akademik dasturda bo'lish ehtimoli 0,983 ga kamayadi.

8. "Ses =" past "dan" ses = "o'rtasiga" o'tadigan bo'lsak, kasbiy dastur va akademik dasturda bo'lish ehtimoli 0,291 ga oshadi.

Endi biz modeldagi o'zgaruvchilar uchun Z balini va p-qiymatini hisoblaymiz.

>z
>z

## (Intercept) sesmiddle seshigh yozish

## umumiy 2.445214 -1.2018081 -2.261334 -2.705562

## kasb 4.484769 0.6116747 -1.649967 -5.112689

>p < - (1 - pnorm (abs (z), 0, 1))* 2

>p

## (Intercept) sesmiddle seshigh yozish

## umumiy 0.0144766100 0.2294379 0.02373856 6.818902e-03

## kasb 0.0000072993 0.5407530 0.09894976 3.176045e-07

## (Intercept) sesmiddle seshigh yozish

## umumiy 17.32582 0.5866769 0.3126026 0.9437172

## kasb 184.61262 1.3382809 0.3743123 0.8926116

P-Value bizga ovoz o'zgaruvchilari ahamiyatli emasligini aytadi. Endi biz butun ma'lumotlar to'plamini o'rganamiz va agar biz model ishlashiga qo'shilmaydigan o'zgaruvchilarni o'chira olsak, tahlil qilamiz.

## [1] "id" "ayol" "ses" "schtyp" "prog" "o'qish" "yozish"

## [8] "matematika" "fan" "socst" "sharaflash" "mukofot" "cid" " prog2 "

## [1] "past" "o'rta" "baland"

## [1] "ommaviy" "shaxsiy"

## [1] "yozilmagan" "ro'yxatga olingan"

Keling, id va prog o'zgaruvchilarini olib tashlaganimizdan so'ng, butun ma'lumotlar majmuasida multinomial modelni yarataylik .

>test

., ma'lumotlar = ml [,- c (1, 5, 13)])

## # og'irliklar: 39 (24 o'zgaruvchi)

## boshlang'ich qiymati 219.722458

## iter 10 qiymati 178.757016

## iter 20 qiymati 155.866327

## iter 30 qiymati 154.365307

## yakuniy qiymati 154.365305

## yaqinlashgan

## Qo'ng'iroq:

## multinom (formula = prog2

., ma'lumotlar = ml [, -c (1, 5, 13)])

##

## Koeffitsientlar:

## (To'xtatish) ayol urg'ochi sesmiddle seshigh schtypprivate

## umumiy 5.692368 0.1547445 -0.2809824 -0.9632924107 -0.5872049

## kasb 1.2867933 0,0008659972 -1,9089941

## o'qing yozish matematik fan socst

## umumiy -0,04421300 -0,05434029 -0,1001477 0,10397170 -0,02486526

## kasb -0,04124332 -0,05149742 -0,1209839 0,06341246 -0,07012002

## honorsenrolled mukofotlari

## -0,5963679 0,26104317 umumiy

## kasb 1,0986972 -0,08573852

##

## Std. Xatolar:

## (Intercept) ayol ayol sesmiddle seshigh schtypprivate

## umumiy 2.385383 0.4514339 0.5224132 0.5934146 0.5597181

## kasb 2.566895 0.4993567 0.5764471 0.6885407 0.8313621

## o'qing yozish matematik fan socst

## umumiy 0.03076523 0.05109711 0.03514069 0.03153073 0.02697888

## kasb 0.03451435 0.05358824 0.03902319 0.03252487 0.02912126

## honorsenrolled mukofotlari

## umumiy 0.8708913 0.2969302

## kasb 0.9798571 0.3708768

##

## Qoldiq Burilish: 308.7306

## AIC: 356.7306

Keling, mos keladigan qiymatlarni tekshirib ko'ramiz.

>bosh (o'rnatilgan (sinov))

## akademik umumiy kasb -hunar

## 1 0.08952937 0.1811189 0.7293518

## 2 0.05219222 0.1229310 0.8248768

## 3 0.54704495 0.0849831 0.3679719

## 4 0.17103536 0.2750466 0.5539180

## 5 0.100140.6 0.2414 0.24

0.12 0.1412 0.24 0.22

Modelni yaratgandan so'ng, biz uni bashorat qilish uchun ishlatamiz. Keling, turli xil almashtirish va kombinatsiyalar bilan yangi ma'lumotlar to'plamini yarataylik.

>kengaytirilgan = expand.grid (ayol = c ("ayol", "erkak", "erkak", "erkak"),

ses = c ("past", "past", "o'rta", "baland"),

schtyp = c ("ommaviy", "ommaviy", "shaxsiy", "shaxsiy"),

o'qish = c (20,50,60,70),

yozish = c (23,45,55,65),

matematika = c ( 30,46,76,54),

fan = c (25,45,68,51),

socst = c (30, 35, 67, 61),

sharaf = c ("yozilmagan", "yozilmagan", " yozilgan "," yozilmagan "),

mukofotlar = c (0,0,3,0,6))

## ayol ses schtyp o'qish matematika fanlari bo'yicha mukofotlarni yozing

## 1 ayol kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 2 erkak kam jamoatchilik 20 23 30 25 30 yozilmagan 0

## 3 erkak kam jamoat 20 23 30 25 30 ro'yxatga olinmagan 0

## 4 erkak kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 5 ayol kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 6 erkak kam jamoatchilik 20 23 30 25 30 ro'yxatdan o'tmagan 0

## akademik umumiy kasb -hunar

## 1 0.01357216 0.1759060 0.8105219

## 2 0.01929452 0.2142205 0.7664850

## 3 0.01929452 0.2142205 0.7664850

## 4 0.01929452 0.2142205 0.7664850

## 5 0.013578126

0.15216 0.15 0.16

Endi biz prognoz qiymatlarini hisoblaymiz. Parametr turi = "problar", ehtimolliklarga bo'lgan qiziqishimizni bildiradi. Intuitiv tushunish uchun taxmin qilingan ehtimollarni tuzish uchun biz ma'lumotlarga taxmin qilingan ehtimollik qiymatlarini qo'shamiz.

Endi biz sesning har bir darajasida o'rtacha ehtimolliklarni hisoblaymiz.

>tomonidan (bpp [, 4: 7], bpp $ ses, colMeans)

## bpp $ ses: past

## o'qish matematika fanini yozish

## 50.00 47.00 51.50 47.25

## ----------------------------- ---------------------------

## bpp $ ses: o'rta

## o'qish matematika fanini yozish

## 50.00 47.00 51.50 47.25

##- -------------------------------------------------- ----

## bpp $ ses: yuqori

## o'qish matematika fanini yozing

## 50.00 47.00 51.50 47.25

Men "reshape2" paketidagi melt () funktsiyasidan foydalanganman. U ma'lumotlarni "eritib yuboradi", chunki har bir satr id-o'zgaruvchining noyob kombinatsiyasi hisoblanadi.

## Ogohlantirish: "reshape2" to'plami R versiyasi 3.1.3 ostida tuzilgan

>bpp2 = eritish (bpp, id.vars = c ("ayol", "ses", "schtyp", "o'qish", "yozish", "matematika", "fan", "socst", "sharaf",) mukofotlar "), value.name =" ehtimollik ")

## ayol ses schtyp o'qish matematika fanlari bo'yicha mukofotlarni yozing

## 1 ayol kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 2 erkak kam jamoatchilik 20 23 30 25 30 yozilmagan 0

## 3 erkak kam jamoat 20 23 30 25 30 ro'yxatga olinmagan 0

## 4 erkak kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 5 ayol kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## 6 erkak kam jamoatchilik 20 23 30 25 30 ro'yxatga olinmagan 0

## o'zgaruvchan ehtimollik

## 1 akademik 0.01357216

## 2 akademik 0.01929452

## 3 akademik 0.01929452

## 4 akademik 0.01929452

## 5 akademik 0.01357216

## 6 akademik 0.01929452

Endi biz ggplot () funktsiyasidan foydalanib, mustaqil o'zgaruvchilar va mustaqil o'zgaruvchilarning taqsimlanishini o'rganish uchun grafiklar tuzamiz. Ggplot -da, bu funksiyaning birinchi parametri - bu chiziladigan ma'lumotlar qiymatlari. Ikkinchi qism - bu erda (aes ()) o'zgaruvchilarni x va y o'qiga bog'laydi. Biz chizish funktsiyasiga geom_line () yordamida chiziq chizishni aytamiz. Biz maktab turini turli xil ranglarda chizish orqali farqlayapmiz.

>ggplot (bpp2, aes (x = yozish, y = ehtimollik, rang = ses)) +

geom_line () + facet_grid (o'zgaruvchi)

Shu paytgacha biz R.da multinomial regressiyadan foydalanishni o'rgandik, agar sizda logistika regressiyasi haqida oldindan ma'lumot bo'lsa, natijalarni talqin qilish unchalik qiyin bo'lmaydi. Keling, R ning tartibli regressiyasini tushunishga o'tamiz.

Oddiy logistik regressiya (OLR), R.

Quyida R da OLRni bajarish bosqichlari keltirilgan:

Kutubxonalarni yuklash

>talab qilish (xorijiy)

>talab qilish (ggplot2)

>talab qilish (MASS)

>talab qilish (Hmisc)

>talab qilish (reshape2)

>dat
>bosh (ma'lumotlar)

## amaldagi umumiy gpa

## 1 juda ehtimol 0 0 3.26

## 2 biroz ehtimol 1 0 3.21

## 3 ehtimol 1 1 3.94

## 4 biroz ehtimol 0 0 2.81

## 5 biroz ehtimol 0 0 2.53

## 6 ehtimol 0 1 2.59

Keling, ma'lumotlarni tezda tushunaylik.

Ma'lumotlar majmuasida apply deb nomlanuvchi bog'liq o'zgaruvchi mavjud . U 3 darajaga ega, ya'ni "ehtimoldan yiroq", "biroz ehtimol" va "juda ehtimol", mos ravishda 1, 2 va 3 bilan kodlangan. 3 - eng yuqori, 1 - past. Bu holat tartibli regressiyani qo'llash uchun eng yaxshisidir, chunki buyurtma qilingan toifalar mavjud. Pared (0/1), kamida bitta ota -onaning oliy ma'lumotga ega ekanligini anglatadi; ommaviy (0/1) bakalavr institutining turiga tegishli.

Ushbu modelni yaratish uchun biz buyurtma qilingan logistik regressiyani baholash uchun polr buyrug'idan foydalanamiz . Keyin, biz standart xatolarni olish uchun ishlatiladigan optimallashtirishdan kuzatilgan ma'lumot matritsasini ko'rsatish uchun Hess = TRUE ni belgilaymiz.

pared + public + gpa, data = dat, Hess = TRUE)

>xulosa (m)

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + public + gpa, data = dat, Hess = TRUE)

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 1.04769 0.2658 3.9418

## public -0.05879 0.2979 -0.1974

## gpa 0.61594 0.2606 2.3632

##

## Interceptions:

## Value Std. Xato t qiymati

## mumkin emas | biroz ehtimol 2.2039 0.7795 2.8272

## biroz ehtimol | ehtimol 4.2994 0.8043 5.3453

##

## Qoldiq og'ish: 717.0249

## AIC: 727.0249

Biz odatdagi regressiya chiqish koeffitsienti jadvalini ko'ramiz, har bir koeffitsientning qiymati, standart xatolar, t qiymatlari, ikkita kesish uchun qoldiq deviance va AIC. AIC - axborot mezoni. Kamroq yaxshi.

Endi biz p-Value, CI, Odds nisbati kabi ba'zi muhim ko'rsatkichlarni hisoblaymiz

## qiymati Std. Xato t qiymati

pared ## 1.04769010 0.2657894 3.9418050

## davlat -0,05878572 0,2978614 -0,1973593

## gpa 0,61594057 0,2606340 2,3632399

## dargumon | Ehtimoli 2,20391473 0,7795455 2,8271792

## Ehtimoli | ko'p ehtimol 4,29936315 0,8043267 5,3452947

>p
>ctable

## qiymati Std. Xato t qiymati p qiymati

## 1.04769010 0.2657894 3.9418050 8.087072e-05 pared

## davlat -0,05878572 0,2978614 -0,1973593 8.435464e-01

## gpa 0,61594057 0,2606340 2,3632399 1.811594e-02

## dargumon | Ehtimoli 2,20391473 0,7795455 2,8271792 4.696004e-03

## biroz ehtimol | ehtimol 4.29936315 0.8043267 5.3452947 9.027008e-08

# ishonch oralig'i

>ci

## Profil tuzilishini kutish.

## 2,5 % 97,5 %

## pared 0.5281768 1.5721750

## public -0.6522060 0.5191384

## gpa 0.1076202 1.1309148

## ommaviy gpa

## 2.8510579 0.9429088 1.8513972

## OR va CI

>exp (cbind (OR = coef (m), ci))

## Yoki 2,5 % 97,5 %

## pared 2.8510579 1.6958376 4.817114

## ommaviy 0.9429088 0.5208954 1.680579

## gpa 1.8513972 1.1136247 3.098490

Tushuntirish

1. Ota -onalar ta'limining bir birlik ortishi, 0 (past) dan 1 (yuqori) gacha, "ehtimol" va "biroz ehtimol" yoki "ehtimoldan yiroq" qo'llash kombinatsiyasi 2,85 ga ko'p.

2. Qo'llash ehtimoli "ehtimoldan yiroq" yoki "ehtimoldan yiroq" ehtimoli 2,85 baravar katta.

3. GPA uchun, talabaning gpa 1 birlikni ko'chirganda, "ehtimoldan yiroq" dan "biroz ehtimol" yoki "juda likleyli" ga o'tish ehtimoli (yoki pastki va o'rta toifalardan yuqori toifaga) 1,85 ga ko'paytiriladi. .

Keling, yaxshiroq taxmin qilish uchun ushbu modelni takomillashtirishga harakat qilaylik.

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + public + gpa, data = dat, Hess = TRUE)

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 1.04769 0.2658 3.9418

## public -0.05879 0.2979 -0.1974

## gpa 0.61594 0.2606 2.3632

##

## Interceptions:

## Value Std. Xato t qiymati

## mumkin emas | biroz ehtimol 2.2039 0.7795 2.8272

## biroz ehtimol | ehtimol 4.2994 0.8043 5.3453

##

## Qoldiq og'ish: 717.0249

## AIC: 727.0249

>xulosa (yangilanish (m, metod = "probit", Hess = TRUE), raqamlar = 3)

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + public + gpa, data = dat, Hess = TRUE,

## method = "probit")

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 0.5981 0.158 3.7888

## public 0.0102 0.173 0.0588

## gpa 0.3582 0.157 2.2848

##

## Interceptlar:

## Value Std. Xato t qiymati

## dargumon | biroz ehtimol 1.297 0.468 2.774 ##

biroz ehtimol | juda ehtimol 2.503 0.477 5.252

##

## Qoldiq og'ish: 717.4951

## AIC: 727.4951

>xulosa (yangilanish (m, metod = "logistika", Hess = TRUE), raqamlar = 3)

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + public + gpa, data = dat, Hess = TRUE,

## method = "logistic")

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 1.0477 0.266 3.942

## public -0.0588 0.298 -0.197

## gpa 0.6159 0.261 2.363

##

## Interceptlar:

## Value Std. Xato t qiymati

## dargumon | biroz ehtimol 2.204 0.780 2.827

## biroz ehtimol | ehtimol 4.299 0.804 5.345

##

## Qoldiq og'ish: 717.0249

## AIC: 727.0249

>xulosa (yangilanish (m, usul = "tiqilib qolish", Hess = TRUE), raqamlar = 3)

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + public + gpa, data = dat, Hess = TRUE,

## method = "cloglog")

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 0.517 0.161 3.202

## public 0.108 0.168 0.643

## gpa 0.334 0.154 2.168

##

## Interceptions:

## Value Std. Xato t qiymati

## dargumon | biroz ehtimol 0.871 0.455 1.912

## biroz ehtimol | juda ehtimol 1.974 0.461 4.287

##

## Qoldiq og'ish: 719.4982

## AIC: 729.4982

Bu erda o'zaro ta'sir shartlarini qo'shamiz.

>bosh (bashorat qilish (m, dat, type = "p"))

## dargumon Ehtimoli juda ehtimol

## 1 0.5488310 0.3593310 0.09183798

## 2-0.3055632 0.4759496 0.21848725

## 3-0.2293835 0.4781951 0.29242138

## 4-0.6161224 0.3126888 0.07118879

##, 5 0.6560149 0.2833901 0.06059505

## 6-0.6609240 0.2797117 0.05936430

## Bir martalik qo'shimchalar

##

## Model:

## amal qiladi

pared + public + gpa

## Df AIC LRT Pr (Chi)

## 727.02

## pared: public 1 727.81 1.21714 0.2699

## pared: gpa 1 728.98 0.04745 0.8276

## public: gpa 1 728.60 0.42953 0.5122

## Boshlash: AIC = 727.02

## amal qiladi

pared + public + gpa

##

## Df AIC

## - public 1 725.06

## 727.02

## + pared: public 1 727.81

## + public: gpa 1 728.60

## + pared: gpa 1 728.98

## - gpa 1 730.67

## - yig'ilgan 1 740.60

##

## Qadam: AIC = 725.06

## amal qiladi

pared + gpa

##

## Df AIC

## 725.06

## + pared: gpa 1 727.02

## + public 1 727.02

## - gpa 1 728.79

## - paragraf 1 738.60

## Qo'ng'iroq:

## polr (formula = amal qilish

pared + gpa, data = dat, Hess = TRUE)

##

## Koeffitsientlar:

## Value Std. Xato t qiymati

## pared 1.0457 0.2656 3.937

## gpa 0.6042 0.2539 2.379

##

## Interceptlar:

## Value Std. Xato t qiymati

## dargumon | biroz ehtimol 2.1763 0.7671 2.8370

## biroz ehtimol | ehtimol 4.2716 0.7922 5.3924

##

## Qoldiq og'ish: 717.0638

## AIC: 725.0638

## bosqichma -bosqich model yo'li

## og'ish jadvalining tahlili

##

## boshlang'ich model:

## amal qiladi

pared + public + gpa

##

## Yakuniy model:

## amal qiladi

pared + gpa

##

##

## Step Df Deviance Resid. Df Resid. Dev AIC

## 1 395 717.0249 727.0249

## 2 - ommaviy 1 0.03891634 396 717.0638 725.0638

## Tartibli regressiya modellarining ehtimollik nisbati testlari

##

## Javob: qo'llash

## Model Resid. df Resid. Dev test Df LR stat.

## 1 pared + gpa 396 717.0638

## 2 pared + public + gpa 395 717.0249 1 vs 2 1 0.03891634

## Pr (Chi)

## 1

## 2 0.8436145

Ushbu modelni chizish vaqti keldi.

>m3
>pr
>konfint (pr)

## 2,5 % 97,5 %

## pared 0.5281772 1.5721695

## public -0.6522008 0.5191415

## gpa 0.1076189 1.1309092

Oxirgi eslatmalar

I enjoyed writing this article. I’d suggest you to pay attention to interpretation aspect of the model. Coding is relatively easy, but unless you know what’s resulting, you learning will be incomplete.

There are many essential factors such as AIC, Residuals values to determine the effectiveness of the model. If you still struggle to understand them, I’d suggest you to brush your Basics of Logistic Regression. This should help you in understanding this concept better.

In this article, I shared my understanding of using multinomial and ordinal regression in R. These techniques are used when the dependent variable has levels either ordered or unordered.

Did you find this article helpful ? Have you used this technique to build any models ? Do share your experience and suggestions in the comments section below.

About the Author

Sray Agarwal is the chief manager of Bennett Coleman and Co. Ltd. (Times Group) and works as Subject Matter Expert (SME) for Business Analytics program. He has more than 8.5 years of experience in data science and BA.

He holds a degree in Business Analytics from Indian School of Business (ISB), Hyderabad. and graduated with an award of Academic Excellence and has been the part of the Dean’s List. Along with this he is a SAS certified Predictive Modeller.