Model>Smeta>Multinomial logistik regressiya (MNL)

Multinomial logistik regressiyani (MNL) baholash uchun biz ikki yoki undan ortiq darajali va bir yoki bir nechta tushuntiruvchi o'zgaruvchiga ega bo'lgan toifali javob o'zgaruvchisini talab qilamiz. Taqqoslash uchun asos sifatida ishlatiladigan javob o'zgaruvchining darajasini ham ko'rsatishimiz kerak . Misol ma'lumotlar fayli, ketchup, biz tanlang darajasi Pastga ochiluvchi menyudan tanlab bazasi darajasi heinz28 tayinlash mumkin Xulosa tab.

Ketchup ma'lumotlar bazasiga kirish uchun Ma'lumotlar>Boshqarish -ga o'ting, " Ma'lumotlarni yuklash" turkumidagi misollarni tanlang va Yuklash tugmasini bosing. Keyin ketchup ma'lumotlar bazasini tanlang.

In Xulosa ikki yoki undan ko'p o'zgaruvchilar bilan birga test pastida o'zgaruvchilar, ularni tanlash bilan modeli amal yaxshilash bo'lsa tab biz sinash mumkin. Bu funksiya uch yoki undan ko'p darajali o'zgaruvchan turdagi omillarning umumiy ta'sirini baholash uchun juda foydali bo'lishi mumkin.

Qayta baholashni talab qiladigan qo'shimcha chiqish:

  • Standartlashtirish: tushuntirish o'zgaruvchilari har xil o'lchovlarda o'lchanadigan bo'lsa, nisbiy xavf nisbatlarini (RRR) solishtirish qiyin bo'ladi. Hisoblashdan oldin tushuntirish o'zgaruvchilarini standartlashtirish orqali biz qaysi o'zgaruvchilar ko'proq igna bilan harakatlanishini ko'rishimiz mumkin. Radiant barcha tushunarli o'zgaruvchilar \ (X \) ni \ ((X - o'rtacha (X))/(2 \ marta sd (X)) \) almashtirish orqali ko'p yadroli logistik regressiya ma'lumotlarini standartlashtiradi. Munozara uchun Gelman 2008 ga qarang.
  • Markaz: X ning barcha tushuntirish o'zgaruvchilarini X - o'rtacha (X) ga almashtiring. Bu o'zaro ta'sir effektlarini talqin qilishda foydali bo'lishi mumkin
  • Bosqichma-bosqich: eng mos modelni tanlash uchun ma'lumotlarni qidirish usuli. Ehtiyotkorlik bilan foydalaning!

Qayta baholashni talab qilmaydigan qo'shimcha chiqish:

  • Ishonch intervallari: ishonchlilik koeffitsienti
  • RRRs: Ishonchli intervalli nisbiy xavf nisbati
  • Chalkashlik: chalkashlik matritsasi (1) ma'lumotlarda kuzatilgan haqiqiy sinflar va (2) model tomonidan taxmin qilingan sinflar o'rtasidagi muvofiqlikni (etishmasligini) ko'rsatadi.

Misol: ketchupni tanlash

Misol tariqasida, Missuri shtati, AQSh shtatining Springfild shahridagi uy xo'jaliklari guruhidagi 300 kishining tanlov xulq -atvori to'g'risidagi ma'lumotlar to'plamidan foydalanamiz. Ma'lumotlar taxminan 2 yil mobaynida 2,798 marta sotib olingan holatlar to'g'risidagi ma'lumotlarni o'z ichiga oladi va quyidagi o'zgaruvchilarni o'z ichiga oladi:

  • id: individual identifikator
  • tanlov: heinz41, heinz32, heinz28, hunts32
  • price.x: mahsulot narxi x
  • disp.x: x mahsuloti uchun displey bormi (ha yoki yo'q)?
  • feat.x: x mahsulotiga gazetada reklama bormi (ha yoki yo'q)?

Quyida ko'rsatilgan Ma'lumotlar>Pivot yorlig'ining skrinshoti shuni ko'rsatadiki, heinz32 eng mashhur variant bo'lib, undan keyin heinz28. heinz41 va hunts32 uy xo'jaliklari a'zolari orasida juda kam uchraydigan tanlovdir.

Aytaylik, biz ketchup brendini va paket hajmini tanlashda turli xil mahsulotlarning narxi qanday ta'sir qilishini o'rganmoqchimiz. Yilda chiqarilgan>Ko'p logistika tushish (MNL)>Xulosa dan tab tanlang javob o'zgaruvchilar sifatida tanlash va heinz28 tanlang bazasi darajasidaochiladigan menyu. Tushuntiruvchi o'zgaruvchilar sifatida price.heinz28 orqali price.hunts32 ni tanlang. Quyidagi skrinshotda biz koeffitsientlarning ko'pi emas, balki juda kichik qiymatlarga ega ekanligini va modelning taxminiy kuchga ega ekanligini ko'ramiz (ch-kvadrat statistikasi uchun p. Chiqishning eng chap ustuni koeffitsient qaysi mahsulotga tegishli ekanligini ko'rsatadi. Masalan, koeffitsientlar va statistikaning 2 -qatori price.heinz28 o'zgarishining asosiy mahsulotga (ya'ni, heinz28) nisbatan heinz32 ni tanlashga ta'sirini aks ettiradi. Agar iste'molchilar heinz28 va heinz32 ni o'rnini bosuvchi sifatida ko'rsalar, ehtimol, biz narxning oshishi, heinz28 emas, balki heinz32 ni tanlash imkoniyatining oshishiga olib keladi.

Afsuski, multinomial logistik regressiya modelining koeffitsientlarini to'g'ridan -to'g'ri talqin qilish qiyin. Biroq, RRR ustuni bilan ishlash osonroq bo'lgan nisbiy-xavf-nisbatlar (yoki koeffitsientlar) bahosini beradi. RRR qiymatlari regressdan eksponentlangan koeffitsientlardir (ya'ni $ exp (1.099) = 3.000). Ko'ryapmizki, heinz28 o'rniga heinz32 sotib olish xavfi (yoki koeffitsienti) $ 1 narxining ko'tarilishidan keyin 3 barobar ko'p.

Tushuntiruvchi o'zgaruvchilarning har biri uchun quyidagi null va muqobil gipotezalarni shakllantirish mumkin:

  • H0: tushuntiruvchi o'zgaruvchi x bilan bog'liq bo'lgan nisbiy xavf darajasi 1 ga teng
  • Ha: tushuntiruvchi x o'zgaruvchi bilan bog'liq bo'lgan nisbiy xavf darajasi 1 ga teng emas

Multinomial logistika regressiyasidan tanlangan nisbiy xavf nisbati quyidagicha talqin qilinishi mumkin:

  • Nisbatan koeffitsientda yoki heinz28 emas, balki heinz32 ni sotib olishda 1 dollar narxining oshishi uchun RRR - 0,101. Agar heinz32 narxi 1 dollarga oshgan bo'lsa, heinz28 o'rniga heinz32 sotib olish ehtimoli 0,101 ga kamayadi yoki 89,9%ga kamayadi, shu bilan birga boshqa barcha o'zgaruvchilar o'zgarmas bo'ladi.
  • Nisbatan koeffitsiyent yoki heinz28 emas, balki hunts32 ni sotib olishda. Agar heinz28 narxi 1 dollarga oshgan bo'lsa, heinz28 o'rniga hunts32 sotib olish ehtimoli 3,602 barobarga oshadi yoki 260,2%ga oshadi, shu bilan birga modeldagi boshqa o'zgaruvchilar o'zgarmaydi.
  • Nisbatan koeffitsiyent yoki heinz28 o'rniga hunts32 ni sotib olishda 1 dollarlik narxning oshishi uchun RRR - 0,070. Agar hunts32 uchun narx 1 dollarga oshgan bo'lsa, heinz28 o'rniga hunts32 sotib olish ehtimoli 0,070 ga kamayadi yoki 93%ga kamayadi, shu bilan birga modelning barcha o'zgaruvchilari o'zgarmaydi.

Modelda taxmin qilingan boshqa RRRlar ham xuddi shunday talqin qilinishi mumkin.

Xulosa ko'rinishida berilgan raqamli chiqishdan tashqari, biz to'rtta mahsulotning har birining tanlovi va narxlari o'rtasidagi bog'liqlikni vizual ravishda baholashimiz mumkin (" Uchastka" bo'limiga qarang ). Quyidagi skrinshotda biz ishonch intervallari bilan koeffitsient (aniqrog'i RRR) chizig'ini ko'ramiz. Biz quyidagi naqshlarni ko'ramiz:

  • Price.heinz28 1 dollarga oshganda, heinz32, heinz41 va hunts32 uchun nisbiy sotib olish koeffitsienti sezilarli darajada oshadi.
  • Price.heinz32 oshganda, heinz32 bilan solishtirganda heinz32 uchun sotib olish ehtimoli sezilarli darajada kamayadi. Biz heinz41 va hunts32 uchun xuddi shunday naqshni narxlari oshganda ko'ramiz
  • hunts32 - narxning ko'tarilishidan heinz28 ga nisbatan sotib olish koeffitsientining sezilarli yaxshilanishini ko'rgan yagona mahsulot. heinz32

Ehtimollar, ko'p bosqichli logistika regressiya modelining koeffitsientlari yoki RRRlariga qaraganda, talqin qilish uchun qulayroqdir. Tanlangan tushuntiruvchi o'zgaruvchilar uchun maxsus qiymatlar berilgan har xil javob o'zgaruvchilar darajalari uchun ehtimollarni bashorat qilish uchun " Bashorat qilish" yorlig'idan foydalanishimiz mumkin . Birinchidan, "Tahmin kiritish turi" ochiladigan menyusidan foydalanib, bashorat qilish uchun kirish turini tanlang. Bashorat qilish uchun mavjud ma'lumotlar to'plamini tanlang ("Ma'lumotlar") yoki bashorat ma'lumotlarini yaratish uchun buyruqni ("Buyruq") ko'rsating. Agar siz buyruq kiritishni tanlasangiz, Prediction buyrug'idakamida bitta o'zgaruvchini va bitta qiymatni ko'rsatishingiz kerakbashorat qilish uchun quti. Agar siz modeldagi har bir o'zgaruvchiga qiymat ko'rsatmasangiz, o'rtacha qiymat yoki eng tez -tez kuzatiladigan darajadan foydalaniladi. Modeldagi o'zgaruvchilarga asoslanib, ehtimollarni taxmin qilish mumkin. Masalan, $ 3.80 narxida heinz32 sotib olishni tanlash ehtimolini taxmin qilish uchun price.heinz32 tanlangan tushuntirish o'zgaruvchilardan biri bo'lishi kerak.

  • Do'konlarda hunts32 displeyi mavjud bo'lganda, to'rtta mahsulotni tanlash ehtimolini taxmin qilish uchun disp.hunts32 = "ha" buyrug'i va Enter tugmasini bosing.
  • Heinz41 displeyda bo'lmaganida (va emas) disp.heinz41 = c ("ha", "yo'q"), feat.heinz41 = c ("ha", "yo'q") bo'lsa, tanlov ehtimolini taxmin qilish uchun Enter tugmasini bosing.
  • Price.heinz28 har bir mahsulot uchun tanlov ehtimollari qanday o'zgarishini ko'rish uchun price.heinz28 = seq (3.40, 5.20, 0.1) turini oshiradi va enter tugmasini bosing. Quyidagi skrinshotni ko'ring.

Yuqoridagi rasm shuni ko'rsatadiki, heinz28 uchun narx.heinz28 sotib olish ehtimoli keskin kamayadi. heinz32, ma'lumotlarning eng mashhur varianti, narxning oshishi ortidan sotib olish ehtimoli katta o'sishi kutilmoqda. heinz28. Hunts32 uchun prognoz qilingan sotib olish ehtimoli heinz32 ga nisbatan ta'sirchan ko'rinmasa ham, nisbiy bashorat qilingan o'sish katta (ya'ni, ovchilar uchun 3,2% dan 8,4% gacha, heinz32 uchun 39,3% dan 72,8% gacha).

Sotib olish to'g'risida ehtimollar to'rt mahsulotlar har biri uchun narx o'zgarishlar ta'sirini yanada keng qamrovli baholash uchun biz Lug'at Kirish turi ochiladi dan Data tanlab tushuncha to'liq jadval mumkin Predict yorlig'ini va ma'lumotlar DropDown Predict dan ketchup tanlash. Bundan tashqari, Ma'lumotlar>O'zgartirish katakchasini yoki elektron jadvalni kiritish uchun ma'lumotlar to'plamini yaratishingiz va keyin Ma'lumotlar>Boshqarish yorlig'i yordamida Radiant -ga joylashtirishingiz mumkin .

Kerakli bashoratlar tuzilgandan so'ng, ularni bashorat qilish jadvalining o'ng yuqori qismidagi yuklash belgisini bosish orqali CSV faylga saqlash mumkin. Hisoblash uchun ishlatiladigan ma'lumotlar to'plamiga bashorat kiritish uchun "Do'kon" tugmasini bosing.

E'tibor bering, MNL modellari tasodifiy javob o'zgaruvchilarining darajalari (ehtimol, ketchup ma'lumotlarida to'rtta) boricha ko'p ehtimolliklar ustunini hosil qiladi. Agar siz taxmin qilish uchun ishlatiladigan ma'lumotlar bazasiga faqat birinchi darajali (ya'ni, heinz28) bashoratlarni qo'shmoqchi bo'lsangiz, Store prognozlar kiritishida faqat bitta nomni kiriting. Agar siz ketchup mahsulotlari uchun bashoratlarni saqlamoqchi bo'lsangiz, vergul bilan ajratilgan to'rtta o'zgaruvchining nomini kiriting.

Eslatma: Biz yuqoridagi muhokamada endogenlik xavotirlarini inobatga olmadik. Misol uchun, heinz28 sifatining o'zgarishi tufayli price.heinz28 o'zgaradi. Sifatning o'zgarishi narxga va, ehtimol, talabga ta'sir qiladi. Agar biz bu sifat o'zgarishlarini nazorat qilmasak, narx o'zgarishlarining taxminiy ta'siri noto'g'ri bo'lishi mumkin (ya'ni, bir tomonlama).

Hisobot>RMD

Hisobot>Rmd- ga kod qo'shish uchun tahlilni ekranning pastki chap burchagidagi belgini bosish yoki klaviaturadagi ALT-Enter tugmachasini bosib (qayta) o'tkazish mumkin.

Agar syujet tuzilgan bo'lsa, uni ggplot2 buyruqlari yordamida yoki gridExtra yordamida sozlash mumkin. Tafsilotlar uchun quyidagi misol va Ma'lumotlar>Vizualizatsiya bo'limiga qarang .

R funktsiyalari

Ko'p sonli logistika regressiya modelini baholash uchun Radiant tomonidan qo'llaniladigan tegishli R-funktsiyalari haqida umumiy ma'lumot olish uchun qarang: Model>Multinomial logistik regressiya .

Mnl vositasida ishlatiladigan asosiy funktsiyalar - bu nnet paketidan multinom va mashina paketidan lineer gipoteza.