R-bloggerlar

Yuzlab R bloggerlari qo'shgan R yangiliklari va darsliklar

Logistik regressiya yordamida xavf farqini (va ishonch oralig'ini) baholash

Keyt Goldfeld tomonidan 2021 yil 14 -iyunda R bloggerlari tomonidan yozilgan | 0 ta sharh

Farq nisbati (OR) - logistika regresyon taxmin ta'siri kattaligi parametr - talqin qilish juda mushkul bo'ladi. Bu o'z -o'zidan ehtimollik nisbati bo'lgan ikkita miqdorning nisbati (har xil sharoitlarda). O'ylaymanki, juda katta yoki kichik OR kuchli davolash effektini bildiradi, lekin bu ta'sirni klinik kontekstga tarjima qilish qiyin bo'lishi mumkin, ayniqsa, ORni yagona ehtimolliklar bilan bog'lab bo'lmaydi.

Ta'sirning alternativ o'lchovlaridan biri bu xavflar farqi , bu, albatta, ancha intuitivdir. Parametrik bo'lmagan o'lchovda farqni hisoblash juda oson bo'lsa-da (siz har bir qo'l uchun nisbatni hisoblaysiz va farqni qabul qilasiz), lekin sozlashni talab qiladigan kovaryatlar bo'lsa, narsalar biroz aniqroq bo'ladi. (Richardson, Robins va Vang tomonidan ishlab chiqilgan usul bor, bu tahlilchilarga xavf farqini modellashtirishga imkon beradi, lekin men bu erga kirmayman.)

Hozirda men tibbiy muassasalarda xodimlar va uzoq vaqt yashovchilar uchun COVID-19 ga qarshi emlash darajasini oshirishga qaratilgan aralashuvni baholaydigan tadqiqot ustida ishlayapman. Hamkasbimiz bizga intuitiv choralar foydasiga bahslashib, ehtimollik nisbati emas, balki emlash stavkalari farqi haqida xabar berishni taklif qildi. Mening nuqtai nazarimga ko'ra, OR o'rniga xavf farqini ishlatishning yagona mumkin bo'lgan salbiy tomoni shundaki, xavf farqi bahosi cheklangan , ehtimollik nisbati shartli. (Men bu farq haqida ilgari ham yozganman.) Marginal xavflar farqi tadqiqot natijalariga ta'sir ko'rsatadigan bemorning xususiyatlarini taqsimlash funktsiyasidir, shuning uchun hisobot boshqa guruhlar uchun umumlashtirilmasligi mumkin. Boshqa tomondan, koeffitsientlar kovaryatlarga bog'liq emas. Bizning tadqiqot guruhimizdagi yakuniy konsensus shundaki, aloqani takomillashtirishning afzalliklari umumiylikning yo'qolishi ehtimolidan yuqori.

Bu erda mening maqsadim Kleinman va Norton va Piter Ostin tomonidan yozilgan ushbu maqolalarda tavsiflangan chegaraviy xavf farqini baholashning nisbatan soddaligini ko'rsatishdir. Men bunga turtki bo'lgan tadqiqotning haqiqiy ma'lumotlaridan foydalanmayman, lekin marjinal va shartli baholar o'rtasidagi qarama -qarshilikni ko'rsatish uchun simulyatsiya qilingan ma'lumotlarni ishlab chiqaraman.

Qiziqish parametrlarini tezda aniqlash

Bunga turtki bo'lgan tadqiqotda bizda ikkita o'qitish qurollari bor edi - bu keng qamrovli emlash va emlashni targ'ib qilishni o'z ichiga olgan aralashuv qo'li, ikkinchisida esa hech narsa qilinmagan. Shunday qilib, bizni qiziqtirgan ikkita ehtimol bor: \ (p_1 \ equiv P (\ text | \ matn ) \) va \ (p_0 \ equiv P (\ matn | \ matn ). \)

Ikkala guruhni solishtirganda xavf farqi oddiy

\ [\ matn = p_1 - p_0, \] har bir davolash guruhi uchun koeffitsient \ (w_a \)

\ [w_a = \ frac , \ \ a \ in \ , \] va aralashuv qo'lini boshqaruv qo'li bilan taqqoslaydigan koeffitsientlar nisbati

Logistik regressiya modeli jurnaldagi farqlarni aralashuv holatining chiziqli funktsiyasi va tuzatilayotgan boshqa har qanday kovaryatlar sifatida modellashtiradi. Quyidagi misollarda -0,5 dan 0,5 gacha bo'lgan bitta doimiy kovaryant \ (x \) mavjud:

\ [\ matn (w_A) = \ alpha + \ beta A + \ gamma X. \] \ (\ beta \) \ (X \) ning ma'lum bir qiymatiga bog'liq bo'lgan jurnalni (OR) ifodalaydi:

\ [\ matn (w_1) = \ alfa + \ beta + \ gamma X \\ \ matn (w_0) = \ alfa + \ gamma X, \] va

Eng muhimi, biz ehtimollik va ehtimollik o'rtasida osonlikcha harakat qila olamiz:

Chegaraviy ehtimollikni model smetalar yordamida baholash

Modelni o'rnatgandan so'ng, bizda \ (\ hat \), \ (\ hat \) va \ (\ hat \) taxminlari mavjud. Biz har bir kishi uchun bir juftlik koeffitsientini yaratishimiz mumkin \ (i \) (\ (w_ \) va \ (w_ \)) ularning kuzatilgan \ (x_i \) va taxminiy parametrlari yordamida. Biz qilishimiz kerak bo'lgan narsa \ (a = 1 \) va \ (a = 0 \) ni bashorat qilingan \ (\ hat _ \) va \ (\ shapka _ \), mos ravishda, har bir shaxs uchun. E'tibor bering, biz bemorni tasodifan tasodifiy davolashning haqiqiy qo'liga e'tibor bermaymiz:

Nihoyat, xavfning chegaraviy farqi \ (\ widthhat >\) sifatida baholanishi mumkin

haqiqiy davolanish tayinlanishidan qat'i nazar, barcha \ (n \) tadqiqot ishtirokchilaridan.

Yaxshiyamki, Rda biz bu hisob -kitoblarning hech birini bajarishga hojat yo'q, chunki ehtimollik shkalasi bo'yicha bashoratlarni modelga mos kelishidan olish mumkin. Ushbu xavf farqining standart xatolarini bootstrap usullari yordamida baholash mumkin.

Simulyatsiya qilingan ma'lumotlar to'plami

Simulyatsiyaga kirishdan oldin, bu erda ko'rsatilgan kodni ishlatish uchun kerak bo'lgan paketlar:

Men \ (y \) ikkilik natijasini yarataman, bu doimiy o'zgaruvchan \ (x \) funktsiyasi -0,5 dan 0,5 gacha. Men \ (x1 \) ga aylanadigan \ (x1 \) ni yaratish uchun beta tarqatishni ishlataman . Ushbu taqsimotning afzalligi - biz shaklni aniqlashda egiluvchanligimizdir. Natijani yaratish uchun ishlatiladigan OR 2.5:

Birinchi kuzatish 500 stsenariyda \ (x \) taqsimoti o'ngga buriladi. Bu \ (x1 \) o'rtacha qiymatini 0 ga yaqin o'rnatish orqali o'rnatiladi:

Xavflar farqini baholashning birinchi bosqichi logistik regressiya modeliga mos keladi:

Keyinchalik, har bir davolanish shartiga mos keladigan modelga asoslanib, har bir kishi uchun ehtimolni taxmin qilishimiz kerak. Bu bizga \ (\ shapka) beradi

_ \) va \ (\ shapka

_ \):

Oddiy hisob -kitob bizga xavf farqi uchun balli taxminni beradi (va shuni yodda tutingki, taxmin qilingan OR 2,5 ga yaqin, bu ma'lumotni ishlab chiqarish uchun ishlatiladi):

Biz xavf farqi uchun 95% ishonch oralig'ini baholash uchun bootstrap usulidan foydalanishimiz mumkin. Bu har bir davolash guruhdan kimligini masal o'z ichiga oladi bilan , o'rniga yangi logistika regresyon modelini uydirma, ehtimollar taxmin, va bir xavf farqni hisoblash. Bu 999 marta takrorlanib, xavf farqlari taqsimotini oladi, shundan biz taxmin qilingan ishonch oralig'ini olamiz:

Tarqatishning o'zgarishi xavf farqini o'zgartiradi

\ (X \) taqsimotining o'zgarishi koeffitsientlar nisbatini o'zgartirmasdan, chegaraviy xavf farqiga qanday ta'sir qilishini ko'rsatish uchun, men \ (x1 \) ning o'rtacha qiymatini 1 ga yaqinroq ko'rsatishim kerak. noto'g'ri taqsimot, bu xavf farqini oshiradi:

Ko'rinib turibdiki, xavf farqi ortib bormoqda, lekin OR haqiqiy qiymatiga 2,5 ga yaqin ko'rinadi:

Va to'liqlik uchun bu erda taxmin qilingan ishonch oralig'i:

Yana mustahkam taqqoslash

Bu xususiyatni faqat ikkita ma'lumot to'plami yordamida baholash adolatli emas. Shubhasiz, taxmin qilingan xavf farqlari tasodifan mos kelmasligi mumkin. Hisoblangan xavf farqlari taqsimotini yaratish uchun turli xil tarqatish taxminlari asosida yaratilgan ko'plab ma'lumotlar to'plamini takrorlashni osonlashtiradigan ba'zi funktsiyalarni yozdim (quyida qo'shimchada keltirilgan). Men 500 ta kuzatuvlardan iborat 5000 ta ma'lumotlar to'plamini yaratdim, ularning har biri yuqorida ko'rsatilgan ma'lumotlarni ishlab chiqarish jarayonida ishlatilgan mu_x to'rt xil farazlari ostida: .

Ko'rinib turibdiki, \ (x \) taqsimotining o'ngdan burilishdan chapga siljishi bilan xavf farqi oshadi:

Bundan tashqari, har xil darajadagi \ (x \) mos keladigan taqsimotning o'zgarishi OR ga hech qanday ta'sir ko'rsatmasligi aniq:

Ostin, Piter S. "Xavflarning mutlaq kamayishi, nisbiy xavflar, xavflarning nisbiy kamayishi va davolash uchun zarur bo'lgan sonlarni logistik regressiya modelidan olish mumkin." Klinik epidemiologiya jurnali 63, no. 1 (2010): 2-6.

Kleinman, Lourens C. va Edvard C. Norton. “Xavf nima? "Logistika regressiyasi, shu jumladan chiziqli bo'lmagan modellarning xavf -xatarlarining to'g'rilangan choralarini baholashning oddiy usuli." Sog'liqni saqlash xizmatlari tadqiqotlari 44, yo'q. 1 (2009): 288-302.

Richardson, Tomas S., Jeyms M. Robins va Linbo Vang. "Nisbiy xavf va xavf farqini modellashtirish va baholash to'g'risida." Amerika statistika assotsiatsiyasi jurnali 112, no. 519 (2017): 1121-1130.