Mustaqil o'zgarmaydigan sifatida faoliyatda vaqt

I want to include time spent doing something (weeks breastfeeding, for example) as an independent variable in a linear model. However, some observations do not engage in the behavior at all. Coding them as 0 isn't really right, because 0 is qualitatively different from any value >0 (i.e. women who don't breastfeed may be very different from women who do, even those who don't do it for very long). The best I can come up with is a set of dummies that categorizes the time spent, but this is a waste of precious information. Something like zero-inflated Poisson also seems like a possibility, but I can't exactly figure out what that would look like in this context. Does anyone have any suggestions?

11

6 javoblar

@ Ken-butlerning javobiga bir oz kengaytirish. Har doim o'zgaruvchan (soat) va alohida qiymat uchun indikator o'zgaruvchisini qo'shsangiz (soat = 0 yoki emizilmasdan), siz "maxsus bo'lmagan" qiymat uchun lineer ta'sir va " maxsus qiymat bo'yicha prognozli natijalar. Bu (men uchun hech bo'lmaganda) grafigiga qarashga yordam beradi. Quyidagi misolda biz soatlik ish haqi sifatida haftada soatlab ishlaydigan respondentlar (barcha ayollar) ishlaymiz va biz haftada 40 soat "standart" bo'yicha alohida narsa mavjud deb hisoblaymiz:

enter image description here

The code that produced this graph (in Stata) can be found here: http://www.stata.com/statalist/archive/2013-03/msg00088.html

Shunday qilib, biz boshqa qiymatlardan farqli ravishda muomalada bo'lishni xohlagan bo'lsak-da, bu holda biz doimiy o'zgaruvchiga 40 qiymatni tayinladik. Shunga o'xshab, agar siz boshqa qiymatlardan sifat jihatidan farq qiladigan bo'lsa-da, haftalaringizni emizishingiz mumkin. Men sizning fikringizni sharhlayman, bu sizning muammoingiz deb o'ylaydi. Bu hol emas va siz shovqin muddatini qo'shishingiz shart emas. Darhaqiqat, agar siz sinab ko'rsangiz, shovqin muddati mukammal rang-barangligi tufayli tushib ketadi. Bu cheklov emas, faqat shovqin shartlari yangi ma'lumotni kiritmasligini aytadi.

Regressiya tenglamasi shunga o'xshash deb ayting:

$ \ hat {y} = \ beta_1 hafta \ _bakimiylik + \ beta_2 non \ _bereasting + \ cdots $

Qaerda $ week \ _breastfeeding $ - emizishni haftalar soni (emizish bo'lmaganlar uchun 0 qiymat) va $ non_redastfeeding $ - bu indeks o'zgaruvchisi, ya'ni 1 kishi emizmaganida va aks holda 0 holda.

Kimdir emizikli bo'lganida, nima sodir bo'lishini ko'rib chiqing. Regression denklemi quyidagilarni soddalashtiradi:

$ \ hat {y} = \ beta_1 hafta \ _bakimiylik + \ beta_2 0 + \ cdots \\ = \ beta_1 hafta \ _berefeeding + \ cdots $

Shunday qilib, $ \ beta_1 $ bu emizishni amalga oshiradiganlar uchun emizishni haftalar sonining faqatgina lineer ta'siridir.

Kimdir emizikli emizishni boshlamaganda, nima qilish kerakligini o'ylab ko'ring:

$ \ hat {y} = \ beta_1 0 + \ beta_2 1 + \ cdots \\ = \ beta_2 + \ cdots $

Shunday qilib, $ \ beta_2 $ Sizga emizishni emas, balki emizishni haftalar soni tenglamadan ta'sir ko'rsatadi.

Interfaollik muddatini qo'shish uchun hech qanday foydalanish yo'qligini ko'rishingiz mumkin, chunki bu interaktiv muddat allaqachon (aniq aytilmagan).

Biroq $ \ beta_2 $ ga nisbatan g'alati narsa bor, lekin emizishni ta'sirini o'lchab, ko'krak suti bilan emizmaganlarni kutish natijalarini taqqoslash bilan solishtirganda, faqatgina 0 hafta. "o'xshashlik bilan o'xshashlik" tarzida, ammo amalda foyda darhol aniq emas. "Ko'krak suti bilan to'yintirilmaganlarni" 12 haftadan (taxminan 3 oy) emizgan ayollar bilan taqqoslash mantiqan to'g'ri keladi. Bunday holatda siz "emizuvchilarni" $ 12 hafta davomida $ 12 qiymatiga baholang. Demak, "emizuvchilar uchun" haftasiga $ emizish $ ga ajratilgan qiymat $ \ beta_2 $ regressiya koeffitsiyasiga ta'sir qiladi, bu esa "ko'krak suti bilan oziqlanadigan nonlarni kimga solishtirish" bilan belgilanadi. Muammo o'rniga, bu juda foydali bo'lishi mumkin bo'lgan narsa.

14
qo'shib qo'ydi
Juda yoqimli javob Maarten. .
qo'shib qo'ydi muallif Ken Hiatt, manba
@DLDahly Men bu shubhalar bilan shug'ullanish uchun javobimni tahrir qildim
qo'shib qo'ydi muallif Maarten Buis, manba
@DLDahly Bu to'g'ri bo'lsa, siz "emizmagan emizuvchilar uchun" vaqtni o'zgartirsangiz, "B1" bahosi o'zgarmaydi. Aslida, B2 "ko'krak suti bilan oziqlantiruvchi" uchun vaqt qiymatini o'zgartirganda o'zgaradigan faqat parametri, qolganlari esa o'zgarishsiz qoladi.
qo'shib qo'ydi muallif Maarten Buis, manba
Men avvalgi sharhlarimga javob berdim. Shunday qilib, biror narsa aniq emas edi, ammo bu savolga noma'lum bo'lgan narsani bilmasdan, men qila olmayman.
qo'shib qo'ydi muallif Maarten Buis, manba
Javobni (va boshqalarni) minnatdorman, lekin buni qabul qilishda qiyin vaqt bo'laman. Men 1: 0 va doimiy uzgaruvchining o'zginasini qo'shsam, men ko'krak suti bilan oziqlanadigan mahsulotlarga vaqt uchun qiymat berishga majbur bo'laman (yoki yo'qolgan ko-variatsiyaga tushadi). Hatto 1: 0 o'zgaruvchiga bog'liq bo'lsa ham, men vaqtni = 0 sifatida registratsiya koeffitsientiga ta'sir qilmasligi uchun ko'krak suti bilan oziqlantiruvchi moddalarni qo'shishni ko'rmayapman. Ehtimol, ikkalasi o'rtasida mahsulotning o'zaro munosabat muddatini ham qo'shish mantiqiyroq bo'larmidi?
qo'shib qo'ydi muallif D L Dahly, manba
OK, bu juda foydali. Agar men sizni to'g'ri tushuna olsam, B1 uchun baholangan qiymat B2 = 1 kishiga qaysi vaqt qiymatiga ega bo'lishidan qat'iy nazar bir xil bo'lishi kerak. Bu to'g'rimi?
qo'shib qo'ydi muallif D L Dahly, manba
OK, men o'zimni tekshirishim mumkin bo'lgan narsa ekanligiga ishonch hosil qildim. Ko'p rahmat.
qo'shib qo'ydi muallif D L Dahly, manba
@MaartenBuis Agar emizuvchilar uchun 12 hafta belgilanmagan bo'lsa, bu $ \ beta_1 $ (uzluksiz qism) uchun parametr bahosiga ta'sir qilmaydi?
qo'shib qo'ydi muallif Teun Zijp, manba

Oddiy bir narsa: har qanday/yo'q va haqiqiy qiymat uchun 1/0 ko'rsatkichi bilan o'zgarmaydiganni ifodalaydi. Ham regressionga qo'ying.

6
qo'shib qo'ydi

Har qanday vaqt uchun sarflangan (= 1) va vaqtga sarflanmagan (= 0) ikkilik indikatorni qo'yib, doimo o'zgaruvchan vaqt sarflayotgan bo'lsangiz, "0" ning turli xil effekti " 0-1 belgisi bilan "oldi"

4
qo'shib qo'ydi

Siz aralash va effektli modellarni 0 va vektor nolga teng vaqtga asoslangan guruhlash bilan qo'llashingiz va mustaqil o'zgaruvchanlikni saqlab qolishingiz mumkin

2
qo'shib qo'ydi
aralashgan effekt modeli, ma'lumotlarni har xil (heterojen) chelaklarga ajratib turadigan omil bo'lib, ularning har birida tushuntirish va bog'liq parametrlarga (har qanday intercept yoki kesishma va yamoq/koeffitsient) o'rtasidagi farqli munosabatlarga ega bo'lishimiz mumkin. en.wikipedia.org/wiki/Mixed_model
qo'shib qo'ydi muallif Glen Solsberry, manba
Buni bir oz kengaytirishni iltimos qila olasizmi? Ko'p rahmat.
qo'shib qo'ydi muallif D L Dahly, manba
Shunday qilib, emizish holatlarida joylashtirilgan shaxslar va haftada emizishni tasodifiy egiluvchanligi bormi? Men buni SEM sifatida osonlik bilan bajarishim va aniq cheklovlarni sinab ko'rishim mumkin. Rahmat +1
qo'shib qo'ydi muallif D L Dahly, manba

Agar siz tasodifiy o'rmon yoki neyron tarmoqdan foydalansangiz, bu raqam 0 ga teng bo'lsa, ular 0 qiymatining boshqa qiymatlardan aniq farq qilishi mumkin (agar u aslida boshqacha bo'lsa). Boshqacha qilib aytadigan bo'lsak, vaqt o'zgaruvchiga qo'shimcha ravishda yes/no kategoriy o'zgaruvchini qo'shish.

Lekin umuman olganda, bu holatda men haqiqiy muammo ko'rmayapman - emizishning 0,1 xaftaligi 0 ga yaqin va effekt juda o'xshash bo'ladi, shuning uchun u menga juda o'zgaruvchan o'zgaruvchiga o'xshaydi, 0 farq qiladi.

1
qo'shib qo'ydi
Birinchi paragraf uchun +1, ammo ijtimoiy ilm yoki tibbiy ma'lumotlar bilan shug'ullanadigan bo'lsak, 0,1 haftaga nisbatan 0,1 barobar katta ta'sir qilmaydi. Muhim shuki, emizishni boshlamagan yoki hisobot etmagan ayollarning ko'pchiligi boshqa ko'plab sohalarda (sog'liqni saqlash muammolari, daromadlar, oilaviy ahvol, mehnatdan qochish qobiliyati, tibbiy xizmatlardan foydalanish imkoniyatlari haqida ma'lumot olishlari mumkin) ota-onalar va boshqalar.) Bu ayollarning emizishni sinab ko'ring va uni tezda to'xtatadigan onalarga juda o'xshashligiga hech qanday asos yo'q.
qo'shib qo'ydi muallif Gala, manba
Statistik jihatdan, ushbu boshqa parametrlarni sizning modelingizdan aniqroq qo'yish yaxshiroq bo'lar edi, lekin menimcha 0-da maxsus hech narsa yo'q deb o'ylash bilan ehtiyot bo'lish mantiqan to'g'ri.
qo'shib qo'ydi muallif Gala, manba

Tobit model is what you want, I think.

0
qo'shib qo'ydi
Tobitlar natijalar yuqori yoki pastki chegaradan pastga tsenzuraga tushganda qo'llaniladi. Masalan, biz eng kam ish haqi yoki yuqori kodli qiymatdan yuqori daromaddan past ish haqini hisobga olmadik. Ushbu dastur mustaqil o'zgaruvchan bo'ladi.
qo'shib qo'ydi muallif Dimitriy V. Masterov, manba