Լոգիստիկ ռեգրեսիա. մոդել և մեթոդներ

Բովանդակություն:

Լոգիստիկ ռեգրեսիա. մոդել և մեթոդներ
Լոգիստիկ ռեգրեսիա. մոդել և մեթոդներ
Anonim

Լոգիստիկ ռեգրեսիայի և դիսկրիմինանտ վերլուծության մեթոդներն օգտագործվում են, երբ անհրաժեշտ է հստակ տարբերակել հարցվողներին ըստ թիրախային կատեգորիաների: Այս դեպքում խմբերն իրենք ներկայացված են մեկ տարբերակային պարամետրի մակարդակներով: Եկեք մանրամասն նայենք լոգիստիկ ռեգրեսիայի մոդելին և պարզենք, թե ինչու է դա անհրաժեշտ:

լոգիստիկ ռեգրեսիա
լոգիստիկ ռեգրեսիա

Ընդհանուր տեղեկություններ

Խնդիրի օրինակ, որտեղ օգտագործվում է լոգիստիկ ռեգրեսիա, հարցվողների դասակարգումն է խմբերի, ովքեր գնում են մանանեխ և չեն գնում: Տարբերակումն իրականացվում է սոցիալ-ժողովրդագրական բնութագրերին համապատասխան: Դրանք ներառում են, մասնավորապես, տարիքը, սեռը, հարազատների թիվը, եկամուտը և այլն: Գործողություններում կան տարբերակման չափանիշներ և փոփոխական: Վերջինս կոդավորում է թիրախային կատեգորիաները, որոնց, ըստ էության, պետք է բաժանվեն հարցվողները։

Նյուանսներ

Պետք է ասել, որ լոգիստիկ ռեգրեսիայի կիրառման դեպքերի շրջանակը շատ ավելի նեղ է, քան դիսկրիմինանտ վերլուծության համար: Այս առումով դիտարկվում է վերջինիս՝ որպես տարբերակման ունիվերսալ մեթոդի կիրառումըավելի նախընտրելի. Ավելին, փորձագետները խորհուրդ են տալիս դասակարգման ուսումնասիրություններ սկսել դիսկրիմինանտ վերլուծությամբ։ Եվ միայն արդյունքների վերաբերյալ անորոշության դեպքում կարող եք օգտագործել լոգիստիկ ռեգրեսիա։ Այս անհրաժեշտությունը պայմանավորված է մի քանի գործոններով. Լոգիստիկ ռեգրեսիան օգտագործվում է, երբ հստակ պատկերացում կա անկախ և կախյալ փոփոխականների տեսակի մասին: Ըստ այդմ՝ ընտրվում է 3 հնարավոր ընթացակարգերից մեկը։ Խտրական վերլուծության ժամանակ հետազոտողը միշտ գործ ունի մեկ ստատիկ գործողության հետ: Այն ներառում է մեկ կախյալ և մի քանի անկախ դասակարգային փոփոխականներ ցանկացած տեսակի սանդղակի հետ:

Դիտումներ

Լոգիստիկ ռեգրեսիա օգտագործող վիճակագրական հետազոտության խնդիրն է որոշել որոշակի պատասխանողի որոշակի խմբին հատկացնելու հավանականությունը: Տարբերակումն իրականացվում է ըստ որոշակի պարամետրերի. Գործնականում, ըստ մեկ կամ մի քանի անկախ գործոնների արժեքների, հնարավոր է հարցվողներին դասակարգել երկու խմբի: Այս դեպքում տեղի է ունենում երկուական լոգիստիկ ռեգրեսիա: Նաև նշված պարամետրերը կարող են օգտագործվել երկուսից ավելի խմբերի բաժանելիս: Նման իրավիճակում տեղի է ունենում բազմանդամ լոգիստիկ ռեգրեսիա։ Ստացված խմբերն արտահայտվում են մեկ փոփոխականի մակարդակներով:

լոգիստիկ ռեգրեսիա
լոգիստիկ ռեգրեսիա

Օրինակ

Ենթադրենք, կան հարցվածների պատասխանները այն հարցին, թե արդյոք իրենց հետաքրքրում է Մոսկվայի արվարձաններում հողատարածք գնելու առաջարկը։ Տարբերակները «ոչ» ենև այո։ Պետք է պարզել, թե որ գործոններն են գերակշռող ազդեցություն ունենում պոտենցիալ գնորդների որոշման վրա։ Դա անելու համար հարցվողներին հարցեր են տալիս տարածքի ենթակառուցվածքի, մայրաքաղաքից հեռավորության, տեղանքի տարածքի, բնակելի շենքի առկայության/բացակայության և այլնի վերաբերյալ: Երկուական ռեգրեսիայի միջոցով հնարավոր է բաշխել հարցվածները բաժանվել են երկու խմբի. Առաջինում ներառվելու են նրանք, ովքեր հետաքրքրված են ձեռքբերմամբ՝ պոտենցիալ գնորդներ, իսկ երկրորդում, համապատասխանաբար, նրանք, ովքեր հետաքրքրված չեն նման առաջարկով։ Յուրաքանչյուր պատասխանողի համար, բացի այդ, կհաշվարկվի այս կամ այն կատեգորիայի վերագրվելու հավանականությունը։

Համեմատական բնութագրեր

Վերոնշյալ երկու տարբերակներից տարբերությունը խմբերի տարբեր քանակի և կախված և անկախ փոփոխականների տեսակն է: Երկուական ռեգրեսիայում, օրինակ, ուսումնասիրվում է դիխոտոմ գործոնի կախվածությունը մեկ կամ մի քանի անկախ պայմաններից։ Ընդ որում, վերջինս կարող է ունենալ ցանկացած տեսակի կշեռք։ Բազմանդամ ռեգրեսիան համարվում է այս դասակարգման տարբերակի տարբերակ: Դրանում 2-ից ավելի խմբեր պատկանում են կախյալ փոփոխականին։ Անկախ գործոնները պետք է ունենան կամ շարքային կամ անվանական սանդղակ։

Լոգիստիկ ռեգրեսիա spss-ում

Վիճակագրական 11-12 փաթեթում ներդրվել է վերլուծության նոր տարբերակը՝ հերթական։ Այս մեթոդը կիրառվում է, երբ կախյալ գործոնը պատկանում է նույն անվանման (շարքային) սանդղակին։ Այս դեպքում անկախ փոփոխականներն ընտրվում են մեկ կոնկրետ տեսակի: Դրանք պետք է լինեն կամ շարքային կամ անվանական: Ամենաշատը համարվում է դասակարգումը մի քանի կատեգորիաներիունիվերսալ. Այս մեթոդը կարող է օգտագործվել բոլոր հետազոտություններում, որոնք օգտագործում են լոգիստիկ ռեգրեսիա: Այնուամենայնիվ, մոդելի որակը բարելավելու միակ միջոցը բոլոր երեք տեխնիկան օգտագործելն է։

համարժեքության որակի ստուգում և լոգիստիկ ռեգրեսիա
համարժեքության որակի ստուգում և լոգիստիկ ռեգրեսիա

Հերթական դասակարգում

Պետք է ասել, որ ավելի վաղ վիճակագրական փաթեթում չկար դասական սանդղակով կախյալ գործոնների մասնագիտացված վերլուծություն կատարելու տիպիկ հնարավորություն։ 2-ից ավելի խմբեր ունեցող բոլոր փոփոխականների համար օգտագործվել է բազմանվանական տարբերակը: Համեմատաբար վերջերս ներդրված հերթական վերլուծությունն ունի մի շարք առանձնահատկություններ. Նրանք հաշվի են առնում սանդղակի առանձնահատկությունները: Մինչդեռ դասավանդման միջոցներում հերթական լոգիստիկ ռեգրեսիան հաճախ չի դիտարկվում որպես առանձին տեխնիկա: Դա պայմանավորված է հետևյալով. շարքային վերլուծությունը որևէ էական առավելություն չունի բազմանդամների նկատմամբ: Հետազոտողը կարող է օգտագործել վերջինս և՛ շարքային, և՛ անվանական կախյալ փոփոխականի առկայության դեպքում: Միևնույն ժամանակ, դասակարգման գործընթացներն իրենք գրեթե չեն տարբերվում միմյանցից։ Սա նշանակում է, որ հերթական վերլուծություն կատարելը որևէ դժվարություն չի առաջացնի։

Վերլուծության տարբերակ

Դիտարկենք մի պարզ դեպք՝ երկուական ռեգրեսիա: Ենթադրենք, մարքեթինգային հետազոտությունների ընթացքում գնահատվում է որոշակի մետրոպոլիայի համալսարանի շրջանավարտների պահանջարկը։ Հարցաթերթում հարցվողներին տրվել են հարցեր, այդ թվում՝

  1. Զբաղվու՞մ եք։ (ql).
  2. Մուտքագրեք ավարտական տարին (q 21).
  3. Որքա՞ն է միջինըավարտական միավոր (միջին).
  4. Սեռ (q22).

Լոգիստիկ ռեգրեսիան կգնահատի q 21 և q 22 անկախ գործոնների ազդեցությունը ql փոփոխականի վրա: Պարզ ասած, վերլուծության նպատակը կլինի շրջանավարտների հավանական զբաղվածության որոշումը՝ հիմնվելով ոլորտի, ավարտական տարվա և GPA-ի մասին տեղեկատվության վրա:

լոգիստիկ սիգմոիդ ռեգրեսիայի ցուցիչ
լոգիստիկ սիգմոիդ ռեգրեսիայի ցուցիչ

Լոգիստիկ ռեգրեսիա

Երկուական ռեգրեսիա օգտագործելով պարամետրեր սահմանելու համար օգտագործեք Analyze►Regression►Binary Logistic ընտրացանկը: Լոգիստիկ ռեգրեսիա պատուհանում ձախ կողմում առկա փոփոխականների ցանկից ընտրեք կախյալ գործոնը: Դա ql է: Այս փոփոխականը պետք է տեղադրվի Dependent դաշտում: Դրանից հետո անհրաժեշտ է անկախ գործոններ ներմուծել Covariates-ի հողամաս՝ q 21, q 22, aver. Ապա դուք պետք է ընտրեք, թե ինչպես դրանք ներառել ձեր վերլուծության մեջ: Եթե անկախ գործոնների թիվը 2-ից ավելի է, ապա կիրառվում է բոլոր փոփոխականների միաժամանակյա ներդրման մեթոդը, որը սահմանված է լռելյայն, բայց քայլ առ քայլ։ Ամենահայտնի ճանապարհը Հետադարձ:LR-ն է: Ընտրել կոճակի օգնությամբ դուք կարող եք ուսումնասիրության մեջ ներառել ոչ բոլոր հարցվողներին, այլ միայն որոշակի թիրախային կատեգորիա:

Սահմանել կատեգորիկ փոփոխականներ

Կատեգորիայի կոճակը պետք է օգտագործվի, երբ անկախ փոփոխականներից մեկը անվանական է՝ ավելի քան 2 կատեգորիաներով: Այս իրավիճակում «Սահմանել դասակարգային փոփոխականներ» պատուհանում հենց այդպիսի պարամետր է տեղադրվում «Կատեգորիայի փոխակերպումներ» բաժնում: Այս օրինակում նման փոփոխական չկա։ Դրանից հետո բացվող ցանկում հետևում է հակադրությունըընտրեք «Շեղում» կետը և սեղմեք «Փոխել» կոճակը: Արդյունքում յուրաքանչյուր անվանական գործոնից կձևավորվեն մի քանի կախյալ փոփոխականներ: Դրանց թիվը համապատասխանում է սկզբնական պայմանի կատեգորիաների թվին։

Պահպանել նոր փոփոխականները

Օգտագործելով «Պահպանել» կոճակը ուսումնասիրության հիմնական երկխոսության վանդակում, սահմանվում է նոր պարամետրերի ստեղծում: Դրանք կպարունակեն ռեգրեսիայի գործընթացում հաշվարկված ցուցանիշները։ Մասնավորապես, դուք կարող եք ստեղծել փոփոխականներ, որոնք սահմանում են՝

  1. Պատկանում է որոշակի դասակարգման կատեգորիայի (խմբի անդամություն).
  2. Յուրաքանչյուր ուսումնական խմբին պատասխանող նշանակելու հավանականություն (հավանականություններ):

Ընտրանքներ կոճակն օգտագործելիս հետազոտողը նշանակալի տարբերակներ չի ստանում: Համապատասխանաբար, այն կարելի է անտեսել։ «OK» կոճակը սեղմելուց հետո վերլուծության արդյունքները կցուցադրվեն հիմնական պատուհանում։

լոգիստիկ ռեգրեսիայի գործակից
լոգիստիկ ռեգրեսիայի գործակից

Որակի ստուգում համարժեքության և լոգիստիկ ռեգրեսիայի համար

Դիտարկենք մոդելի գործակիցների Omnibus Tests աղյուսակը: Այն ցուցադրում է մոդելի մոտարկման որակի վերլուծության արդյունքները: Հաշվի առնելով այն հանգամանքը, որ սահմանվել է քայլ առ քայլ տարբերակ, դուք պետք է նայեք վերջին փուլի արդյունքներին (Քայլ 2): Դրական արդյունքը կդիտարկվի, եթե հայտնաբերվի Chi-square ցուցանիշի աճ՝ հաջորդ փուլ անցնելիս կարևորության բարձր աստիճանով (Sig. < 0.05): Մոդելի որակը գնահատվում է Model տողում: Եթե բացասական արժեք է ստացվել, բայց այն էական չի համարվում մոդելի ընդհանուր բարձր նյութականությամբ, ապա վերջինըկարելի է գործնականում հարմար համարել։

Սեղաններ

Մոդելի ամփոփումը հնարավորություն է տալիս գնահատել ընդհանուր շեղումների ինդեքսը, որը նկարագրված է կառուցված մոդելով (R Square ինդեքս): Խորհուրդ է տրվում օգտագործել Nagelker արժեքը: Nagelkerke R Square պարամետրը կարելի է դրական ցուցանիշ համարել, եթե այն 0,50-ից բարձր է: Դրանից հետո գնահատվում են դասակարգման արդյունքները, որոնցում համեմատվում են ուսումնասիրվող այս կամ այն կատեգորիայի պատկանելության փաստացի ցուցանիշները ռեգրեսիոն մոդելի հիման վրա կանխատեսվածների հետ։ Դրա համար օգտագործվում է դասակարգման աղյուսակը: Այն նաև թույլ է տալիս մեզ եզրակացություններ անել դիտարկվող յուրաքանչյուր խմբի համար տարբերակման ճիշտության մասին:

լոգիստիկ ռեգրեսիայի մոդել
լոգիստիկ ռեգրեսիայի մոդել

Հետևյալ աղյուսակը հնարավորություն է տալիս պարզելու վերլուծության մեջ մտցված անկախ գործոնների վիճակագրական նշանակությունը, ինչպես նաև յուրաքանչյուր ոչ ստանդարտացված լոգիստիկ ռեգրեսիայի գործակիցը։ Այս ցուցանիշների հիման վրա կարելի է կանխատեսել ընտրանքում յուրաքանչյուր հարցվողի պատկանելությունը որոշակի խմբի: Օգտագործելով Save կոճակը, կարող եք մուտքագրել նոր փոփոխականներ: Դրանք կպարունակեն տեղեկատվություն որոշակի դասակարգման կատեգորիայի (կանխատեսված կատեգորիա) պատկանելու և այդ խմբերում ընդգրկվելու հավանականության մասին (Կանխատեսված հավանականությունների անդամություն): «Լավ» սեղմելուց հետո հաշվարկի արդյունքները կհայտնվեն Multinomial Logistic Regression-ի հիմնական պատուհանում:

Առաջին աղյուսակը, որը պարունակում է հետազոտողի համար կարևոր ցուցիչներ, Model Fitting Information-ն է: Վիճակագրական նշանակության բարձր մակարդակը ցույց կտա բարձր որակ ևմոդելի օգտագործման համապատասխանությունը գործնական խնդիրների լուծման համար: Մեկ այլ կարևոր աղյուսակ է Pseudo R-Square-ը: Այն թույլ է տալիս գնահատել կախված գործոնի ընդհանուր շեղման համամասնությունը, որը որոշվում է վերլուծության համար ընտրված անկախ փոփոխականներով: Ըստ հավանականության հարաբերակցության թեստերի աղյուսակի՝ կարելի է եզրակացություններ անել վերջինիս վիճակագրական նշանակության մասին։ Պարամետրերի գնահատումները արտացոլում են ոչ ստանդարտացված գործակիցները: Դրանք օգտագործվում են հավասարման կառուցման մեջ: Բացի այդ, փոփոխականների յուրաքանչյուր համակցության համար որոշվել է դրանց ազդեցության վիճակագրական նշանակությունը կախված գործոնի վրա: Մինչդեռ մարքեթինգային հետազոտության ժամանակ հաճախ անհրաժեշտ է դառնում հարցվողներին տարբերակել ըստ կատեգորիաների ոչ թե անհատապես, այլ որպես թիրախային խմբի մաս: Դրա համար օգտագործվում է դիտարկված և կանխատեսված հաճախականությունների աղյուսակը:

Գործնական կիրառություն

Վերլուծության դիտարկված մեթոդը լայնորեն կիրառվում է թրեյդերների աշխատանքում։ 1991 թվականին մշակվել է լոգիստիկ սիգմոիդ ռեգրեսիայի ցուցանիշը։ Դա հեշտ օգտագործման և արդյունավետ գործիք է հավանական գները կանխատեսելու համար՝ նախքան դրանք «գերտաքանալը»: Ցուցանիշը գծապատկերում ցուցադրվում է որպես երկու զուգահեռ գծերով կազմված ալիք: Նրանք հավասարապես հեռու են միտումից: Միջանցքի լայնությունը կախված կլինի բացառապես ժամկետից: Ցուցանիշն օգտագործվում է գրեթե բոլոր ակտիվների հետ աշխատելիս՝ արժութային զույգերից մինչև թանկարժեք մետաղներ:

լոգիստիկ ռեգրեսիա spss-ում
լոգիստիկ ռեգրեսիա spss-ում

Գործնականում մշակվել են գործիքի օգտագործման 2 հիմնական ռազմավարություն.շրջադարձի համար. Վերջին դեպքում թրեյդերը կկենտրոնանա ալիքի ներսում գների փոփոխությունների դինամիկայի վրա: Երբ արժեքը մոտենում է աջակցության կամ դիմադրության գծին, խաղադրույք է կատարվում այն հավանականության վրա, որ շարժումը կսկսվի հակառակ ուղղությամբ: Եթե գինը մոտենում է վերին սահմանին, ապա կարող եք ազատվել ակտիվից: Եթե այն գտնվում է ստորին սահմանում, ապա պետք է մտածել գնման մասին։ Ճեղքման ռազմավարությունը ներառում է պատվերների օգտագործումը: Դրանք տեղադրվում են սահմաններից դուրս՝ համեմատաբար փոքր հեռավորության վրա։ Հաշվի առնելով, որ գինը որոշ դեպքերում խախտում է դրանք կարճ ժամանակով, դուք պետք է ապահով խաղաք և սահմանեք ստոպ կորուստներ։ Միաժամանակ, իհարկե, անկախ ընտրած ռազմավարությունից, թրեյդերը պետք է հնարավորինս հանգիստ ընկալի և գնահատի շուկայում ստեղծված իրավիճակը։

Եզրակացություն

Այսպիսով, լոգիստիկ ռեգրեսիայի օգտագործումը թույլ է տալիս արագ և հեշտությամբ հարցվողներին դասակարգել ըստ տրված պարամետրերի կատեգորիաների: Վերլուծելիս կարող եք օգտագործել ցանկացած կոնկրետ մեթոդ: Մասնավորապես, բազմանդամ ռեգրեսիան ունիվերսալ է: Այնուամենայնիվ, փորձագետները խորհուրդ են տալիս օգտագործել վերը նկարագրված բոլոր մեթոդները համակցված: Դա պայմանավորված է նրանով, որ այս դեպքում մոդելի որակը զգալիորեն ավելի բարձր կլինի։ Սա իր հերթին կընդլայնի դրա կիրառման շրջանակը։

Խորհուրդ ենք տալիս: