Վիճակագրական մոդելավորում. մեթոդներ, նկարագրություն, կիրառություն

Բովանդակություն:

Վիճակագրական մոդելավորում. մեթոդներ, նկարագրություն, կիրառություն
Վիճակագրական մոդելավորում. մեթոդներ, նկարագրություն, կիրառություն
Anonim

Վիճակագրական մոդելավորման մեջ ներառված ենթադրությունները նկարագրում են հավանականության բաշխումների մի շարք, որոնցից մի քանիսը ենթադրվում է, որ համարժեքորեն մոտավոր են բաշխումը: Սահմանումից ընտրվում է տվյալների որոշակի հավաքածու: Վիճակագրական մոդելավորմանը բնորոշ հավանականությունների բաշխումն այն է, ինչը տարբերակում է վիճակագրական մոդելները այլ, ոչ վիճակագրական, մաթեմատիկական մոդելներից:

Image
Image

Կապ մաթեմատիկայի հետ

Այս գիտական մեթոդը հիմնականում հիմնված է մաթեմատիկայի վրա: Համակարգերի վիճակագրական մոդելավորումը սովորաբար տրվում է մաթեմատիկական հավասարումներով, որոնք կապված են մեկ կամ մի քանի պատահական փոփոխականների և, հնարավոր է, այլ ոչ պատահական փոփոխականների հետ: Այսպիսով, վիճակագրական մոդելը «տեսության պաշտոնական ներկայացումն է» (Հերման Ադեր, մեջբերում է Քենեթ Բոլենը):

Բոլոր վիճակագրական վարկածների թեստերը և բոլոր վիճակագրական գնահատումները բխում են վիճակագրական մոդելներից: Ավելի ընդհանուր առմամբ, վիճակագրական մոդելները վիճակագրական եզրակացության հիմքի մի մասն են կազմում:

Վիճակագրական մեթոդներմոդելավորում

Ոչ ֆորմալ կերպով վիճակագրական մոդելը կարելի է համարել որպես վիճակագրական ենթադրություն (կամ վիճակագրական ենթադրությունների մի շարք) որոշակի հատկությամբ. այս ենթադրությունը թույլ է տալիս մեզ հաշվարկել ցանկացած իրադարձության հավանականությունը: Որպես օրինակ, դիտարկեք մի զույգ սովորական վեցակողմ զառեր: Մենք կուսումնասիրենք երկու տարբեր վիճակագրական ենթադրություններ ոսկորների վերաբերյալ։

Առաջին վիճակագրական ենթադրությունը կազմում է վիճակագրական մոդելը, քանի որ միայն մեկ ենթադրությամբ մենք կարող ենք հաշվարկել ցանկացած իրադարձության հավանականությունը: Այլընտրանքային վիճակագրական ենթադրությունը վիճակագրական մոդել չէ, քանի որ միայն մեկ ենթադրությամբ մենք չենք կարող հաշվարկել յուրաքանչյուր իրադարձության հավանականությունը։

Տիպիկ վիճակագրական մոդել
Տիպիկ վիճակագրական մոդել

Վերոնշյալ օրինակում առաջին ենթադրությամբ հեշտ է հաշվարկել իրադարձության հավանականությունը։ Այնուամենայնիվ, որոշ այլ օրինակներում հաշվարկը կարող է լինել բարդ կամ նույնիսկ անիրագործելի (օրինակ, այն կարող է պահանջել միլիոնավոր տարվա հաշվարկ): Այն ենթադրության համար, որը կազմում է վիճակագրական մոդել, այս դժվարությունը ընդունելի է.

Մոդելների օրինակներ

Ենթադրենք՝ ունենք դպրոցականների բնակչություն՝ հավասարաչափ բաշխված երեխաներով։ Երեխայի հասակը պատահականորեն կապված կլինի տարիքի հետ. օրինակ, երբ մենք գիտենք, որ երեխան 7 տարեկան է, դա ազդում է երեխայի հասակի 5 ֆուտ (մոտ 152 սմ) հավանականության վրա: Մենք կարող ենք այս հարաբերությունը ձևակերպել գծային ռեգրեսիայի մոդելում, օրինակ՝ աճ=b0 + b1agei+ εi, որտեղ b0-ը հատումն է, b1-ը այն պարամետրն է, որով տարիքը բազմապատկվում է աճի կանխատեսումը ստանալու ժամանակ, εi-ն սխալի տերմինն է: Սա ենթադրում է, որ հասակը կանխատեսվում է ըստ տարիքի՝ որոշ սխալներով։

Վավեր մոդելը պետք է համապատասխանի տվյալների բոլոր կետերին: Այսպիսով, ուղիղ գիծը (heighti=b0 + b1agei) չի կարող հավասարություն լինել տվյալների մոդելի համար, քանի դեռ այն ճշգրիտ չի համապատասխանում տվյալների բոլոր կետերին, այսինքն, բոլոր տվյալների կետերը կատարյալ կերպով ընկած են գծի վրա: Էi սխալ տերմինը պետք է ներառվի հավասարման մեջ, որպեսզի մոդելը համապատասխանի տվյալների բոլոր կետերին:

գենդերային վիճակագրություն
գենդերային վիճակագրություն

Վիճակագրական եզրակացություն անելու համար մենք նախ պետք է ենթադրենք εi-ի հավանականության որոշ բաշխումներ: Օրինակ՝ կարող ենք ենթադրել, որ εi-ի բաշխումները գաուսական են՝ զրոյական միջինով։ Այս դեպքում մոդելը կունենա 3 պարամետր՝ b0, b1 և Գաուսի բաշխման շեղումը։

Ընդհանուր նկարագրություն

Վիճակագրական մոդելը մաթեմատիկական մոդելի հատուկ դաս է: Վիճակագրական մոդելը այլ մաթեմատիկական մոդելներից տարբերվում է նրանով, որ այն ոչ դետերմինիստական է: Այն օգտագործվում է վիճակագրական տվյալների մոդելավորման համար: Այսպիսով, մաթեմատիկական հավասարումներով սահմանված վիճակագրական մոդելում որոշ փոփոխականներ չունեն հատուկ արժեքներ, փոխարենը ունեն հավանականության բաշխումներ. այսինքն՝ որոշ փոփոխականներ ստոխաստիկ են։ Վերոնշյալ օրինակում ε-ը ստոխաստիկ փոփոխական է. առանց այս փոփոխականի մոդելը եղել էդետերմինիստական կլիներ։

Վիճակագրական մոդելները հաճախ օգտագործվում են վիճակագրական վերլուծության և մոդելավորման մեջ, նույնիսկ եթե մոդելավորվող ֆիզիկական գործընթացը դետերմինիստական է: Օրինակ, մետաղադրամներ նետելը սկզբունքորեն դետերմինիստական գործընթաց է. սակայն այն սովորաբար մոդելավորվում է որպես ստոխաստիկ (Բեռնուլիի գործընթացի միջոցով):

տաքացման վիճակագրություն
տաքացման վիճակագրություն

Պարամետրիկ մոդելներ

Պարամետրիկ մոդելները ամենատարածված վիճակագրական մոդելներն են: Ինչ վերաբերում է կիսապարամետրային և ոչ պարամետրային մոդելներին, սըր Դեյվիդ Քոքսն ասաց. «Դրանք ընդհանուր առմամբ ներառում են ավելի քիչ ենթադրություններ բաշխման կառուցվածքի և ձևի վերաբերյալ, բայց սովորաբար պարունակում են ուժեղ անկախության ենթադրություններ»: Ինչպես նշված բոլոր մոդելները, դրանք նույնպես հաճախ օգտագործվում են մաթեմատիկական մոդելավորման վիճակագրական մեթոդում:

Բազմաստիճան մոդելներ

Բազմաստիճան մոդելները (նաև հայտնի են որպես հիերարխիկ գծային մոդելներ, ներդիր տվյալների մոդելներ, խառը մոդելներ, պատահական գործակիցներ, պատահական էֆեկտների մոդելներ, պատահական պարամետրային մոդելներ կամ բաժանված մոդելներ) վիճակագրական պարամետրերի մոդելներ են, որոնք տարբերվում են մեկից ավելի մակարդակներում: Օրինակ՝ ուսանողի ձեռքբերումների մոդել է, որը պարունակում է չափումներ առանձին ուսանողների համար, ինչպես նաև չափումներ այն դասարանների համար, որտեղ ուսանողները խմբավորված են: Այս մոդելները կարելի է դիտարկել որպես գծային մոդելների ընդհանրացումներ (մասնավորապես՝ գծային ռեգրեսիա), թեև դրանք կարող են տարածվել նաև ոչ գծային մոդելների վրա։ Այս մոդելները դարձել ենշատ ավելի տարածված, երբ բավականաչափ հաշվողական հզորությունը և ծրագրային ապահովումը հասանելի դարձան:

Սեգմենտի վիճակագրություն
Սեգմենտի վիճակագրություն

Բազմաստիճան մոդելները հատկապես հարմար են հետազոտական նախագծերի համար, որտեղ մասնակիցների տվյալները կազմակերպվում են մեկից ավելի մակարդակներում (այսինքն՝ ներկառուցված տվյալներ): Վերլուծության միավորները սովորաբար անհատներ են (ավելի ցածր մակարդակում), որոնք գտնվում են համատեքստում/համախառն միավորներում (ավելի բարձր մակարդակում): Թեև բազմամակարդակ մոդելներում տվյալների ամենացածր մակարդակը սովորաբար անհատական է, կարելի է դիտարկել նաև անհատների կրկնվող չափումները: Այսպիսով, բազմամակարդակ մոդելներն ապահովում են վերլուծության այլընտրանքային տեսակ՝ միակողմանի կամ բազմաչափ կրկնվող չափումների վերլուծության համար: Կարելի է դիտարկել աճի կորերի անհատական տարբերությունները: Բացի այդ, բազմամակարդակ մոդելները կարող են օգտագործվել որպես ANCOVA-ի այլընտրանք, որտեղ կախված փոփոխականների միավորները ճշգրտվում են փոխակերպումների համար (օրինակ՝ անհատական տարբերությունները) նախքան բուժման տարբերությունների թեստավորումը: Բազմաստիճան մոդելները կարող են վերլուծել այս փորձերը՝ առանց ANCOVA-ի կողմից պահանջվող միատեսակ ռեգրեսիայի թեքությունների ենթադրության:

Բազմաստիճան մոդելները կարող են օգտագործվել բազմաթիվ մակարդակներով տվյալների համար, թեև երկաստիճան մոդելները ամենատարածվածն են, և այս հոդվածի մնացած մասը կենտրոնանում է դրանց վրա: Կախյալ փոփոխականը պետք է ուսումնասիրվի վերլուծության ամենացածր մակարդակում:

Մթնոլորտային ճնշման գրաֆիկ
Մթնոլորտային ճնշման գրաֆիկ

Մոդելի ընտրություն

Մոդելի ընտրությունվիճակագրական մոդելավորման շրջանակներում իրականացվող տվյալների հիման վրա թեկնածու մոդելների մի շարքից ընտրելու խնդիրն է: Ամենապարզ դեպքերում դիտարկվում է արդեն գոյություն ունեցող տվյալների հավաքածու: Այնուամենայնիվ, առաջադրանքը կարող է ներառել նաև փորձերի նախագծում, որպեսզի հավաքագրված տվյալները լավ համապատասխանեն մոդելի ընտրության առաջադրանքին: Հաշվի առնելով նմանատիպ կանխատեսող կամ բացատրական հզորությամբ թեկնածու մոդելները, ամենապարզ մոդելը, ամենայն հավանականությամբ, կլինի լավագույն ընտրությունը (Occam's ածելի):

Konishi & Kitagawa-ն ասում է. «Վիճակագրական եզրակացության խնդիրների մեծ մասը կարելի է համարել վիճակագրական մոդելավորման հետ կապված խնդիրներ»: Նմանապես, Քոքսն ասաց. «Ինչպես է կատարվում առարկայի թարգմանությունը վիճակագրական մոդելի, հաճախ վերլուծության ամենակարևոր մասն է»:

Մոդելի ընտրությունը կարող է նաև վերաբերել մի քանի ներկայացուցչական մոդելների ընտրության խնդրին հաշվողական մոդելների մեծ շարքից որոշման կամ օպտիմալացման նպատակով անորոշության պայմաններում:

Գրաֆիկական նախշեր

Գրաֆիկական մոդելը կամ հավանականական գրաֆիկական մոդելը (PGM) կամ կառուցվածքային հավանականական մոդելը հավանականական մոդել է, որի համար գրաֆիկն արտահայտում է պատահական փոփոխականների միջև պայմանական կապի կառուցվածքը: Դրանք սովորաբար օգտագործվում են հավանականությունների տեսության, վիճակագրության (հատկապես Բայեսյան վիճակագրության) և մեքենայական ուսուցման մեջ։

Վիճակագրական մոդել՝ գրաֆիկով։
Վիճակագրական մոդել՝ գրաֆիկով։

Էկոնոմետրիկ մոդելներ

Էկոնոմետրիկ մոդելները վիճակագրական մոդելներ են, որոնք օգտագործվում ենէկոնոմետրիկա։ Էկոնոմետրիկ մոդելը սահմանում է վիճակագրական հարաբերությունները, որոնք, ենթադրաբար, գոյություն ունեն որոշակի տնտեսական երևույթի հետ կապված տարբեր տնտեսական մեծությունների միջև: Էկոնոմետրիկ մոդելը կարող է ստացվել դետերմինիստական տնտեսական մոդելից, որը հաշվի է առնում անորոշությունը, կամ տնտեսական մոդելից, որն ինքնին ստոխաստիկ է: Այնուամենայնիվ, հնարավոր է նաև օգտագործել էկոնոմետրիկ մոդելներ, որոնք կապված չեն որևէ կոնկրետ տնտեսական տեսության հետ:

Խորհուրդ ենք տալիս: