Վիճակագրական մոդելը մաթեմատիկական պրոյեկցիա է, որը մարմնավորում է մի շարք տարբեր ենթադրություններ որոշ նմուշային տվյալների ստեղծման վերաբերյալ: Տերմինը հաճախ ներկայացվում է շատ իդեալականացված ձևով:
Վիճակագրական մոդելում արտահայտված ենթադրությունները ցույց են տալիս հավանականության բաշխումների մի շարք: Դրանցից շատերը նպատակ ունեն ճիշտ մոտավորել այն բաշխումը, որից ստացվում է տեղեկատվության որոշակի փաթեթ: Վիճակագրական մոդելներին բնորոշ հավանականությունների բաշխումն այն է, ինչը տարբերում է պրոյեկցիան այլ մաթեմատիկական փոփոխություններից:
Ընդհանուր կանխատեսում
Մաթեմատիկական մոդելը համակարգի նկարագրությունն է՝ օգտագործելով որոշակի հասկացություններ և լեզու: Դրանք վերաբերում են բնական գիտություններին (օրինակ՝ ֆիզիկա, կենսաբանություն, երկրագիտություն, քիմիա) և ճարտարագիտական առարկաներ (օրինակ՝ համակարգչային գիտություն, էլեկտրատեխնիկա), ինչպես նաև սոցիալական գիտություններ (օրինակ՝ տնտեսագիտություն, հոգեբանություն, սոցիոլոգիա, քաղաքագիտություն):
Մոդելը կարող է օգնել բացատրել համակարգը ևուսումնասիրել տարբեր բաղադրիչների ազդեցությունը և կատարել վարքի կանխատեսումներ:
Մաթեմատիկական մոդելները կարող են ունենալ բազմաթիվ ձևեր, ներառյալ դինամիկ համակարգեր, վիճակագրական կանխատեսումներ, դիֆերենցիալ հավասարումներ կամ խաղի տեսական պարամետրեր: Այս և այլ տեսակներ կարող են համընկնել, և այս մոդելը ներառում է բազմաթիվ վերացական կառույցներ: Ընդհանուր առմամբ, մաթեմատիկական կանխատեսումները կարող են ներառել նաև տրամաբանական բաղադրիչներ: Շատ դեպքերում գիտական ոլորտի որակը կախված է նրանից, թե տեսականորեն մշակված մաթեմատիկական մոդելները որքանով են համաձայն կրկնվող փորձերի արդյունքների հետ։ Տեսական գործընթացների և փորձարարական չափումների միջև համաձայնության բացակայությունը հաճախ հանգեցնում է կարևոր առաջընթացի, քանի որ ավելի լավ տեսություններ են մշակվում:
Ֆիզիկական գիտություններում ավանդական մաթեմատիկական մոդելը պարունակում է մեծ թվով հետևյալ տարրերը՝
- Վերահսկիչ հավասարումներ։
- Լրացուցիչ ենթամոդելներ.
- Սահմանել հավասարումներ։
- Բաղադրիչ հավասարումներ.
- Ենթադրություններ և սահմանափակումներ.
- Սկզբնական և սահմանային պայմաններ.
- Դասական սահմանափակումներ և կինեմատիկական հավասարումներ:
Բանաձև
Վիճակագրական մոդելը, որպես կանոն, սահմանվում է մաթեմատիկական հավասարումներով, որոնք միավորում են մեկ կամ մի քանի պատահական փոփոխականներ և, հնարավոր է, բնական այլ փոփոխականներ: Նմանապես, պրոյեկցիան համարվում է «հայեցակարգի պաշտոնական հայեցակարգ»:
Բոլոր վիճակագրական հիպոթեզների փորձարկումները և վիճակագրական գնահատումները ստացվել են մաթեմատիկական մոդելներից:
Ներածություն
Ոչ ֆորմալ կերպով վիճակագրական մոդելը կարող է դիտվել որպես ենթադրություն (կամ ենթադրությունների հավաքածու) որոշակի հատկությամբ. այն թույլ է տալիս հաշվարկել ցանկացած իրադարձության հավանականությունը: Որպես օրինակ, դիտարկեք մի զույգ սովորական վեցակողմ զառեր: Ոսկրածուծի վերաբերյալ երկու տարբեր վիճակագրական ենթադրություններ պետք է ուսումնասիրվեն։
Առաջին ենթադրությունն է.
Զառերից յուրաքանչյուրի համար թվերից մեկը (1, 2, 3, 4, 5 և 6) ստանալու հավանականությունը հետևյալն է՝ 1/6։
Այս ենթադրությունից մենք կարող ենք հաշվարկել երկու զառերի հավանականությունը՝ 1:1/6×1/6=1/36:
Ավելի ընդհանուր առմամբ, դուք կարող եք հաշվարկել ցանկացած իրադարձության հավանականությունը: Այնուամենայնիվ, պետք է հասկանալ, որ անհնար է հաշվարկել որևէ այլ ոչ տրիվիալ իրադարձության հավանականությունը։
Միայն առաջին կարծիքը հավաքում է վիճակագրական մաթեմատիկական մոդել՝ պայմանավորված այն հանգամանքով, որ միայն մեկ ենթադրությամբ է հնարավոր որոշել յուրաքանչյուր գործողության հավանականությունը։
Վերոնշյալ նմուշում նախնական թույլտվությամբ հեշտ է որոշել իրադարձության հնարավորությունը: Որոշ այլ օրինակներով հաշվարկը կարող է լինել դժվար կամ նույնիսկ անիրատեսական (օրինակ, այն կարող է պահանջել երկար տարիների հաշվարկներ): Վիճակագրական վերլուծության մոդել նախագծող անձի համար նման բարդությունը համարվում է անընդունելի. հաշվարկների իրականացումը չպետք է լինի գործնականում անհնարին և տեսականորեն անհնարին:
Պաշտոնական սահմանում
Մաթեմատիկական առումով համակարգի վիճակագրական մոդելը սովորաբար դիտարկվում է որպես զույգ (S, P), որտեղ S-ն է.հնարավոր դիտարկումների բազմությունը, այսինքն՝ նմուշի տարածությունը, իսկ P-ն S.
-ի վրա հավանականության բաշխումների բազմությունն է
Այս սահմանման ինտուիցիան հետևյալն է. Ենթադրվում է, որ կա հավանականության «ճշմարիտ» բաշխում, որը պայմանավորված է որոշակի տվյալներ գեներացնող գործընթացով։
Սահմանել
Նա է որոշում մոդելի պարամետրերը։ Պարամետրիզացիան սովորաբար պահանջում է տարբեր արժեքներ՝ տարբեր բաշխումներ ստանալու համար, այսինքն՝
պետք է պահվի (այլ կերպ ասած, այն պետք է լինի ներարկային): Պարամետրիզացիան, որը համապատասխանում է պահանջին, համարվում է նույնականացնելի:
Օրինակ
Ենթադրենք, որ կան որոշ թվով ուսանողներ, ովքեր տարբեր տարիքի են: Երեխայի հասակը պատահականորեն կապված կլինի ծննդյան տարեթվի հետ. օրինակ, երբ դպրոցականը 7 տարեկան է, դա ազդում է աճի հավանականության վրա, միայն այն դեպքում, որ մարդը լինի 3 սանտիմետրից բարձր:
Դուք կարող եք այս մոտեցումը ձևակերպել ուղիղ գծով ռեգրեսիոն մոդելի մեջ, օրինակ՝ հետևյալ կերպ՝ բարձրություն i=b 0 + b 1agei + εi, որտեղ b 0 խաչմերուկն է, b 1 այն պարամետրն է, որով տարիքը բազմապատկվում է բարձրության մոնիտորինգ ստանալու ժամանակ: Սա սխալ տերմին է: Այսինքն՝ ենթադրում է, որ հասակը գուշակվում է տարիքով որոշակի սխալով։
Վավեր ձևը պետք է համապատասխանի բոլոր տեղեկատվական կետերին: Այսպիսով, ուղղագիծ ուղղությունը (մակարդակ i=b 0 + b 1agei) ի վիճակի չէ լինել տվյալների մոդելի հավասարում, եթե այն հստակ չի պատասխանում բացարձակապես բոլոր կետերին: այսինքնառանց բացառության, բոլոր տեղեկությունները անթերի են գտնվում գծի վրա: Էi սխալի սահմանը պետք է մուտքագրվի հավասարման մեջ, որպեսզի ձևը համապատասխանի տեղեկատվության բացարձակապես բոլոր կետերին:
Վիճակագրական եզրակացություն անելու համար մենք նախ պետք է ենթադրենք ε i-ի հավանականության որոշ բաշխումներ: Օրինակ, կարելի է ենթադրել, որ ε i-ի բաշխումները ունեն զրոյական միջինով գաուսյան ձև: Այս դեպքում մոդելը կունենա 3 պարամետր՝ b 0, b 1 և Գաուսի բաշխման շեղումը։
Դուք կարող եք պաշտոնապես նշել մոդելը որպես (S, P):
Այս օրինակում մոդելը սահմանվում է՝ նշելով S-ը, ուստի որոշ ենթադրություններ կարելի է անել P-ի վերաբերյալ: Երկու տարբերակ կա՝
Այս աճը կարող է մոտավորվել տարիքի գծային ֆունկցիայով;
Որ մոտավորության սխալները բաշխված են ինչպես Գաուսի ներսում:
Ընդհանուր դիտողություններ
Մոդելների վիճակագրական պարամետրերը մաթեմատիկական պրոյեկցիայի հատուկ դաս են: Ինչո՞վ է տարբերվում մի տեսակը մյուսից: Այսպիսով, վիճակագրական մոդելը ոչ դետերմինիստական է: Այսպիսով, դրանում, ի տարբերություն մաթեմատիկական հավասարումների, որոշ փոփոխականներ չունեն որոշակի արժեքներ, փոխարենը ունեն հնարավորությունների բաշխում։ Այսինքն՝ առանձին փոփոխականները համարվում են ստոխաստիկ։ Վերոնշյալ օրինակում ε-ը ստոխաստիկ փոփոխական է: Առանց դրա, կանխատեսումը կլինի դետերմինիստական:
Վիճակագրական մոդելի կառուցումը հաճախ օգտագործվում է, նույնիսկ եթե նյութական գործընթացը համարվում է դետերմինիստական: Օրինակ, մետաղադրամներ նետելը, սկզբունքորեն, կանխորոշող գործողություն է:Այնուամենայնիվ, սա դեռ շատ դեպքերում մոդելավորվում է որպես ստոխաստիկ (Բեռնուլիի գործընթացի միջոցով):
Ըստ Կոնիշիի և Կիտագավայի, վիճակագրական մոդելի համար կա երեք նպատակ.
- Կանխատեսումներ.
- Տեղեկատվության հանքարդյունաբերություն.
- Ստոխաստիկ կառուցվածքների նկարագրություն.
Պրոեկցիոն չափ
Ենթադրենք, որ կա վիճակագրական կանխատեսման մոդել, Մոդելը կոչվում է պարամետրային, եթե O-ն ունի վերջավոր չափ: Լուծման մեջ դուք պետք է գրեք, որ
որտեղ k-ն դրական ամբողջ թիվ է (R նշանակում է ցանկացած իրական թվեր): Այստեղ k-ն կոչվում է մոդելի չափ:
Որպես օրինակ, մենք կարող ենք ենթադրել, որ բոլոր տվյալները գալիս են Գաուսի միակողմանի բաշխումից.
Այս օրինակում k-ի չափը 2 է:
Եվ որպես մեկ այլ օրինակ, կարելի է ենթադրել, որ տվյալները բաղկացած են (x, y) կետերից, որոնք ենթադրվում է, որ բաշխված են ուղիղ գծով Գաուսի մնացորդներով (զրոյական միջինով): Այնուհետև վիճակագրական տնտեսական մոդելի չափը հավասար է 3-ի՝ գծի հատումը, դրա թեքությունը և մնացորդների բաշխման շեղումը: Հարկ է նշել, որ երկրաչափության մեջ ուղիղ գիծը ունի 1 չափս։
Չնայած վերը նշված արժեքը տեխնիկապես միակ պարամետրն է, որն ունի k չափում, այն երբեմն համարվում է, որ պարունակում է k տարբեր արժեքներ: Օրինակ, միաչափ Գաուսի բաշխման դեպքում O-ն 2 չափի միակ պարամետրն է, բայց երբեմն համարվում է, որ պարունակում է երկուանհատական պարամետր - միջին արժեք և ստանդարտ շեղում:
Վիճակագրական գործընթացի մոդելը ոչ պարամետրիկ է, եթե O-ի արժեքների բազմությունը անսահմանաչափ է: Այն նաև կիսապարամետրիկ է, եթե ունի և՛ վերջավոր, և՛ անվերջ չափերի պարամետրեր։ Ֆորմալ կերպով, եթե k-ն O-ի չափն է, իսկ n-ը՝ նմուշների թիվը, ապա կիսապարամետրիկ և ոչ պարամետրիկ մոդելներն ունեն
ապա մոդելը կիսապարամետրիկ է: Հակառակ դեպքում, պրոյեկցիան ոչ պարամետրիկ է։
Պարամետրիկ մոդելները ամենատարածված վիճակագրությունն են: Կիսապարամետրային և ոչ պարամետրային կանխատեսումների վերաբերյալ սըր Դեյվիդ Քոքսն ասաց.
«Սրանք սովորաբար ներառում են հյուսվածքի և բաշխման ձևի վերաբերյալ ամենաքիչ վարկածները, բայց ներառում են ինքնաբավության մասին հզոր տեսություններ»:
Ներդրված մոդելներ
Մի շփոթեք դրանք բազմաստիճան կանխատեսումների հետ։
Երկու վիճակագրական մոդելներ տեղադրվում են, եթե առաջինը կարող է փոխակերպվել երկրորդի՝ առաջինի պարամետրերի վրա սահմանափակումներ դնելով: Օրինակ, Գաուսի բոլոր բաշխումների բազմությունն ունի զրոյական միջին բաշխումների ներդիր բազմություն՝
Այսինքն՝ դուք պետք է սահմանափակեք միջինը բոլոր Գաուսյան բաշխումների բազմության մեջ՝ զրոյական միջինով բաշխումներ ստանալու համար: Որպես երկրորդ օրինակ՝ քառակուսի մոդելը y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) ունի ներկառուցված գծային մոդել y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - այսինքն b2 պարամետրը հավասար է 0.
Այս երկու օրինակներում էլ առաջին մոդելն ավելի մեծ չափսեր ունի, քան երկրորդ մոդելը: Սա հաճախ է լինում, բայց ոչ միշտ: Մեկ այլ օրինակ է Գաուսի բաշխումների բազմությունը դրական միջինով, որն ունի 2 հարթություն։
Մոդելների համեմատություն
Ենթադրվում է, որ առկա է «ճշմարիտ» հավանականության բաշխում, որի հիմքում ընկած է դիտարկված տվյալները, որոնք առաջացրել են դրանք առաջացնող գործընթացով:
Եվ նաև մոդելները կարելի է համեմատել միմյանց հետ՝ օգտագործելով հետախուզական վերլուծություն կամ հաստատում: Հետախուզական վերլուծության ժամանակ ձևակերպվում են տարբեր մոդելներ և գնահատվում է, թե դրանցից յուրաքանչյուրը որքան լավ է նկարագրում տվյալները: Հաստատող վերլուծության ժամանակ նախկինում ձևակերպված վարկածը համեմատվում է սկզբնականի հետ: Դրա ընդհանուր չափանիշները ներառում են P 2, Բայեսյան գործոն և հարաբերական հավանականություն:
Կոնիշիի և Կիտագավայի միտքը
«Վիճակագրական մաթեմատիկական մոդելի խնդիրների մեծ մասը կարելի է դիտարկել որպես կանխատեսող հարցեր: Դրանք սովորաբար ձևակերպվում են որպես մի քանի գործոնների համեմատություններ»:
Ավելին, սըր Դեյվիդ Քոքսն ասաց. «Որպես թեմայից թարգմանություն, վիճակագրական մոդելի խնդիրը հաճախ վերլուծության ամենակարևոր մասն է»: