Վիճակագրական մոդել. մեթոդի էությունը, կառուցումը և վերլուծությունը

Բովանդակություն:

Վիճակագրական մոդել. մեթոդի էությունը, կառուցումը և վերլուծությունը
Վիճակագրական մոդել. մեթոդի էությունը, կառուցումը և վերլուծությունը
Anonim

Վիճակագրական մոդելը մաթեմատիկական պրոյեկցիա է, որը մարմնավորում է մի շարք տարբեր ենթադրություններ որոշ նմուշային տվյալների ստեղծման վերաբերյալ: Տերմինը հաճախ ներկայացվում է շատ իդեալականացված ձևով:

Վիճակագրական մոդելում արտահայտված ենթադրությունները ցույց են տալիս հավանականության բաշխումների մի շարք: Դրանցից շատերը նպատակ ունեն ճիշտ մոտավորել այն բաշխումը, որից ստացվում է տեղեկատվության որոշակի փաթեթ: Վիճակագրական մոդելներին բնորոշ հավանականությունների բաշխումն այն է, ինչը տարբերում է պրոյեկցիան այլ մաթեմատիկական փոփոխություններից:

Ընդհանուր կանխատեսում

վիճակագրական գործընթացի մոդելներ
վիճակագրական գործընթացի մոդելներ

Մաթեմատիկական մոդելը համակարգի նկարագրությունն է՝ օգտագործելով որոշակի հասկացություններ և լեզու: Դրանք վերաբերում են բնական գիտություններին (օրինակ՝ ֆիզիկա, կենսաբանություն, երկրագիտություն, քիմիա) և ճարտարագիտական առարկաներ (օրինակ՝ համակարգչային գիտություն, էլեկտրատեխնիկա), ինչպես նաև սոցիալական գիտություններ (օրինակ՝ տնտեսագիտություն, հոգեբանություն, սոցիոլոգիա, քաղաքագիտություն):

Մոդելը կարող է օգնել բացատրել համակարգը ևուսումնասիրել տարբեր բաղադրիչների ազդեցությունը և կատարել վարքի կանխատեսումներ:

Մաթեմատիկական մոդելները կարող են ունենալ բազմաթիվ ձևեր, ներառյալ դինամիկ համակարգեր, վիճակագրական կանխատեսումներ, դիֆերենցիալ հավասարումներ կամ խաղի տեսական պարամետրեր: Այս և այլ տեսակներ կարող են համընկնել, և այս մոդելը ներառում է բազմաթիվ վերացական կառույցներ: Ընդհանուր առմամբ, մաթեմատիկական կանխատեսումները կարող են ներառել նաև տրամաբանական բաղադրիչներ: Շատ դեպքերում գիտական ոլորտի որակը կախված է նրանից, թե տեսականորեն մշակված մաթեմատիկական մոդելները որքանով են համաձայն կրկնվող փորձերի արդյունքների հետ։ Տեսական գործընթացների և փորձարարական չափումների միջև համաձայնության բացակայությունը հաճախ հանգեցնում է կարևոր առաջընթացի, քանի որ ավելի լավ տեսություններ են մշակվում:

Ֆիզիկական գիտություններում ավանդական մաթեմատիկական մոդելը պարունակում է մեծ թվով հետևյալ տարրերը՝

  • Վերահսկիչ հավասարումներ։
  • Լրացուցիչ ենթամոդելներ.
  • Սահմանել հավասարումներ։
  • Բաղադրիչ հավասարումներ.
  • Ենթադրություններ և սահմանափակումներ.
  • Սկզբնական և սահմանային պայմաններ.
  • Դասական սահմանափակումներ և կինեմատիկական հավասարումներ:

Բանաձև

Վիճակագրական մոդելը, որպես կանոն, սահմանվում է մաթեմատիկական հավասարումներով, որոնք միավորում են մեկ կամ մի քանի պատահական փոփոխականներ և, հնարավոր է, բնական այլ փոփոխականներ: Նմանապես, պրոյեկցիան համարվում է «հայեցակարգի պաշտոնական հայեցակարգ»:

Բոլոր վիճակագրական հիպոթեզների փորձարկումները և վիճակագրական գնահատումները ստացվել են մաթեմատիկական մոդելներից:

Ներածություն

վիճակագրական մաթեմատիկական մոդելներ
վիճակագրական մաթեմատիկական մոդելներ

Ոչ ֆորմալ կերպով վիճակագրական մոդելը կարող է դիտվել որպես ենթադրություն (կամ ենթադրությունների հավաքածու) որոշակի հատկությամբ. այն թույլ է տալիս հաշվարկել ցանկացած իրադարձության հավանականությունը: Որպես օրինակ, դիտարկեք մի զույգ սովորական վեցակողմ զառեր: Ոսկրածուծի վերաբերյալ երկու տարբեր վիճակագրական ենթադրություններ պետք է ուսումնասիրվեն։

Առաջին ենթադրությունն է.

Զառերից յուրաքանչյուրի համար թվերից մեկը (1, 2, 3, 4, 5 և 6) ստանալու հավանականությունը հետևյալն է՝ 1/6։

Այս ենթադրությունից մենք կարող ենք հաշվարկել երկու զառերի հավանականությունը՝ 1:1/6×1/6=1/36:

Ավելի ընդհանուր առմամբ, դուք կարող եք հաշվարկել ցանկացած իրադարձության հավանականությունը: Այնուամենայնիվ, պետք է հասկանալ, որ անհնար է հաշվարկել որևէ այլ ոչ տրիվիալ իրադարձության հավանականությունը։

Միայն առաջին կարծիքը հավաքում է վիճակագրական մաթեմատիկական մոդել՝ պայմանավորված այն հանգամանքով, որ միայն մեկ ենթադրությամբ է հնարավոր որոշել յուրաքանչյուր գործողության հավանականությունը։

Վերոնշյալ նմուշում նախնական թույլտվությամբ հեշտ է որոշել իրադարձության հնարավորությունը: Որոշ այլ օրինակներով հաշվարկը կարող է լինել դժվար կամ նույնիսկ անիրատեսական (օրինակ, այն կարող է պահանջել երկար տարիների հաշվարկներ): Վիճակագրական վերլուծության մոդել նախագծող անձի համար նման բարդությունը համարվում է անընդունելի. հաշվարկների իրականացումը չպետք է լինի գործնականում անհնարին և տեսականորեն անհնարին:

Պաշտոնական սահմանում

Մաթեմատիկական առումով համակարգի վիճակագրական մոդելը սովորաբար դիտարկվում է որպես զույգ (S, P), որտեղ S-ն է.հնարավոր դիտարկումների բազմությունը, այսինքն՝ նմուշի տարածությունը, իսկ P-ն S.

-ի վրա հավանականության բաշխումների բազմությունն է

Այս սահմանման ինտուիցիան հետևյալն է. Ենթադրվում է, որ կա հավանականության «ճշմարիտ» բաշխում, որը պայմանավորված է որոշակի տվյալներ գեներացնող գործընթացով։

Սահմանել

Նա է որոշում մոդելի պարամետրերը։ Պարամետրիզացիան սովորաբար պահանջում է տարբեր արժեքներ՝ տարբեր բաշխումներ ստանալու համար, այսինքն՝

Մոդելային հետևանք
Մոդելային հետևանք

պետք է պահվի (այլ կերպ ասած, այն պետք է լինի ներարկային): Պարամետրիզացիան, որը համապատասխանում է պահանջին, համարվում է նույնականացնելի:

Օրինակ

Վիճակագրության գրաֆիկ
Վիճակագրության գրաֆիկ

Ենթադրենք, որ կան որոշ թվով ուսանողներ, ովքեր տարբեր տարիքի են: Երեխայի հասակը պատահականորեն կապված կլինի ծննդյան տարեթվի հետ. օրինակ, երբ դպրոցականը 7 տարեկան է, դա ազդում է աճի հավանականության վրա, միայն այն դեպքում, որ մարդը լինի 3 սանտիմետրից բարձր:

Դուք կարող եք այս մոտեցումը ձևակերպել ուղիղ գծով ռեգրեսիոն մոդելի մեջ, օրինակ՝ հետևյալ կերպ՝ բարձրություն i=b 0 + b 1agei + εi, որտեղ b 0 խաչմերուկն է, b 1 այն պարամետրն է, որով տարիքը բազմապատկվում է բարձրության մոնիտորինգ ստանալու ժամանակ: Սա սխալ տերմին է: Այսինքն՝ ենթադրում է, որ հասակը գուշակվում է տարիքով որոշակի սխալով։

Վավեր ձևը պետք է համապատասխանի բոլոր տեղեկատվական կետերին: Այսպիսով, ուղղագիծ ուղղությունը (մակարդակ i=b 0 + b 1agei) ի վիճակի չէ լինել տվյալների մոդելի հավասարում, եթե այն հստակ չի պատասխանում բացարձակապես բոլոր կետերին: այսինքնառանց բացառության, բոլոր տեղեկությունները անթերի են գտնվում գծի վրա: Էi սխալի սահմանը պետք է մուտքագրվի հավասարման մեջ, որպեսզի ձևը համապատասխանի տեղեկատվության բացարձակապես բոլոր կետերին:

Վիճակագրական եզրակացություն անելու համար մենք նախ պետք է ենթադրենք ε i-ի հավանականության որոշ բաշխումներ: Օրինակ, կարելի է ենթադրել, որ ε i-ի բաշխումները ունեն զրոյական միջինով գաուսյան ձև: Այս դեպքում մոդելը կունենա 3 պարամետր՝ b 0, b 1 և Գաուսի բաշխման շեղումը։

Դուք կարող եք պաշտոնապես նշել մոդելը որպես (S, P):

Այս օրինակում մոդելը սահմանվում է՝ նշելով S-ը, ուստի որոշ ենթադրություններ կարելի է անել P-ի վերաբերյալ: Երկու տարբերակ կա՝

Այս աճը կարող է մոտավորվել տարիքի գծային ֆունկցիայով;

Որ մոտավորության սխալները բաշխված են ինչպես Գաուսի ներսում:

Ընդհանուր դիտողություններ

Մոդելների վիճակագրական պարամետրերը մաթեմատիկական պրոյեկցիայի հատուկ դաս են: Ինչո՞վ է տարբերվում մի տեսակը մյուսից: Այսպիսով, վիճակագրական մոդելը ոչ դետերմինիստական է: Այսպիսով, դրանում, ի տարբերություն մաթեմատիկական հավասարումների, որոշ փոփոխականներ չունեն որոշակի արժեքներ, փոխարենը ունեն հնարավորությունների բաշխում։ Այսինքն՝ առանձին փոփոխականները համարվում են ստոխաստիկ։ Վերոնշյալ օրինակում ε-ը ստոխաստիկ փոփոխական է: Առանց դրա, կանխատեսումը կլինի դետերմինիստական:

Վիճակագրական մոդելի կառուցումը հաճախ օգտագործվում է, նույնիսկ եթե նյութական գործընթացը համարվում է դետերմինիստական: Օրինակ, մետաղադրամներ նետելը, սկզբունքորեն, կանխորոշող գործողություն է:Այնուամենայնիվ, սա դեռ շատ դեպքերում մոդելավորվում է որպես ստոխաստիկ (Բեռնուլիի գործընթացի միջոցով):

Ըստ Կոնիշիի և Կիտագավայի, վիճակագրական մոդելի համար կա երեք նպատակ.

  • Կանխատեսումներ.
  • Տեղեկատվության հանքարդյունաբերություն.
  • Ստոխաստիկ կառուցվածքների նկարագրություն.

Պրոեկցիոն չափ

Ենթադրենք, որ կա վիճակագրական կանխատեսման մոդել, Մոդելը կոչվում է պարամետրային, եթե O-ն ունի վերջավոր չափ: Լուծման մեջ դուք պետք է գրեք, որ

Մոդելի տարբերություն
Մոդելի տարբերություն

որտեղ k-ն դրական ամբողջ թիվ է (R նշանակում է ցանկացած իրական թվեր): Այստեղ k-ն կոչվում է մոդելի չափ:

Որպես օրինակ, մենք կարող ենք ենթադրել, որ բոլոր տվյալները գալիս են Գաուսի միակողմանի բաշխումից.

Վիճակագրության բանաձև
Վիճակագրության բանաձև

Այս օրինակում k-ի չափը 2 է:

Եվ որպես մեկ այլ օրինակ, կարելի է ենթադրել, որ տվյալները բաղկացած են (x, y) կետերից, որոնք ենթադրվում է, որ բաշխված են ուղիղ գծով Գաուսի մնացորդներով (զրոյական միջինով): Այնուհետև վիճակագրական տնտեսական մոդելի չափը հավասար է 3-ի՝ գծի հատումը, դրա թեքությունը և մնացորդների բաշխման շեղումը: Հարկ է նշել, որ երկրաչափության մեջ ուղիղ գիծը ունի 1 չափս։

Չնայած վերը նշված արժեքը տեխնիկապես միակ պարամետրն է, որն ունի k չափում, այն երբեմն համարվում է, որ պարունակում է k տարբեր արժեքներ: Օրինակ, միաչափ Գաուսի բաշխման դեպքում O-ն 2 չափի միակ պարամետրն է, բայց երբեմն համարվում է, որ պարունակում է երկուանհատական պարամետր - միջին արժեք և ստանդարտ շեղում:

Վիճակագրական գործընթացի մոդելը ոչ պարամետրիկ է, եթե O-ի արժեքների բազմությունը անսահմանաչափ է: Այն նաև կիսապարամետրիկ է, եթե ունի և՛ վերջավոր, և՛ անվերջ չափերի պարամետրեր։ Ֆորմալ կերպով, եթե k-ն O-ի չափն է, իսկ n-ը՝ նմուշների թիվը, ապա կիսապարամետրիկ և ոչ պարամետրիկ մոդելներն ունեն

Մոդելային բանաձև
Մոդելային բանաձև

ապա մոդելը կիսապարամետրիկ է: Հակառակ դեպքում, պրոյեկցիան ոչ պարամետրիկ է։

Պարամետրիկ մոդելները ամենատարածված վիճակագրությունն են: Կիսապարամետրային և ոչ պարամետրային կանխատեսումների վերաբերյալ սըր Դեյվիդ Քոքսն ասաց.

«Սրանք սովորաբար ներառում են հյուսվածքի և բաշխման ձևի վերաբերյալ ամենաքիչ վարկածները, բայց ներառում են ինքնաբավության մասին հզոր տեսություններ»:

Ներդրված մոդելներ

Մի շփոթեք դրանք բազմաստիճան կանխատեսումների հետ։

Երկու վիճակագրական մոդելներ տեղադրվում են, եթե առաջինը կարող է փոխակերպվել երկրորդի՝ առաջինի պարամետրերի վրա սահմանափակումներ դնելով: Օրինակ, Գաուսի բոլոր բաշխումների բազմությունն ունի զրոյական միջին բաշխումների ներդիր բազմություն՝

Այսինքն՝ դուք պետք է սահմանափակեք միջինը բոլոր Գաուսյան բաշխումների բազմության մեջ՝ զրոյական միջինով բաշխումներ ստանալու համար: Որպես երկրորդ օրինակ՝ քառակուսի մոդելը y=b 0 + b 1 x + b 2 x 2 + ε, ε ~N (0, σ 2) ունի ներկառուցված գծային մոդել y=b 0 + b 1 x + ε, ε ~ N (0,σ 2) - այսինքն b2 պարամետրը հավասար է 0.

Այս երկու օրինակներում էլ առաջին մոդելն ավելի մեծ չափսեր ունի, քան երկրորդ մոդելը: Սա հաճախ է լինում, բայց ոչ միշտ: Մեկ այլ օրինակ է Գաուսի բաշխումների բազմությունը դրական միջինով, որն ունի 2 հարթություն։

Մոդելների համեմատություն

վիճակագրական մոդել
վիճակագրական մոդել

Ենթադրվում է, որ առկա է «ճշմարիտ» հավանականության բաշխում, որի հիմքում ընկած է դիտարկված տվյալները, որոնք առաջացրել են դրանք առաջացնող գործընթացով:

Եվ նաև մոդելները կարելի է համեմատել միմյանց հետ՝ օգտագործելով հետախուզական վերլուծություն կամ հաստատում: Հետախուզական վերլուծության ժամանակ ձևակերպվում են տարբեր մոդելներ և գնահատվում է, թե դրանցից յուրաքանչյուրը որքան լավ է նկարագրում տվյալները: Հաստատող վերլուծության ժամանակ նախկինում ձևակերպված վարկածը համեմատվում է սկզբնականի հետ: Դրա ընդհանուր չափանիշները ներառում են P 2, Բայեսյան գործոն և հարաբերական հավանականություն:

Կոնիշիի և Կիտագավայի միտքը

«Վիճակագրական մաթեմատիկական մոդելի խնդիրների մեծ մասը կարելի է դիտարկել որպես կանխատեսող հարցեր: Դրանք սովորաբար ձևակերպվում են որպես մի քանի գործոնների համեմատություններ»:

Ավելին, սըր Դեյվիդ Քոքսն ասաց. «Որպես թեմայից թարգմանություն, վիճակագրական մոդելի խնդիրը հաճախ վերլուծության ամենակարևոր մասն է»:

Խորհուրդ ենք տալիս: