Վիճակագրական տեղեկատվություն՝ հավաքագրում, մշակում, վերլուծություն

Բովանդակություն:

Վիճակագրական տեղեկատվություն՝ հավաքագրում, մշակում, վերլուծություն
Վիճակագրական տեղեկատվություն՝ հավաքագրում, մշակում, վերլուծություն
Anonim

Վիճակագրության պատմության ընթացքում տարբեր փորձեր են արվել ստեղծելու չափումների մակարդակների տաքսոնոմիա: Հոգեֆիզիկոս Սթենլի Սմիթ Սթիվենսը սահմանել է անվանական, շարքային, միջակայքային և համամասնական սանդղակներ:

Անվանական չափումները չունեն արժեքների դասակարգման զգալի դասակարգում և թույլ են տալիս ցանկացած փոխարկում:

Կանոնավոր չափերն ունեն անճշգրիտ տարբերություններ հաջորդական արժեքների միջև, բայց ունեն այդ արժեքների որոշակի կարգ և թույլ են տալիս ցանկացած կարգի փոխակերպում:

Ինտերվալային չափումները ունեն նշանակալից հեռավորություններ կետերի միջև, սակայն զրոյական արժեքը կամայական է (ինչպես երկայնության և ջերմաստիճանի չափումների դեպքում Ցելսիուսով կամ Ֆարենհայթով) և թույլ է տալիս ցանկացած գծային փոխակերպում:

Հարաբերակցության չափերն ունեն և՛ իմաստալից զրոյական արժեք, և՛ տարբեր չափերի միջև եղած հեռավորությունները և թույլ են տալիս ցանկացած մասշտաբային փոխակերպում:

Image
Image

Փոփոխականներ և տեղեկատվության դասակարգում

Որովհետև փոփոխականներըՄիայն անվանական կամ հերթական չափումներին համապատասխանող չափումները չեն կարող ողջամտորեն չափվել թվային եղանակով և երբեմն խմբավորվում են որպես դասակարգային փոփոխականներ: Հարաբերակցությունը և միջակայքի չափումները խմբավորվում են որպես քանակական փոփոխականներ, որոնք կարող են լինել կամ դիսկրետ կամ շարունակական՝ պայմանավորված իրենց թվային բնույթով: Նման տարբերությունները հաճախ թույլ են առնչվում համակարգչային գիտության տվյալների տիպի հետ, քանի որ երկատև դասակարգային փոփոխականները կարող են ներկայացվել բուլյան արժեքներով, բազմատոմ դասակարգային փոփոխականներով կամայական ամբողջ թվերով ինտեգրալ տվյալների տիպում և շարունակական փոփոխականներով իրական բաղադրիչներով, որոնք ներառում են լողացող կետի հաշվարկ: Սակայն վիճակագրական տեղեկատվության տվյալների տեսակների ցուցադրումը կախված է նրանից, թե որ դասակարգումն է կիրառվում:

Աշխատողների վիճակագրական տեղեկատվություն
Աշխատողների վիճակագրական տեղեկատվություն

Այլ դասակարգումներ

Ստեղծվել են նաև վիճակագրական տվյալների (տեղեկատվության) այլ դասակարգումներ։ Օրինակ, Mosteller-ը և Tukey-ն տարբերում էին գնահատականները, աստիճանները, հաշված բաժնետոմսերը, հաշվարկները, գումարները և մնացորդները: Նելդերը ժամանակին նկարագրել է շարունակական հաշվարկներ, շարունակական հարաբերակցություններ, հաշվարկների հարաբերակցություն և տվյալների փոխանցման կատեգորիկ եղանակներ: Այս դասակարգման բոլոր մեթոդներն օգտագործվում են վիճակագրական տեղեկատվության հավաքագրման համար:

Խնդիրներ

Հարցը, թե արդյոք նպատակահարմար է կիրառել տարբեր տեսակի վիճակագրական մեթոդներ տարբեր չափումների (հավաքման) ընթացակարգերի միջոցով ստացված տվյալների նկատմամբ, բարդանում է փոփոխականների փոխակերպման և հարցերի ճշգրիտ մեկնաբանման հետ կապված հարցերով:հետազոտություն. «Տվյալների և դրանց նկարագրածի միջև կապը պարզապես արտացոլում է այն փաստը, որ վիճակագրական հայտարարությունների որոշակի տեսակներ կարող են ունենալ ճշմարտության արժեքներ, որոնք անփոփոխ չեն որոշակի փոխակերպումների դեպքում: Արդյո՞ք փոխակերպումը արժե հաշվի առնել, կախված է այն հարցից, որին փորձում եք պատասխանել:

Վիճակագրական տեղեկատվության օրինակ
Վիճակագրական տեղեկատվության օրինակ

Ինչ է տվյալների տեսակը

Տվյալների տեսակը փոփոխականի իմաստային բովանդակության հիմնարար բաղադրիչն է և վերահսկում է, թե ինչ տեսակի հավանականության բաշխումներ կարող են տրամաբանորեն օգտագործվել փոփոխականը նկարագրելու համար, դրա վրա թույլատրված գործողությունները, այն կանխատեսելու համար օգտագործվող ռեգրեսիոն վերլուծության տեսակը: Տվյալների տիպի հայեցակարգը նման է չափման մակարդակի հայեցակարգին, բայց ավելի կոնկրետ. օրինակ՝ տվյալների հաշվումը պահանջում է այլ բաշխում (Poisson կամ երկանդամ), քան ոչ բացասական իրական արժեքների համար, բայց երկուսն էլ ընկնում են նույնի տակ։ չափման մակարդակ (գործակիցների սանդղակ).

Վիճակագրական տեղեկատվություն դատավորների մասին
Վիճակագրական տեղեկատվություն դատավորների մասին

Կշեռք

Տարբեր փորձեր են արվել վիճակագրական տեղեկատվության մշակման համար չափումների մակարդակների տաքսոնոմիա ստեղծելու համար: Հոգեֆիզիկոս Սթենլի Սմիթ Սթիվենսը սահմանել է անվանական, հերթական, միջակայքային և համամասնական սանդղակները: Անվանական չափումները արժեքների շարքում դասակարգման զգալի կարգ չունեն և թույլ են տալիս որևէ մեկից մեկ փոխակերպում: Սովորական չափումները ունեն անճշտական տարբերություններ հաջորդական արժեքների միջև, բայց տարբերվում են այդ արժեքների նշանակալի կարգով և թույլ են տալիս.ցանկացած կարգի փոխակերպում: Ինտերվալային չափումները չափումների միջև նշանակալի հեռավորություններ ունեն, բայց զրոյական արժեքը կամայական է (ինչպես երկայնության և ջերմաստիճանի չափումների դեպքում Ցելսիուսով կամ Ֆարենհայթով) և թույլ է տալիս ցանկացած գծային փոխակերպում: Հարաբերակցության չափերն ունեն և՛ նշանակալի զրոյական արժեք, և՛ տարբեր սահմանված չափումների միջև եղած հեռավորությունները և թույլ են տալիս մասշտաբային ցանկացած փոխակերպում:

Դիագրամի մոդել
Դիագրամի մոդել

Տվյալները, որոնք հնարավոր չէ նկարագրել մեկ թվի միջոցով, հաճախ ընդգրկվում են իրական պատահական փոփոխականների պատահական վեկտորներում, չնայած կա աճող միտում՝ դրանք ինքնուրույն մշակելու համար: Նման օրինակները կքննարկվեն ստորև։

Պատահական վեկտորներ

Անհատական տարրերը կարող են փոխկապակցված լինել կամ չլինել: Փոխկապակցված պատահական վեկտորները նկարագրելու համար օգտագործվող բաշխումների օրինակներ են բազմաչափ նորմալ բաշխումը և բազմաչափ t-բաշխումը: Ընդհանուր առմամբ, ցանկացած տարրի միջև կարող է լինել կամայական փոխկապակցվածություն, սակայն դա հաճախ դառնում է անկառավարելի որոշակի չափից բարձր՝ պահանջելով հավելյալ սահմանափակումներ փոխկապակցված բաղադրիչների վրա:

վիճակագրական հատկանիշներ
վիճակագրական հատկանիշներ

Պատահական մատրիցներ

Պատահական մատրիցները կարող են դասավորվել գծային և դիտարկվել որպես պատահական վեկտորներ, սակայն դա չի կարող արդյունավետ միջոց լինել տարբեր տարրերի միջև հարաբերակցությունը ներկայացնելու համար: Որոշ հավանականության բաշխումներ հատուկ նախագծված են պատահական մատրիցների համար, օրինակ՝ նորմալ մատրիցովբաշխում և Wishart բաշխում։

Պատահական հաջորդականություն

Երբեմն դրանք համարվում են նույնը, ինչ պատահական վեկտորները, բայց այլ դեպքերում տերմինը կիրառվում է հատուկ այն դեպքերի համար, երբ յուրաքանչյուր պատահական փոփոխական փոխկապակցված է միայն մոտակա փոփոխականների հետ (ինչպես Մարկովի մոդելում): Սա Բայեսյան ցանցի հատուկ դեպք է և օգտագործվում է շատ երկար հաջորդականությունների համար, ինչպիսիք են գենային շղթաները կամ երկար տեքստային փաստաթղթերը: Մի շարք մոդելներ հատուկ նախագծված են այնպիսի հաջորդականությունների համար, ինչպիսիք են թաքնված Մարկովյան հաջորդականությունները։

Տիպիկ աղյուսակ
Տիպիկ աղյուսակ

Պատահական գործընթացներ

Նման են պատահական հաջորդականություններին, բայց միայն այն դեպքում, երբ հաջորդականության երկարությունը անորոշ կամ անսահման է, և հաջորդականության տարրերը մշակվում են հերթով։ Սա հաճախ օգտագործվում է տվյալների համար, որոնք կարող են նկարագրվել որպես ժամանակային շարքեր: Սա ճիշտ է, երբ խոսքը վերաբերում է, օրինակ, բաժնետոմսերի գնին հաջորդ օրը:

Եզրակացություն

Վիճակագրական տեղեկատվության վերլուծությունն ամբողջությամբ կախված է դրա հավաքագրման որակից: Վերջինս իր հերթին խիստ կապված է իր դասակարգման հնարավորությունների հետ։ Իհարկե, կան վիճակագրական տեղեկատվության դասակարգման բազմաթիվ տեսակներ, որոնք ընթերցողը կարող էր անձամբ տեսնել այս հոդվածը կարդալիս: Այնուամենայնիվ, արդյունավետ գործիքների առկայությունը և մաթեմատիկայի լավ իմացությունը, ինչպես նաև սոցիոլոգիայի ոլորտում գիտելիքները կկատարեն իրենց գործը՝ թույլ տալով իրականացնել ցանկացած հարցում կամ ուսումնասիրություն՝ առանց սխալների էական ուղղումների: Վիճակագրական տեղեկատվության աղբյուրները ձևովմարդիկ, կազմակերպությունները և սոցիոլոգիայի այլ առարկաները, բարեբախտաբար, ներկայացված են մեծ առատությամբ։ Եվ ոչ մի դժվարություն չի կարող խանգարել իսկական հետախույզին:

Խորհուրդ ենք տալիս: