Բազմաչափ մասշտաբավորում. սահմանում, նպատակներ, նպատակներ և օրինակ

Բովանդակություն:

Բազմաչափ մասշտաբավորում. սահմանում, նպատակներ, նպատակներ և օրինակ
Բազմաչափ մասշտաբավորում. սահմանում, նպատակներ, նպատակներ և օրինակ
Anonim

Բազմաչափ մասշտաբավորումը (MDS) գործիք է տվյալների հավաքածուում առանձին դեպքերի նմանության մակարդակը պատկերացնելու համար: Այն վերաբերում է մի շարք հարակից դասակարգման մեթոդների, որոնք օգտագործվում են տեղեկատվության վիզուալիզացիայի համար, մասնավորապես՝ ցուցադրելու հեռավորության մատրիցում պարունակվող տեղեկատվությունը: Սա չափումների ոչ գծային կրճատման ձև է: MDS ալգորիթմը նպատակ ունի յուրաքանչյուր օբյեկտ տեղադրել N-չափ տարածության մեջ այնպես, որ օբյեկտների միջև եղած հեռավորությունները հնարավորինս լավ պահպանվեն: Այնուհետև յուրաքանչյուր օբյեկտի կոորդինատներ են նշանակվում N չափումներից յուրաքանչյուրում:

MDS գրաֆիկի չափսերի թիվը կարող է գերազանցել 2-ը և նշված է a priori: Ընտրելով N=2 օպտիմիզացնում է օբյեկտների տեղադրումը 2D ցրման համար: Հոդվածի նկարներում կարող եք տեսնել բազմաչափ մասշտաբի օրինակներ։ Ռուսերենով խորհրդանիշներով օրինակները հատկապես պատկերավոր են։

Բազմաչափ մասշտաբավորում
Բազմաչափ մասշտաբավորում

Էություն

Բազմաչափ մասշտաբավորման մեթոդ (MMS,MDS) դասական գործիքների ընդլայնված հավաքածու է, որն ընդհանրացնում է օպտիմիզացման ընթացակարգը կորստի ֆունկցիաների և հայտնի հեռավորությունների մուտքային մատրիցների մի շարք կշիռներով և այլն: Այս համատեքստում կորստի օգտակար ֆունկցիան կոչվում է սթրես, որը հաճախ նվազագույնի է հասցվում սթրեսի մեծացում կոչվող ընթացակարգով:

Ձեռնարկ

Բազմաչափ մասշտաբավորման մի քանի տարբերակներ կան: MDS ծրագրերն ինքնաբերաբար նվազագույնի են հասցնում բեռը՝ լուծում ստանալու համար: Ոչ մետրային MDS ալգորիթմի առանցքը երկակի օպտիմալացման գործընթացն է: Նախ, պետք է գտնել օպտիմալ միատոն հարևանության փոխակերպումը: Երկրորդ, կոնֆիգուրացիայի կետերը պետք է օպտիմալ դիրքավորվեն այնպես, որ դրանց հեռավորությունները հնարավորինս մոտենան չափված հարևանության արժեքներին:

Բազմաչափ մասշտաբի օրինակ
Բազմաչափ մասշտաբի օրինակ

Էքսպանսիա

Մետրական բազմաչափ մասշտաբի ընդլայնում վիճակագրության մեջ, որտեղ թիրախային տարածությունը կամայական հարթ ոչ էվկլիդյան տարածություն է: Այնտեղ, որտեղ տարբերությունները մակերեսի վրա հեռավորություններ են, իսկ թիրախային տարածությունը տարբեր մակերես է: Թեմատիկ ծրագրերը թույլ են տալիս գտնել կցորդ՝ մի մակերևույթի մյուս մակերեսի նվազագույն աղավաղմամբ:

Քայլեր

Կա մի քանի քայլ ուսումնասիրություն իրականացնելու համար՝ օգտագործելով բազմաչափ սանդղակ.

  1. Խնդրի ձևակերպում. Ի՞նչ փոփոխականներ եք ուզում համեմատել: Քանի՞ փոփոխական եք ուզում համեմատել: Ի՞նչ նպատակով է օգտագործվելու ուսումնասիրությունը:
  2. Մուտքային տվյալների ստացում:Հարցվողներին տրվում են մի շարք հարցեր. Յուրաքանչյուր զույգ ապրանքի համար նրանց խնդրում են գնահատել նմանությունը (սովորաբար 7 բալանոց Likert սանդղակով՝ շատ նմանից շատ տարբեր): Առաջին հարցը կարող է լինել Coca-Cola/Pepsi-ի համար, օրինակ՝ հաջորդը գարեջրի, հաջորդը՝ Dr. Pepper-ի և այլն: Հարցերի քանակը կախված է ապրանքանիշերի քանակից:
Հեռավորության մասշտաբավորում
Հեռավորության մասշտաբավորում

Այլընտրանքային մոտեցումներ

Կա ևս երկու մոտեցում. Գոյություն ունի տեխնիկա, որը կոչվում է «Ըմբռնողական տվյալներ. ստացված մոտեցում», որտեղ արտադրանքները տարրալուծվում են ատրիբուտների և գնահատումը կատարվում է իմաստային դիֆերենցիալ մասշտաբով: Մեկ այլ մեթոդ «նախապատվության տվյալների մոտեցումն» է, որտեղ հարցվողներին հարցնում են նախապատվությունների, այլ ոչ թե նմանությունների մասին:

Այն բաղկացած է հետևյալ քայլերից.

  1. ՄԴՍ վիճակագրական ծրագրի գործարկում. Ընթացակարգն իրականացնելու համար նախատեսված ծրագրակազմը հասանելի է բազմաթիվ վիճակագրական ծրագրային փաթեթներում: Հաճախ կա ընտրություն մետրային MDS-ի (որը վերաբերում է միջակայքի կամ հարաբերակցության մակարդակի տվյալներին) և ոչ մետրիկ MDS-ին (որը վերաբերում է հերթական տվյալներին):
  2. Չափումների քանակի որոշում. Հետազոտողը պետք է որոշի այն չափումների քանակը, որոնք նա ցանկանում է ստեղծել համակարգչում: Որքան շատ չափումներ լինեն, այնքան ավելի լավ կլինի վիճակագրական համապատասխանությունը, բայց այնքան ավելի դժվար է արդյունքների մեկնաբանումը:
  3. Ցուցադրել արդյունքները և սահմանել չափումներ. վիճակագրական ծրագիրը (կամ հարակից մոդուլը) ցույց կտա արդյունքները: Քարտեզը կցուցադրի յուրաքանչյուր ապրանք (սովորաբար 2D):տարածություն): Ապրանքների միմյանց մոտ լինելը ցույց է տալիս դրանց նմանությունը կամ նախապատվությունը՝ կախված նրանից, թե որ մոտեցումն է կիրառվել։ Այնուամենայնիվ, միշտ չէ, որ պարզ է, թե իրականում ինչպես են չափումները համապատասխանում համակարգի վարքագծի չափումներին: Այստեղ կարելի է համապատասխանության սուբյեկտիվ դատողություն անել:
  4. Ստուգեք արդյունքները հուսալիության և վավերականության համար. հաշվարկեք R-քառակուսիը՝ որոշելու մասշտաբային տվյալների շեղումների մասնաբաժինը, որը կարող է հաշվառվել MDS ընթացակարգով: Քառակուսի R 0.6 համարվում է նվազագույն ընդունելի մակարդակ: R քառակուսի 0.8-ը համարվում է լավ մետրային մասշտաբավորման համար, մինչդեռ 0.9-ը համարվում է լավ ոչ մետրական մասշտաբավորման համար:
Բազմաչափ սանդղակի արդյունքներ
Բազմաչափ սանդղակի արդյունքներ

Տարբեր թեստեր

Մյուս հնարավոր թեստերն են Կրուսկալի տիպի սթրես-թեստերը, տվյալների բաժանման թեստերը, տվյալների կայունության թեստերը և վերստուգման հուսալիության թեստերը: Թեստի արդյունքների մասին մանրամասն գրեք։ Քարտեզագրման հետ մեկտեղ պետք է նշվի առնվազն հեռավորության չափը (օրինակ՝ Սորենսոնի ինդեքսը, Ջակարդի ինդեքսը) և հուսալիությունը (օրինակ՝ լարվածության արժեքը):

Խիստ ցանկալի է նաև տալ ալգորիթմ (օրինակ՝ Kruskal, Mather), որը հաճախ որոշվում է օգտագործվող ծրագրով (երբեմն փոխարինում է ալգորիթմի զեկույցին), եթե դուք տվել եք մեկնարկային կազմաձև կամ ունեցել եք պատահական ընտրություն, համար։ չափման վազքների, Մոնտե Կառլոյի արդյունքների, կրկնությունների քանակի, կայունության միավորի և յուրաքանչյուր առանցքի համաչափ շեղումների (r-քառակուսի):

Վիզուալ տեղեկատվության և տվյալների վերլուծության մեթոդբազմաչափ մասշտաբավորում

Տեղեկատվության վիզուալիզացիան վերացական տվյալների ինտերակտիվ (տեսողական) ներկայացումների ուսումնասիրությունն է՝ մարդու ճանաչողությունը բարձրացնելու համար: Վերացական տվյալները ներառում են ինչպես թվային, այնպես էլ ոչ թվային տվյալներ, ինչպիսիք են տեքստային և աշխարհագրական տեղեկատվությունը: Այնուամենայնիվ, տեղեկատվության վիզուալիզացիան տարբերվում է գիտական պատկերացումից. «այն տեղեկատվական է (տեղեկատվական պատկերացում), երբ ընտրվում է տարածական ներկայացում, և scivis (գիտական պատկերացում), երբ տրվում է տարածական ներկայացում»:

:

Տեղեկատվության վիզուալիզացիայի ոլորտն առաջացել է մարդ-համակարգիչ փոխազդեցության, համակարգչային գիտության հավելվածների, գրաֆիկայի, տեսողական դիզայնի, հոգեբանության և բիզնես մեթոդների հետազոտություններից: Այն ավելի ու ավելի է օգտագործվում որպես գիտական հետազոտությունների, թվային գրադարանների, տվյալների արդյունահանման, ֆինանսական տվյալների, շուկայի հետազոտության, արտադրության վերահսկման և այլնի էական բաղադրիչ:

Մեթոդներ և սկզբունքներ

Տեղեկատվության վիզուալիզացիան ենթադրում է, որ վիզուալիզացիայի և փոխազդեցության մեթոդներն օգտվում են մարդու ընկալման հարստությունից՝ թույլ տալով օգտվողներին միաժամանակ տեսնել, ուսումնասիրել և հասկանալ մեծ քանակությամբ տեղեկատվություն: Տեղեկատվության վիզուալիզացիան նպատակ ունի ինտուիտիվ ձևով վերացական տվյալների, տեղեկատվության փոխանցման մոտեցումներ ստեղծել:

Գունավոր բազմաչափ մասշտաբավորում
Գունավոր բազմաչափ մասշտաբավորում

Տվյալների վերլուծությունը արդյունաբերության մեջ բոլոր կիրառական հետազոտությունների և խնդիրների լուծման անբաժանելի մասն է: Մեծ մասըՏվյալների վերլուծության հիմնական մոտեցումներն են վիզուալիզացիան (հիստոգրամաներ, ցրման գծապատկերներ, մակերևութային գծապատկերներ, ծառերի քարտեզներ, զուգահեռ կոորդինատային գծապատկերներ և այլն), վիճակագրություն (հիպոթեզի փորձարկում, ռեգրեսիա, PCA և այլն), տվյալների վերլուծություն (համապատասխանեցում և այլն):.d.) և մեքենայական ուսուցման մեթոդներ (կլաստերավորում, դասակարգում, որոշումների ծառեր և այլն):

Այս մոտեցումներից տեղեկատվության վիզուալիզացիան կամ տեսողական տվյալների վերլուծությունը ամենից շատ կախված է վերլուծական անձնակազմի ճանաչողական հմտություններից և թույլ է տալիս բացահայտել չկառուցված գործող պատկերացումներ, որոնք սահմանափակված են միայն մարդկային երևակայությամբ և ստեղծագործական ունակություններով: Վերլուծաբանին պետք չէ որևէ բարդ տեխնիկա սովորել, որպեսզի կարողանա մեկնաբանել տվյալների վիզուալիզացիաները: Տեղեկատվության վիզուալիզացիան նաև հիպոթեզների ստեղծման սխեմա է, որը կարող է և սովորաբար ուղեկցվում է ավելի վերլուծական կամ պաշտոնական վերլուծություններով, ինչպիսիք են վիճակագրական հիպոթեզների փորձարկումը:

Ուսումնառություն

Վիզուալիզացիայի ժամանակակից ուսումնասիրությունը սկսվեց համակարգչային գրաֆիկայից, որն «ի սկզբանե օգտագործվել է գիտական խնդիրների ուսումնասիրության համար: Այնուամենայնիվ, վաղ տարիներին գրաֆիկական ուժի բացակայությունը հաճախ սահմանափակում էր դրա օգտակարությունը: Սկսվեց վիզուալիզացիայի առաջնահերթությունը: Զարգանալու համար 1987 թվականին՝ համակարգչային գրաֆիկայի և գիտական հաշվողականության մեջ վիզուալիզացիայի համար հատուկ ծրագրաշարի թողարկմամբ: Այդ ժամանակից ի վեր, IEEE Computer Society-ի և ACM SIGGRAPH-ի կողմից համատեղ կազմակերպվել են մի քանի կոնֆերանսներ և աշխատաժողովներ:

:

Նրանք լուսաբանեցին տվյալների վիզուալիզացիայի, տեղեկատվության վիզուալիզացիայի և գիտական պատկերացման ընդհանուր թեմաները,ինչպես նաև ավելի կոնկրետ ոլորտներ, ինչպիսիք են ծավալի արտաբերումը:

Բրենդի բազմաչափ մասշտաբավորում
Բրենդի բազմաչափ մասշտաբավորում

Ամփոփում

Ընդհանրացված բազմաչափ մասշտաբը (GMDS) մետրային բազմաչափ մասշտաբի ընդլայնումն է, որում թիրախային տարածքը ոչ էվկլիդյան է: Երբ տարբերությունները մակերեսի վրա հեռավորություններ են, իսկ թիրախային տարածությունը մեկ այլ մակերես է, GMDS-ը թույլ է տալիս նվազագույն աղավաղմամբ գտնել մի մակերեսի բույնը մյուսի մեջ:

GMDS-ը հետազոտության նոր գիծ է: Ներկայումս հիմնական հավելվածներն են դեֆորմացվող օբյեկտների ճանաչումը (օրինակ՝ դեմքի 3D ճանաչման համար) և հյուսվածքների քարտեզագրումը։

Բազմաչափ մասշտաբավորման նպատակը բազմաչափ տվյալների ներկայացումն է: Բազմաչափ տվյալները, այսինքն՝ այն տվյալները, որոնց ներկայացման համար պահանջվում են ավելի քան երկու կամ երեք չափումներ, կարող են դժվար լինել մեկնաբանել: Պարզեցման մոտեցումներից մեկն այն է, որ ենթադրենք, որ հետաքրքրություն ներկայացնող տվյալները գտնվում են ներկառուցված ոչ գծային բազմազանության վրա՝ մեծ չափերի տարածության մեջ: Եթե կոլեկցիոներն ունի բավականաչափ ցածր չափսեր, ապա տվյալները կարող են արտացոլվել ցածրաչափ տարածության մեջ:

Ոչ գծային չափերի կրճատման մեթոդներից շատերը կապված են գծային մեթոդների հետ: Ոչ գծային մեթոդները կարելի է լայնորեն դասակարգել երկու խմբի՝ նրանք, որոնք ապահովում են քարտեզագրում (կամ բարձրաչափ տարածությունից մինչև ցածրաչափ ներկառուցում, կամ հակառակը), և նրանք, որոնք պարզապես ապահովում են վիզուալիզացիա։ Մեքենայի ուսուցման համատեքստում քարտեզագրման մեթոդները կարող են դիտվել որպեսհատկանիշի արդյունահանման նախնական փուլ, որից հետո կիրառվում են օրինաչափությունների ճանաչման ալգորիթմները: Սովորաբար նրանք, որոնք պարզապես վիզուալիզացիաներ են տալիս, հիմնված են մոտիկության տվյալների վրա, այսինքն՝ հեռավորության չափումների վրա: Բազմաչափ մասշտաբը նույնպես բավականին տարածված է հոգեբանության և այլ հումանիտար գիտությունների մեջ:

Անկյունագծային բազմաչափ մասշտաբավորում
Անկյունագծային բազմաչափ մասշտաբավորում

Եթե ատրիբուտների թիվը մեծ է, ապա եզակի հնարավոր տողերի տարածությունը նույնպես էքսպոնենցիալ մեծ է: Այսպիսով, որքան մեծ է չափսը, այնքան ավելի դժվար է դառնում պատկերել տարածությունը: Սա շատ խնդիրներ է առաջացնում։ Ալգորիթմները, որոնք գործում են բարձրաչափ տվյալների վրա, հակված են շատ բարձր ժամանակային բարդության: Տվյալների ավելի քիչ չափերի կրճատումը հաճախ վերլուծության ալգորիթմներն ավելի արդյունավետ է դարձնում և կարող է օգնել մեքենայական ուսուցման ալգորիթմներին ավելի ճշգրիտ կանխատեսումներ անել: Ահա թե ինչու է տվյալների բազմաչափ մասշտաբավորումն այդքան տարածված:

Խորհուրդ ենք տալիս: