Բայեսյան ցանցեր. սահմանում, օրինակներ և ինչպես են դրանք աշխատում

Բովանդակություն:

Բայեսյան ցանցեր. սահմանում, օրինակներ և ինչպես են դրանք աշխատում
Բայեսյան ցանցեր. սահմանում, օրինակներ և ինչպես են դրանք աշխատում
Anonim

Հավատք, որոշումների ցանց, Բայեսյան (ian) մոդել կամ հավանականությամբ պայմանավորված ացիկլիկ գրաֆիկի մոդելը տարբերակային սխեմա է (վիճակագրական մոդելի տեսակ), որը ներկայացնում է փոփոխականների մի շարք և դրանց պայմանական կախվածությունները ուղղորդված ացիկլիկ գրաֆիկի (DAG) միջոցով:).

Օրինակ, Բայեսյան ցանցը կարող է ներկայացնել հիվանդությունների և ախտանիշների հավանականական հարաբերություններ: Վերջինս հաշվի առնելով՝ ցանցով կարելի է հաշվարկել տարբեր հիվանդություններ ունենալու հավանականությունը։ Ստորև բերված տեսանյութում կարող եք տեսնել Բայեսյան համոզմունքների ցանցի օրինակ՝ հաշվարկներով:

Image
Image

արդյունավետություն

Արդյունավետ ալգորիթմները կարող են եզրակացություններ անել և սովորել Բայեսյան ցանցերում: Ցանցերը, որոնք մոդելավորում են փոփոխականները (օրինակ՝ խոսքի ազդանշանները կամ սպիտակուցային հաջորդականությունները) կոչվում են դինամիկ ցանցեր։ Բայեսյան ցանցերի ընդհանրացումները, որոնք կարող են ներկայացնել և լուծել խնդիրները անորոշության պայմաններում, կոչվում են ազդեցության դիագրամներ:

Էություն

Ֆորմալ կերպովԲայեսյան ցանցերը DAG-ներ են, որոնց հանգույցները բայեսյան իմաստով ներկայացնում են փոփոխականներ. դրանք կարող են լինել դիտարկվող արժեքներ, թաքնված փոփոխականներ, անհայտ պարամետրեր կամ վարկածներ: Քանի որ շատ հետաքրքիր է։

Բայեսյան ցանցի օրինակ

Երկու իրադարձություն կարող է հանգեցնել խոտի թրջվելու՝ ակտիվ ջրցան կամ անձրև: Անձրևն ուղղակիորեն ազդում է ջրցանիչի օգտագործման վրա (մասնավորապես, երբ անձրև է գալիս, ջրցանը սովորաբար անգործուն է): Այս իրավիճակը կարելի է մոդելավորել Բայեսյան ցանցի միջոցով:

Տիպիկ բանաձեւ
Տիպիկ բանաձեւ

սիմուլյացիա

Քանի որ Բայեսյան ցանցը ամբողջական մոդել է իր փոփոխականների և դրանց փոխհարաբերությունների համար, այն կարող է օգտագործվել դրանց վերաբերյալ հավանականական հարցումներին պատասխանելու համար: Օրինակ, այն կարող է օգտագործվել փոփոխականների ենթաբազմության վիճակի մասին գիտելիքները թարմացնելու համար, երբ դիտարկվում են այլ տվյալներ (ապացույցի փոփոխականներ): Այս հետաքրքիր գործընթացը կոչվում է հավանականական եզրակացություն:

A posteriori տալիս է համընդհանուր բավարար վիճակագրություն հայտնաբերման կիրառությունների համար՝ փոփոխականների ենթաբազմության արժեքներ ընտրելիս: Այսպիսով, այս ալգորիթմը կարելի է համարել Բայսի թեորեմը բարդ խնդիրների վրա ավտոմատ կերպով կիրառելու մեխանիզմ։ Հոդվածի նկարներում կարող եք տեսնել Բայեսյան հավատքի ցանցերի օրինակներ:

Գործնական Բայեսյան ցանց
Գործնական Բայեսյան ցանց

Ելքի մեթոդներ

Ճշգրիտ եզրակացության ամենատարածված մեթոդներն են՝ փոփոխականի վերացումը, որը վերացնում է (ինտեգրման կամ գումարման միջոցով) աննկատելիըոչ հարցման պարամետրերը մեկ առ մեկ՝ գումարը հատկացնելով արտադրանքին։

Սեղմեք «ծառի» տարածումը, որը պահում է հաշվարկները, որպեսզի շատ փոփոխականներ հնարավոր լինի միանգամից հարցումներ կատարել, և նոր ապացույցները արագ տարածվել; և ռեկուրսիվ համապատասխանեցում և/կամ որոնում, որոնք թույլ են տալիս փոխզիջումներ տարածության և ժամանակի միջև և համապատասխանում են փոփոխականների վերացման արդյունավետությանը, երբ օգտագործվում է բավարար տարածություն:

Այս բոլոր մեթոդներն ունեն հատուկ բարդություն, որը կախված է ցանցի երկարությունից: Ամենատարածված մոտավոր եզրակացության ալգորիթմներն են մինի հատվածի վերացումը, ցիկլային համոզմունքների տարածումը, ընդհանրացված համոզմունքների տարածումը և փոփոխական մեթոդները:

Ցանցերի տեսակները
Ցանցերի տեսակները

Ցանցային

Բայեսյան ցանցն ամբողջությամբ ճշտելու և այդպիսով համատեղ հավանականության բաշխումը ամբողջությամբ ներկայացնելու համար անհրաժեշտ է յուրաքանչյուր X հանգույցի համար նշել հավանականության բաշխումը X-ի համար՝ կապված X-ի ծնողների հետ:

X-ի պայմանական բաշխումը նրա ծնողների կողմից կարող է ունենալ ցանկացած ձև: Տարածված է աշխատել դիսկրետ կամ գաուսյան բաշխումների հետ, քանի որ դա հեշտացնում է հաշվարկները: Երբեմն հայտնի են միայն բաշխման սահմանափակումները: Այնուհետև դուք կարող եք օգտագործել էնտրոպիան՝ որոշելու առանձին բաշխումը, որն ունի ամենաբարձր էնտրոպիան՝ հաշվի առնելով սահմանափակումները:

Նմանապես, դինամիկ բայեսյան ցանցի հատուկ համատեքստում լատենտի ժամանակավոր էվոլյուցիայի պայմանական բաշխումըվիճակը սովորաբար սահմանվում է ենթադրվող պատահական գործընթացի էնտրոպիայի արագությունը առավելագույնի հասցնելու համար:

Վստահության բայեսյան ցանց
Վստահության բայեսյան ցանց

Հավանականությունը (կամ հետին հավանականությունը) ուղղակիորեն առավելագույնի հասցնելը հաճախ բարդ է՝ հաշվի առնելով չդիտարկվող փոփոխականների առկայությունը: Սա հատկապես ճիշտ է Բայեսյան որոշումների ցանցի համար:

Դասական մոտեցում

Այս խնդրի դասական մոտեցումը ակնկալիքների մաքսիմալացման ալգորիթմն է, որը փոխարինում է չդիտարկվող փոփոխականների ակնկալվող արժեքները՝ կախված դիտարկված տվյալներից՝ առավելագույնի հասցնելով ընդհանուր հավանականությունը (կամ հետին արժեքը), ենթադրելով, որ նախկինում հաշվարկված ակնկալվողը։ արժեքները ճիշտ են. Չափավոր օրինաչափության պայմաններում այս պրոցեսը զուգակցվում է պարամետրերի առավելագույն (կամ առավելագույնը a posteriori) արժեքներում:

Պարամետրերի նկատմամբ ավելի ամբողջական Բայեսյան մոտեցում է դրանք դիտարկել որպես լրացուցիչ չդիտարկվող փոփոխականներ և հաշվարկել հետին լրիվ բաշխումը բոլոր հանգույցների վրա՝ հաշվի առնելով դիտարկված տվյալները, և այնուհետև ինտեգրել պարամետրերը: Այս մոտեցումը կարող է ծախսատար լինել և հանգեցնել մեծ մոդելների՝ դասական պարամետրերի թյունինգի մոտեցումները դարձնելով ավելի մատչելի:

Ամենապարզ դեպքում Բայեսյան ցանցը սահմանվում է փորձագետի կողմից և այնուհետև օգտագործվում է եզրակացություն կատարելու համար: Այլ կիրառություններում որոշելու խնդիրը չափազանց դժվար է մարդու համար: Այս դեպքում տվյալների մեջ պետք է սովորել Բայեսյան նեյրոնային ցանցի կառուցվածքը և տեղական բաշխման պարամետրերը։

Բայեսյան ցանցեր
Բայեսյան ցանցեր

Այլընտրանքային մեթոդ

Կառուցվածքային ուսուցման այլընտրանքային մեթոդն օգտագործում է օպտիմալացման որոնում: Սա պահանջում է գնահատման գործառույթի և որոնման ռազմավարության կիրառում: Ընդհանուր գնահատման ալգորիթմը վերապատրաստման տվյալների տրված կառուցվածքի հետին հավանականությունն է, ինչպիսիք են BIC կամ BDeu:

Հաշվառական որոնման համար պահանջվող ժամանակը, որը վերադարձնում է միավորը առավելագույնի հասցնելու կառուցվածքը, փոփոխականների քանակով գերէքսպոնենցիալ է: Տեղական որոնման ռազմավարությունը աստիճանաբար փոփոխություններ է կատարում կառուցվածքի գնահատումը բարելավելու համար: Ֆրիդմանը և նրա գործընկերները քննարկեցին փոփոխականների միջև փոխադարձ տեղեկատվության օգտագործումը ցանկալի կառուցվածքը գտնելու համար: Նրանք սահմանափակում են ծնող թեկնածուների շարքը k հանգույցներով և մանրակրկիտ որոնում են դրանք:

BN ճշգրիտ ուսումնասիրության հատկապես արագ մեթոդ է խնդիրը պատկերացնել որպես օպտիմալացման խնդիր և լուծել այն՝ օգտագործելով ամբողջ թվային ծրագրավորում: Ամբողջ թվային ծրագրին (IP) ավելացվում են ցիկլիկության սահմանափակումներ՝ լուծույթի ընթացքում կտրող հարթությունների տեսքով: Նման մեթոդը կարող է լուծել մինչև 100 փոփոխական խնդիրներ:

Գրաֆիկներ և ցանցեր
Գրաֆիկներ և ցանցեր

Խնդրի լուծում

Հազարավոր փոփոխականներով խնդիրներ լուծելու համար անհրաժեշտ է այլ մոտեցում: Մեկն այն է, որ սկզբում ընտրել մեկ պատվեր, ապա գտնել օպտիմալ BN կառուցվածքը այդ կարգի նկատմամբ: Սա ենթադրում է աշխատել հնարավոր պատվերի որոնման տարածքում, որը հարմար է, քանի որ այն ավելի փոքր է, քան ցանցային կառույցների տարածքը: Այնուհետև ընտրվում և գնահատվում են մի քանի պատվերներ: Այս մեթոդը պարզվեցլավագույնը հասանելի գրականության մեջ, երբ փոփոխականների թիվը հսկայական է:

Մյուս մեթոդը կենտրոնանալն է քայքայվող մոդելների ենթադասերի վրա, որոնց համար MLE-ները փակ են: Այնուհետև կարող եք գտնել հարյուրավոր փոփոխականների հետևողական կառուցվածք:

Երեք տողերի սահմանափակ լայնությամբ բայեսյան ցանցերի ուսումնասիրությունը անհրաժեշտ է ճշգրիտ, մեկնաբանելի եզրակացություն ապահովելու համար, քանի որ վերջիններիս ամենավատ բարդությունը էքսպոնենցիալ է ծառի երկարությամբ k (ըստ էքսպոնենցիալ ժամանակի վարկածի): Այնուամենայնիվ, որպես գրաֆիկի գլոբալ հատկություն, այն մեծապես մեծացնում է ուսուցման գործընթացի բարդությունը: Այս համատեքստում K-tree-ը կարող է օգտագործվել արդյունավետ ուսուցման համար:

Կարճ ցանց
Կարճ ցանց

Զարգացում

Վստահության բայեսյան ցանցի մշակումը հաճախ սկսվում է DAG G-ի ստեղծմամբ, այնպես որ X-ը բավարարում է տեղական Մարկովի հատկությունը G-ի նկատմամբ: Երբեմն սա պատճառահետևանքային DAG է: Գնահատվում են յուրաքանչյուր փոփոխականի պայմանական հավանականության բաշխումները իր ծնողների վրա G-ում: Շատ դեպքերում, հատկապես երբ փոփոխականները դիսկրետ են, եթե X-ի համատեղ բաշխումը այս պայմանական բաշխումների արտադրյալն է, ապա X-ը դառնում է Բայեսյան ցանց՝ կապված Գ.

Մարկովի «հանգույցի վերմակը» հանգույցների հավաքածու է։ Մարկովյան ծածկոցը հանգույցն անկախ է դարձնում նույն անունով հանգույցի մնացած դատարկ հատվածից և բավարար գիտելիք է դրա բաշխումը հաշվարկելու համար: X-ը բայեսյան ցանց է G-ի նկատմամբ, եթե յուրաքանչյուր հանգույց պայմանականորեն անկախ է բոլոր մյուս հանգույցներից՝ հաշվի առնելով իր Markovian-ը:վերմակ.

Խորհուրդ ենք տալիս: