Տվյալների մայնինգը Հայեցակարգ, ալգորիթմի վերլուծություն, նպատակ և կիրառություն

Բովանդակություն:

Տվյալների մայնինգը Հայեցակարգ, ալգորիթմի վերլուծություն, նպատակ և կիրառություն
Տվյալների մայնինգը Հայեցակարգ, ալգորիթմի վերլուծություն, նպատակ և կիրառություն
Anonim

Տեղեկատվական տեխնոլոգիաների զարգացումը բերում է գործնական արդյունքների. Բայց այնպիսի խնդիրներ, ինչպիսիք են տեղեկատվության որոնումը, վերլուծությունը և օգտագործումը, դեռևս չեն ստացել արդյունավետ բարձրորակ գործիք: Կան վերլուծական և քանակական գործիքներ, դրանք իսկապես աշխատում են: Սակայն տեղեկատվության օգտագործման որակական հեղափոխություն դեռ տեղի չի ունեցել։

Համակարգչային տեխնոլոգիաների ի հայտ գալուց շատ առաջ մարդը կարիք ուներ մեծ քանակությամբ տեղեկատվության մշակման և դրան դիմակայելու իր փորձառությամբ և առկա տեխնիկական հնարավորություններով:

Գիտելիքների և հմտությունների զարգացումը միշտ բավարարել է իրական կարիքները և համապատասխանել ընթացիկ խնդիրներին։ Տվյալների արդյունահանումը կոլեկտիվ անուն է, որն օգտագործվում է տվյալների մեջ նախկինում անհայտ, ոչ տրիվիալ, գործնականում օգտակար և մատչելի գիտելիքների հայտնաբերման մեթոդների մի շարք, որոնք անհրաժեշտ են մարդկային գործունեության տարբեր ոլորտներում որոշումներ կայացնելու համար:

:

Մարդ, բանականություն, ծրագրավորում

Մարդը միշտ գիտի, թե ինչպես վարվել ցանկացած իրավիճակում։Անտեղյակությունը կամ անծանոթ իրավիճակը չի խանգարում նրան որոշում կայացնել։ Ցանկացած մարդկային որոշման օբյեկտիվությունն ու ողջամիտությունը կարող են կասկածի տակ լինել, բայց այն կընդունվի։

Խելացիությունը հիմնված է՝ ժառանգական «մեխանիզմի», ձեռքբերովի, ակտիվ գիտելիքների վրա։ Գիտելիքը կիրառվում է մարդու առջև ծագած խնդիրները լուծելու համար։

  1. Խելացիությունը գիտելիքների և հմտությունների եզակի հավաքածու է. հնարավորություններ և հիմք մարդկային կյանքի և աշխատանքի համար:
  2. Ինտելեկտը մշտապես զարգանում է, և մարդկային գործողությունները ազդում են այլ մարդկանց վրա:

Ծրագրավորումը տվյալների ներկայացման և ալգորիթմների ստեղծման գործընթացի պաշտոնականացման առաջին փորձն է:

Մարդ, բանականություն, ծրագրավորում
Մարդ, բանականություն, ծրագրավորում

Արհեստական ինտելեկտը (AI) ժամանակի և ռեսուրսների վատնում է, սակայն AI-ի ոլորտում անցյալ դարի անհաջող փորձերի արդյունքները մնացին հիշողության մեջ, օգտագործվեցին տարբեր փորձագիտական (խելացի) համակարգերում և փոխակերպվեցին, մասնավորապես՝ ալգորիթմների (կանոնների) և մաթեմատիկական (տրամաբանական) տվյալների վերլուծության և տվյալների արդյունահանման մեջ։

Տեղեկություն և լուծման սովորական որոնում

Սովորական գրադարանը գիտելիքի շտեմարան է, և տպագիր բառն ու գրաֆիկան դեռևս չեն զիջել համակարգչային տեխնոլոգիաներին: Ֆիզիկայի, քիմիայի, տեսական մեխանիկայի, դիզայնի, բնական պատմության, փիլիսոփայության, բնագիտության, բուսաբանության, դասագրքերի, մենագրությունների, գիտնականների աշխատությունների, կոնֆերանսի նյութերի, զարգացման աշխատանքների վերաբերյալ զեկույցների և այլնի վերաբերյալ գրքերը միշտ տեղին և հուսալի են:

Գրադարանը շատ տարբեր աղբյուրներ է, որոնք տարբերվում եննյութի ներկայացման ձևը, ծագումը, կառուցվածքը, բովանդակությունը, ներկայացման ոճը և այլն:

Գրադարան՝ գրքեր, ամսագրեր և այլ տպագիր նյութեր
Գրադարան՝ գրքեր, ամսագրեր և այլ տպագիր նյութեր

Արտաքին ամեն ինչ տեսանելի է (ընթեռնելի, հասանելի) հասկանալու և օգտագործելու համար։ Կարող եք լուծել ցանկացած խնդիր, ճիշտ դնել առաջադրանքը, հիմնավորել լուծումը, գրել շարադրություն կամ կուրսային աշխատանք, ընտրել դիպլոմային նյութ, վերլուծել ատենախոսության թեմայի կամ գիտական և վերլուծական զեկույցի աղբյուրները։

Ցանկացած տեղեկատվական խնդիր կարելի է լուծել. Պատշաճ համառության և հմտության դեպքում կստացվի ճշգրիտ և հուսալի արդյունք։ Այս համատեքստում Data Mining-ը բոլորովին այլ մոտեցում է։

Արդյունքից բացի, մարդը ստանում է «ակտիվ հղումներ» այն ամենին, ինչը դիտվել է նպատակին հասնելու գործընթացում։ Այն աղբյուրներին, որոնք նա օգտագործել է խնդրի լուծման համար, կարելի է հղում անել, և ոչ ոք չի վիճարկի աղբյուրի գոյության փաստը։ Սա իսկության երաշխիք չէ, բայց վստահ վկայություն է, թե ում նկատմամբ է իսկության պատասխանատվությունը «չբաշխված»։ Այս տեսանկյունից տվյալների արդյունահանումը նշանակում է մեծ կասկածներ հուսալիության վերաբերյալ և «ակտիվ» հղումների բացակայություն:

Մի քանի խնդիր լուծելով՝ մարդը ստանում է արդյունք և ընդլայնում է իր ինտելեկտուալ ներուժը դեպի բազմաթիվ «ակտիվ օղակներ»։ Եթե նոր առաջադրանքը «ակտիվացնի» արդեն գոյություն ունեցող հղումը, անձը կիմանա, թե ինչպես լուծել այն. նորից որևէ բան փնտրելու կարիք չկա:

«Ակտիվ հղումը» ֆիքսված ասոցիացիա է՝ ինչպես և ինչ անել կոնկրետ դեպքում: Մարդու ուղեղը ինքնաբերաբար հիշում է այն ամենը, ինչ իրեն պոտենցիալ հետաքրքիր, օգտակար է թվում։կամ, ամենայն հավանականությամբ, ապագայում անհրաժեշտ կլինի: Շատ առումներով դա տեղի է ունենում ենթագիտակցական մակարդակում, բայց հենց որ առաջադրանք է առաջանում, որը կարող է կապված լինել «ակտիվ կապի» հետ, այն անմիջապես հայտնվում է մտքում, և լուծումը կգտնվի առանց տեղեկատվության լրացուցիչ որոնման: Տվյալների արդյունահանումը միշտ որոնման ալգորիթմի կրկնությունն է, և այս ալգորիթմը չի փոխվում:

Կանոնավոր որոնում. «գեղարվեստական» խնդիրներ

Մաթեմատիկական գրադարանը և դրանում տեղեկատվություն փնտրելը համեմատաբար թույլ խնդիր է։ Ինտեգրալ լուծելու, մատրիցա կառուցելու կամ երկու երևակայական թվերի գումարման գործողությունը կատարելու համար այս կամ այն ձև գտնելը դժվար է, բայց պարզ: Պետք է դասավորել մի շարք գրքեր, որոնցից շատերը գրված են կոնկրետ լեզվով, գտնել ճիշտ տեքստը, ուսումնասիրել այն և ստանալ անհրաժեշտ լուծումը։

Ժամանակի ընթացքում թվարկումը ծանոթ կդառնա, իսկ կուտակված փորձը թույլ կտա նավարկելու գրադարանի տեղեկատվությունը և մաթեմատիկական այլ խնդիրներ: Սա հարցերի և պատասխանների սահմանափակ տեղեկատվական տարածք է: Հատկանշական առանձնահատկություն. տեղեկատվության նման որոնումը կուտակում է գիտելիքներ նմանատիպ խնդիրների լուծման համար: Տեղեկատվության որոնումը մարդու հիշողության մեջ թողնում է հետքեր («ակտիվ հղումներ») այլ խնդիրների հնարավոր լուծումների վերաբերյալ։

Գեղարվեստական գրականության մեջ գտե՛ք «Ինչպե՞ս են ապրել մարդիկ 1248 թվականի հունվարին» հարցի պատասխանը։ շատ բարդ. Էլ ավելի դժվար է պատասխանել այն հարցին, թե ինչ կար խանութների դարակներում և ինչպես է կազմակերպվել սննդամթերքի առևտուրը։ Եթե նույնիսկ ինչ-որ գրող իր վեպում հստակ և ուղղակիորեն գրել է այս մասին, եթե կարելի էր գտնել այս գրողի անունը, ապա կասկածներ կան.ստացված տվյալների հավաստիությունը կմնա։ Հուսալիությունը ցանկացած քանակությամբ տեղեկատվության կարևոր հատկանիշ է: Կարևոր է աղբյուրը, հեղինակը և արդյունքի կեղծ լինելը բացառող ապացույցները։

Որոշակի իրավիճակի օբյեկտիվ հանգամանքներ

Մարդը տեսնում է, լսում, զգում. Որոշ մասնագետներ վարժ տիրապետում են յուրահատուկ զգացողությանը՝ ինտուիցիայի։ Խնդրի շարադրումը պահանջում է տեղեկատվություն, խնդրի լուծման գործընթացն առավել հաճախ ուղեկցվում է խնդրի շարադրման ճշգրտմամբ։ Սա այն փոքր դժվարությունն է, որը առաջանում է համակարգչային համակարգի աղիքներ տեղեկատվության տեղափոխման հետ:

Տեղեկատվություն վիրտուալ տարածքում
Տեղեկատվություն վիրտուալ տարածքում

Գրադարանը և աշխատանքային գործընկերները որոշումների գործընթացի անուղղակի մասնակիցներ են: Գրքի ձևավորումը (աղբյուրը), տեքստի գրաֆիկան, տեղեկատվությունը վերնագրերի բաժանելու առանձնահատկությունները, նշումներն ըստ արտահայտությունների, առարկայի ինդեքսը, առաջնային աղբյուրների ցանկը. խնդիրը։

Խնդիրը լուծելու ժամանակն ու վայրը էական է. Մարդն այնքան է դասավորված, որ խնդրի լուծման գործընթացում ակամայից ուշադրություն է դարձնում այն ամենին, ինչ իրեն շրջապատում է։ Դա կարող է շեղել կամ խթանել: Տվյալների արդյունահանումը երբեք չի «հասկանա»:

Տեղեկություն վիրտուալ տարածքում

Մարդուն միշտ հետաքրքրել է միայն իրադարձության, երեւույթի, օբյեկտի, խնդրի լուծման ալգորիթմի մասին հավաստի տեղեկատվությունը։ Մարդը միշտ պատկերացրել է, թե ինչպես կարող է հասնել ցանկալի նպատակին։

Համակարգիչների և տեղեկատվական համակարգերի տեսքը պետք է հեշտացներ մարդու կյանքը, բայց ամեն ինչ միայն ավելի է բարդացել։Տեղեկատվությունը տեղափոխվեց համակարգչային համակարգերի աղիքներ և անհետացավ տեսադաշտից: Անհրաժեշտ տվյալները ընտրելու համար անհրաժեշտ է ստեղծել ճիշտ ալգորիթմ կամ ձևակերպել հարցումը տվյալների բազայում:

Տվյալներ տեղեկատվական համակարգի ներսում
Տվյալներ տեղեկատվական համակարգի ներսում

Հարցը պետք է ճիշտ լինի։ Միայն դրանից հետո կարող եք պատասխան ստանալ։ Սակայն իսկության վերաբերյալ կասկածները մնում են։ Այս առումով Data Mining-ը իսկապես «պեղումներ» է, դա «տեղեկատվության արդյունահանում» է։ Ահա թե ինչպես է մոդայիկ թարգմանել այս արտահայտությունը. Ռուսական տարբերակը տվյալների մայնինգ կամ տվյալների մայնինգ տեխնոլոգիա է։

Հեղինակավոր մասնագետների աշխատություններում Data Mining-ի առաջադրանքները նշված են հետևյալ կերպ.

  • դասակարգում;
  • կլաստերավորում;
  • ասոցիացիա;
  • հաջորդականություն;
  • կանխատեսում.

Այն պրակտիկայի տեսանկյունից, որն առաջնորդում է մարդուն տեղեկատվության ձեռքով մշակման հարցում, այս բոլոր դիրքորոշումները վիճելի են։ Ամեն դեպքում, մարդը տեղեկատվությունը մշակում է ավտոմատ կերպով և չի մտածում տվյալների դասակարգման, առարկաների թեմատիկ խմբեր կազմելու (կլաստերավորման), ժամանակային օրինաչափությունների (հաջորդականության) որոնման կամ արդյունքը կանխատեսելու մասին։

Մարդկային մտքում այս բոլոր դիրքերը ներկայացված են ակտիվ գիտելիքներով, որոնք ավելի շատ դիրքեր են ընդգրկում և դինամիկ կերպով օգտագործում են սկզբնական տվյալների մշակման տրամաբանությունը։ Մարդու ենթագիտակցությունը կարևոր դեր է խաղում, հատկապես, երբ նա գիտելիքի որոշակի բնագավառի մասնագետ է։

Օրինակ. Համակարգչային սարքավորումների մեծածախ վաճառք

Խնդիրը պարզ է. Կան մի քանիսըհամակարգչային տեխնիկայի և ծայրամասային սարքերի տասնյակ մատակարարներ: Յուրաքանչյուրն ունի xls ձևաչափով գնացուցակ (Excel ֆայլ), որը կարելի է ներբեռնել մատակարարի պաշտոնական կայքից: Պահանջվում է ստեղծել վեբ ռեսուրս, որը կարդում է Excel ֆայլերը, դրանք վերածում տվյալների բազայի աղյուսակների և թույլ է տալիս հաճախորդներին ընտրել ցանկալի ապրանքները ամենացածր գներով:

Խնդիրներն անմիջապես առաջանում են. Յուրաքանչյուր մատակարար առաջարկում է xls ֆայլի կառուցվածքի և բովանդակության իր տարբերակը: Ֆայլը կարող եք ստանալ՝ ներբեռնելով այն մատակարարի կայքից, պատվիրելով այն էլեկտրոնային փոստով կամ ստանալով ներբեռնման հղում ձեր անձնական հաշվի միջոցով, այսինքն՝ պաշտոնապես գրանցվելով մատակարարի մոտ:

Վիրտուալ Համակարգիչների Խանութ
Վիրտուալ Համակարգիչների Խանութ

Խնդրի լուծումը (ի սկզբանե) տեխնոլոգիապես պարզ է. Ֆայլերի բեռնում (նախնական տվյալներ), յուրաքանչյուր մատակարարի համար գրվում է ֆայլերի ճանաչման ալգորիթմ և տվյալները տեղադրվում են նախնական տվյալների մեկ մեծ աղյուսակում: Բոլոր տվյալները ստանալուց հետո թարմ տվյալների շարունակական փոխանակման մեխանիզմը (օրական, շաբաթական կամ փոփոխության դեպքում) հաստատվելուց հետո՝

  • փոփոխել տեսականին;
  • գների փոփոխություններ;
  • պահեստում առկա քանակի պարզաբանում;
  • երաշխիքային պայմանների, տեխնիկական պայմանների ճշգրտում և այլն:

Այստեղից են սկսվում իրական խնդիրները: Բանն այն է, որ մատակարարը կարող է գրել՝

  • նոութբուք Acer;
  • նոութբուք Asus;
  • Dell laptop.

Խոսքը նույն ապրանքի մասին է, բայց տարբեր արտադրողներից։ Ինչպե՞ս համադրել նոութբուքը=նոութբուքը կամ ինչպե՞ս հեռացնել Acer-ը, Asus-ը և Dell-ը արտադրանքի շարքից:

Հանունմարդը խնդիր չէ, բայց ինչպե՞ս է ալգորիթմը «հասկանալու», որ Acer-ը, Asus-ը, Dell-ը, Samsung-ը, LG-ն, HP-ն, Sony-ն ապրանքանիշեր կամ մատակարարներ են: Ինչպե՞ս համապատասխանեցնել «տպիչը» և տպիչը, «սկաներ»-ը և «MFP»-ը, «պատճենահանող»-ը և «MFP»-ը, «ականջակալները» «ականջակալի» հետ, «աքսեսուարները» «աքսեսուարների» հետ:

Աղբյուրի տվյալների (աղբյուրային ֆայլերի) հիման վրա կատեգորիայի ծառ կառուցելն արդեն իսկ խնդիր է, երբ պետք է ամեն ինչ կարգաբերել ավտոմատի վրա:

Տվյալների նմուշառում. «թարմ թափված» պեղումներ

Համակարգչային սարքավորումներ մատակարարողների տվյալների բազայի ստեղծման խնդիրը լուծված է. Կառուցվել է կատեգորիաների ծառ, գործում է ընդհանուր աղյուսակ՝ բոլոր մատակարարների առաջարկներով։

Տվյալների արդյունահանման տիպիկ առաջադրանքներ այս օրինակի համատեքստում.

  • գտեք ապրանք ամենացածր գնով;
  • ընտրեք ապրանքը ամենացածր առաքման արժեքով և գնով;
  • արտադրանքի վերլուծություն. բնութագրերը և գները ըստ չափանիշների:

Մի քանի տասնյակ մատակարարների տվյալներ օգտագործող մենեջերի իրական աշխատանքում կլինեն այս առաջադրանքների բազմաթիվ տարբերակներ և նույնիսկ ավելի իրական իրավիճակներ:

Օրինակ, կա «Ա» մատակարար, ով վաճառում է ASUS VivoBook S15՝ կանխավճար, առաքում փողի փաստացի ստացումից 5 օր հետո։ Նույն մոդելի նույն ապրանքի «B» մատակարար կա՝ վճարում ստանալուն պես, առաքում պայմանագրի կնքումից հետո մեկ օրվա ընթացքում, գինը մեկուկես անգամ բարձր է։

Սկսվում է տվյալների արդյունահանումը` «պեղումներ». Փոխաբերական արտահայտությունները՝ «պեղումներ» կամ «տվյալների մայնինգ» հոմանիշներ են։ Խոսքն այն մասին է, թե ինչպես պատճառաբանել որոշում կայացնելու համար:

Մատակարարները «A» և «B» ունեն առաքումների պատմություն: Դասարանկանխավճար առաջին դեպքում՝ անդորրագրի դիմաց վճարման դիմաց, երկրորդ դեպքում՝ հաշվի առնելով, որ երկրորդ դեպքում առաքման ձախողումը 65%-ով ավելի է։ Հաճախորդի կողմից տույժերի ռիսկն ավելի բարձր/նվազ է: Ինչպե՞ս և ի՞նչ որոշել և ի՞նչ որոշում կայացնել:

Մյուս կողմից՝ տվյալների բազան ստեղծվել է ծրագրավորողի և մենեջերի կողմից: Եթե ծրագրավորողն ու կառավարիչը փոխվել են, ինչպե՞ս որոշել տվյալների բազայի ներկա վիճակը և սովորել այն ճիշտ օգտագործել: Դուք նույնպես պետք է կատարեք տվյալների մայնինգ: Տվյալների հանքարդյունաբերությունը առաջարկում է մի շարք մաթեմատիկական և տրամաբանական մեթոդներ, որոնք չեն հետաքրքրում, թե ինչպիսի տվյալներ են հետազոտվում: Սա որոշ դեպքերում տալիս է ճիշտ լուծում, բայց ոչ բոլորում:

Տեղափոխվելով դեպի վիրտուալություն և գտնել իմաստ

Տվյալների կորզման մեթոդները դառնում են իմաստալից, հենց որ տեղեկատվությունը գրվում է տվյալների բազայում և անհետանում «տեսադաշտից»: Համակարգչային սարքավորումների առևտուրը հետաքրքիր խնդիր է, բայց դա պարզապես բիզնես է: Թե որքանով է նա կազմակերպված ընկերությունում, կախված է նրա հաջողությունից:

Մոլորակի կլիմայական փոփոխությունները և որոշակի քաղաքում եղանակը հետաքրքրում են բոլորին, ոչ միայն կլիմայի պրոֆեսիոնալ մասնագետներին: Հազարավոր սենսորներ վերցնում են քամու, խոնավության, ճնշման, Երկրի արհեստական արբանյակների տվյալները, և կա տվյալների պատմություն տարիներ և դարեր շարունակ:

Եղանակի տվյալները միայն հովանոցը աշխատանքի բերելու մասին որոշում չեն կայացնում: Տվյալների արդյունահանման տեխնոլոգիաները օդանավի անվտանգ թռիչքն են, մայրուղու կայուն շահագործումը և նավթամթերքի հուսալի մատակարարումը ծովով:

«Հում» տվյալներն ուղարկվում են տեղեկատվությանըհամակարգ. Տվյալների արդյունահանման խնդիրն է դրանք վերածել աղյուսակների համակարգված համակարգի, ստեղծել կապեր, ընդգծել համասեռ տվյալների խմբերը և հայտնաբերել օրինաչափությունները:

Կլիմա, եղանակ և չմշակված տվյալներ
Կլիմա, եղանակ և չմշակված տվյալներ

Մաթեմատիկական և տրամաբանական մեթոդները քանակական վերլուծության ժամանակներից սկսած՝ OLAP (On-line Analytical Processing) ցույց են տվել իրենց գործնականությունը։ Այստեղ տեխնոլոգիան թույլ է տալիս գտնել իմաստը և չկորցնել այն, ինչպես համակարգչային տեխնիկա վաճառելու օրինակում։

Ավելին, գլոբալ առաջադրանքներում՝

  • վերազգային բիզնես;
  • օդային տրանսպորտի կառավարում;
  • երկրի աղիքների կամ սոցիալական խնդիրների ուսումնասիրություն (պետական մակարդակով);
  • ուսումնասիրություն դեղերի ազդեցության կենդանի օրգանիզմի վրա;
  • Արդյունաբերական ձեռնարկության կառուցման հետևանքների կանխատեսում և այլն:

Տվյալների հանքավայրի տեխնոլոգիաները և «անիմաստ» տվյալները իրական տվյալների վերածելը, որը թույլ է տալիս օբյեկտիվ որոշումներ կայացնել, միակ տարբերակն է:

Մարդկային հնարավորություններն ավարտվում են այնտեղ, որտեղ կա մեծ քանակությամբ հումքային տեղեկատվություն: Տվյալների արդյունահանման համակարգերը կորցնում են իրենց օգտակարությունը այնտեղ, որտեղ անհրաժեշտ է տեղեկատվություն տեսնել, հասկանալ և զգալ:

Ֆունկցիաների և օբյեկտիվության ողջամիտ բաշխում

Մարդը և համակարգիչը պետք է լրացնեն միմյանց. սա աքսիոմա է: Մարդու համար ատենախոսություն գրելը առաջնահերթություն է, իսկ տեղեկատվական համակարգը՝ օգնություն։ Այստեղ տվյալների հանքարդյունաբերության տեխնոլոգիան ունի էվրիստիկա, կանոններ, ալգորիթմներ:

Շաբաթական եղանակի կանխատեսում պատրաստելը տեղեկատվական համակարգի առաջնահերթությունն է։Մարդը տնօրինում է տվյալները, բայց իր որոշումները հիմնավորում է համակարգի հաշվարկների արդյունքներով։ Այն միավորում է տվյալների արդյունահանման մեթոդները, մասնագետների տվյալների դասակարգումը, ալգորիթմների կիրառման ձեռքով կառավարումը, անցյալի տվյալների ավտոմատ համեմատումը, մաթեմատիկական կանխատեսումը և տեղեկատվական համակարգի կիրառման մեջ ներգրավված իրական մարդկանց շատ գիտելիքներն ու հմտությունները:

Մարդ և համակարգիչ
Մարդ և համակարգիչ

Հավանականությունների տեսությունը և մաթեմատիկական վիճակագրությունը գիտելիքի ամեն «սիրելի» և հասկանալի ոլորտները չեն։ Շատ մասնագետներ շատ հեռու են նրանցից, սակայն այս ոլորտներում մշակված մեթոդները գրեթե 100%-ով ճիշտ արդյունք են տալիս։ Տվյալների մայնինգի գաղափարների, մեթոդների և ալգորիթմների վրա հիմնված համակարգերի կիրառմամբ լուծումներ կարելի է ստանալ օբյեկտիվ և հուսալի: Հակառակ դեպքում լուծում գտնելն ուղղակի անհնար է։

Փարավոններն ու անցյալ դարերի առեղծվածները

Պատմությունը պարբերաբար վերաշարադրվել է.

  • պետություններ՝ հանուն իրենց ռազմավարական շահերի;
  • հեղինակավոր գիտնականներ՝ հանուն իրենց սուբյեկտիվ համոզմունքների:

Դժվար է տարբերել, թե որն է ճիշտ և ինչը՝ կեղծ: Data Mining-ի օգտագործումը թույլ է տալիս լուծել այս խնդիրը: Օրինակ, բուրգեր կառուցելու տեխնոլոգիան նկարագրվել է մատենագիրների կողմից և ուսումնասիրվել գիտնականների կողմից տարբեր դարերում։ Ոչ բոլոր նյութերն են հայտնվել ինտերնետում, այստեղ ամեն ինչ եզակի չէ, և շատ տվյալներ կարող են չունենալ՝

  • նկարագրված ժամանակի կետ;
  • նկարագրությունը գրելու ժամանակը;
  • ամսաթվեր, որոնց վրա հիմնված է նկարագրությունը;
  • հեղինակ(ներ), կարծիքներ (հղումներ) հաշվի առնված;
  • օբյեկտիվության հաստատում.

Bգրադարաններ, տաճարներ և «անսպասելի վայրեր» կարող եք գտնել տարբեր դարերի ձեռագրեր և անցյալի իրեղեն ապացույցներ։

Հետաքրքիր նպատակ. հավաքել ամեն ինչ և բացահայտել «ճշմարտությունը»: Խնդրի առանձնահատկությունը. տեղեկատվություն կարելի է ստանալ մատենագրի առաջին նկարագրությունից՝ փարավոնների կենդանության օրոք մինչև ներկայիս դարը, որտեղ այս խնդիրը ժամանակակից մեթոդներով լուծվում է բազմաթիվ գիտնականների կողմից:

Տվյալների արդյունահանման օգտագործման հիմնավորում. ձեռքի աշխատանք հնարավոր չէ: Չափազանց շատ քանակություններ:

  • տեղեկատվության աղբյուրներ;
  • ներկայացման լեզուներ;
  • հետազոտողներ, ովքեր նկարագրում են նույն բանը տարբեր ձևերով;
  • ամսաթվեր, իրադարձություններ և պայմաններ;
  • ժամկետային հարաբերակցության խնդիրներ;
  • վիճակագրության վերլուծությունը ըստ տվյալների խմբերի ժամանակի ընթացքում կարող է տարբերվել և այլն:

Անցյալ դարավերջին, երբ արհեստական ինտելեկտի գաղափարի հերթական ֆիասկոն ակնհայտ դարձավ ոչ միայն աշխարհիկ, այլև բարդ մասնագետի համար, հայտնվեց միտքը՝ «վերստեղծել անհատականությունը»:

Օրինակ, ըստ Պուշկինի, Գոգոլի, Չեխովի աշխատությունների, ձևավորվում է կանոնների, վարքագծի տրամաբանության որոշակի համակարգ և ստեղծվում է տեղեկատվական համակարգ, որը կարող է պատասխանել որոշ հարցերի այնպես, ինչպես մարդը՝ Պուշկին, Գոգոլ կամ. Չեխովը։ Տեսականորեն նման առաջադրանքը հետաքրքիր է, բայց գործնականում չափազանց դժվար է իրականացնել։

Սակայն նման առաջադրանքի գաղափարը շատ գործնական գաղափար է հուշում. «ինչպես ստեղծել խելացի տեղեկատվության որոնում»: Համացանցը շատ զարգացող ռեսուրսներ է, հսկայական տվյալների բազա, և սա հիանալի հնարավորություն է կիրառելու տվյալների հանքարդյունաբերությունը մարդու հետ համատեղ:տրամաբանությունը համատեղ զարգացման ձևաչափում.

Մեքենան և մարդը միասին
Մեքենան և մարդը միասին

Մեքենան և տղամարդը զուգակցված հիանալի խնդիր է և անկասկած հաջողություն «տեղեկատվական հնագիտության» ոլորտում, տվյալների մեջ բարձրորակ պեղումներ և արդյունքներ, որոնք ինչ-որ բան կասկածի տակ կդնեն, բայց անկասկած թույլ կտան ձեզ. ձեռք բերել նոր գիտելիքներ և պահանջված լինել հասարակության մեջ։

Խորհուրդ ենք տալիս: