|
Untitled Document
Teorētiskais seminārs: "Biznesa datu intelektuālas analīzes metodes, algoritmi un to pielietojums"
(publicēts 31.03.2011.)
2011. gada 28. martā (Latvijas Universitātē, Ekonomikas un vadības fakultātē, Aspazijas bulv. 5, 305. aud.) plkst. 16:00-17:45 notika teorētiskais seminārs par tēmu: Biznesa datu intelektuālas analīzes metodes, algoritmi un to pielietojums. Ar referātu uzstājas Rita Žuka. Semināru vadīja Astra Auziņa. Seminārā piedalījās 26 dalībnieki.
Uzkrāto datu apjoms par dažādiem biznesa procesiem strauji pieaug. Rodas nepieciešamība šo uzkrāto datu apjomu izmantot, lai iegūtu jaunu informāciju vadības lēmumu izstrādāšanai un pieņemšanai. Liela apjoma datos (datu bāzēs) zināšanas ir slēptas. Meklējot zināšanas lielos, nesakārtotos datu apjomos nepieciešams izmantot speciālas automatizētas analīzes metodes. Šis datu analīzes virziens ir Data Mining - "jaunu zināšanu ieguve", Datizrace - "jaunu sakarību atklāšana". LZA Terminoloģijas komisija apstiprinājusi terminam Data Mining sekojošo definīciju: "Datu bāzes datu analīze, kas paredzēta apslēptu sakarību meklēšanai kādā datu grupā, piemēram, datizraces programma var palīdzēt mazumtirdzniecības firmām atrast pircējus ar kopīgām interesēm. Datizraces programmatūra nemaina datu attēlojumu, bet atklāj iepriekš nezināmas attiecības starp tiem." Liela apjoma datus, kuru apjomi mērāmi gigabaitos/terabaitos, speciālistiem analītisko aprēķinu veikšanai bez speciālām tehnoloģijām, bez speciālām programmām analizēt ir ļoti grūti, pat neiespējami. Referātā tika izskatītas datu intelektuālās analīzes Datizraces būtība un pielietošanās iespējas. Aprakstīti datu intelektuālās analīzes procesa etapi un to izpildes secība. Tiek apskatīti Microsoft Analysis Server modeļu veidošanai piedāvātie datizraces algoritmi: Lēmumu koki (Microsoft Decision Trees), Klasterizacija (Microsoft Clustering), Vienkāršais Beiesa algoritms (Microsoft Naive Bayes), Secīgu darbību klasterizacija (Microsoft Sequence Clustering), Dinamikas rindu analīzes algoritms (Microsoft Time Series), Asociatīvi loģisko sakarību noteikšanas metode (Microsoft Association), Neironu tīkli (Microsoft Neural Network), Daudzfaktoru lineārā regresija (Microsoft Linear Regression), Loģistiskā regresija (Microsoft Logistic Regression). Ilustratīvajā piemērā parādītas četru modeļu pielietošanas iespējas uzņēmumu klasifikācijā, veikta modeļu salīdzinošā novērtēšana LIFT CHART un uzņēmumu klasifikācija ar labāko modeli.
Prezentācija (PDF, 1,53 MB)
|