Pievienot darbus Atzīmētie0
Darbs ir veiksmīgi atzīmēts!

Atzīmētie darbi

Skatītie0

Skatītie darbi

Grozs0
Darbs ir sekmīgi pievienots grozam!

Grozs

Reģistrēties

interneta bibliotēka
Atlants.lv bibliotēka

Izdevīgi: šodien akcijas cena!

Parastā cena:
21,48
Ietaupījums:
2,79 (13%)
Cena ar atlaidi*:
18,69
Pirkt
Identifikators:339000
Autors:
Vērtējums:
Publicēts: 03.12.2005.
Valoda: Latviešu
Līmenis: Augstskolas
Literatūras saraksts: 15 vienības
Atsauces: Ir
Laikposms: 2001.g. - 2002.g.
SatursAizvērt
Nr. Sadaļas nosaukums  Lpp.
  INSTITŪTS    1
1.  IEVADS    6
2.  UZDEVUMA NOSTĀDNE    8
2.1.  UZDEVUMA SATURĪGĀ NOSTĀDNE    8
2.2.  UZDEVUMA FORMĀLĀ NOSTĀDNE    8
2.2.1.  Risināma uzdevuma problēmas    9
3.  IZMANTOJAMĀS METODES    10
3.1.  DATU AUTOMĀTISKI - INTELEKTUĀLAS ANALĪZES PAMATI    10
3.2.  KLASIFIKĀCIJAS KOKU METODE    12
3.2.  1.att. Klasifikācijas koka struktūra    13
3.3.  REGRESIJAS METODES    23
3.3.1.  Vienkārša lineāra regresija    24
3.3.2.  Daudzfaktoru lineāra regresija    26
3.3.3.  Loģistiska regresija    32
4.  NOPUBLICĒTO RISINĀMO METOŽU APSKATS    34
4.1.  CART KLASIFIKĀCIJAS TEHNIKAS PIELIETOŠANA ŪDENS    34
  TOKSICITĀTES NOTEIKŠANAI    34
  Izmantojamas metodes    34
  Uzdevuma risinājums un rezultāti    35
4.2.  KLASIFIKĀCIJAS KOKU MODEĻA IZMANTOŠANA ASTRONOMIJĀ    38
  Problēmas apraksts    38
  Problēmas risinājums un rezultāti    38
4.3.  KLASIFIKĀCIJAS UN REGRESIJAS KOKU PIELIETOŠANA LAVĪNU AKTIVITĀTES PROGNOZĒŠANAI    41
  Ievads    41
  Izmantojamas metodes    41
  Izmantoto datu apskats    42
  Problēmas risinājums un rezultāti    42
5.  TEORĒTISKĀ DAĻA    44
5.1.  PROGNOZĒŠANAS PRECIZITĀTES NOTEIKŠANAS KRITERIJI    44
6.  PRAKTISKĀ DAĻA    46
6.1.  EKSPERIMENTU PLĀNA IZSTRĀDĀŠANA    46
6.2.  SĀKUMDATU APRAKSTS    46
6.3.  EKSPERIMENTU PLANA APRAKSTS    50
6.4.  EKSPERIMENTA GAITAS APRAKSTS UN REZULTĀTI    51
6.4.1.  Datu bāzes "Automašīnas" analīze ar CART klasifikāciju koku algoritma palīdzību    51
6.4.2.  Datu bāzes "Automašīnas" analīze ar CART regresijas koku algoritma palīdzību (166 piemeri)    63
6.4  10.att. Terminālie mezgli ar intervālu vērtībām    66
6.4.3.  Datu bāzes "Automašīnas" analīze ar daudzfaktoru regresiju    66
6.4.4.  Datu bāzes "Diabēts" analīze ar CART klasifikāciju koku algoritma palīdzību    72
6.4.5.  Datu bāzes " Diabēts " analīze ar CART regresijas koku algoritma palīdzību    79
6.4.6.  Datu bāzes " Diabēts " analīze ar daudzfaktoru loģistisko regresiju    82
6.5.  REZULTĀTU ANALĪZE    87
6.5.1.  Datu bāzes "Automašīnas" analīzes rezultāti    87
6.5.2.  Datu bāzes "Diabēts" analīzes rezultāti    91
7.  SECINĀJUMI    96
8.  BIBLIOGRĀFISKAIS SARAKSTS    98
9.  PIELIKUMI    100
9.1.  CART 4.0. DATORPROGRAMMAS APRAKSTS    100
Darba fragmentsAizvērt

UZDEVUMA NOSTĀDNE

Klasifikācijas un regresijas koki ir viena no datu intelektuāli - automātiskas analīzes metodēm. Šī metodi veiksmīgi pielieto datu klasifikācijai un prognozēšanai dažādās jomās. Dotajā maģistra darbā tiek analizēta regresijas koku pielietošanas efektivitāte, prognozēšanas uzdevumos. Efektivitātes analīze tika veikta salīdzinot regresijas koku metodi ar klasifikācijas koku un lineāras regresijas metodēm.
2.1. UZDEVUMA SATURĪGĀ NOSTĀDNE
Lai noteiktu regresijas koku prognozēšanas efektivitāti, tiks analizētas divas lielas datu bāzes. Datu bāzes satur informāciju no dažādām jomām un atšķiras pēc informācijas apjomiem, datu tipiem un klases radītājiem. Divas datu bāzes ir izvelētas ar mērķī izpētīt, kā ietekme augstāk minēti parametri uz prognozēšanas precizitāti. Datu bāzes nosaukumi ir "Automašīnas" un "Diabēts".
Pirmā datu bāze "Automašīnas" satur informāciju par automašīnas parametriem kurus nepieciešams analizēt, lai veiktu tālāku automašīnas cenas prognozēšanu. Datu bāze sastāv no 166 ierakstām. Statistiska informācija saņemta no kataloga "Ward's Automotive Yearbook" no internēt lapaspuses - www.aic.nrl.navy.mil/~aha/research/machine-learning.Klases radītājam ir skaitliska vērtība. Otra datu bāze "Diabēts" satur medicīnas informāciju par pacientu analīzēm. Datu bāze satur 768 ierakstus. Visi dati sadalīti pēc divām klasēm. Klases radītājs noteic pacienta pozitīvu vai negatīvu diabēta diagnozi . Nepieciešams izpētīt datus un uz jauniem datiem prognozēt iespējamo diagnozi.
Abas problēmas bija analizētas ar klasifikācijas un regresijas koku metodēm kā arī ar statistisko metodi - daudzfaktoru lineāru regresiju. Darba uzdevums bija izpētīt visas darba apskatāmas metodes, salīdzināt tās, analizēt rezultātus un izvelēt labāko modeļi prognozēšanai, lai pēc tam novērtētu regresijas koku izmantošanas efektivitāti prognozēšanas uzdevumos.
2.2. UZDEVUMA FORMĀLĀ NOSTĀDNE

Lai analizētu datu bāzes "Automašīnas" un "Diabēts" tika pielietotas trīs metodes. Pirmā metode ir klasifikācijas koku tehnoloģija, otra metode ir regresijas koku tehnoloģija un treša ir plaši pazīstama statistiska metode - lineāra un loģistiska daudzfaktoru regresija. Prognozēšanai ir jāizmanto statistiskie dati. Sakumkopas lielumu var mainīt eksperimenta gaitā. Testa un apmācošas kopas izmērus arī var mainīt. Eksperimenta izejoši dati ir prognozējamas vērtības. Apstrādātu datu skaits ir liels, tādēļ nepieciešams aprēķiniem izmantot datoru programmas. Klasifikācijas un regresijas kokiem jāizmanto programmu CART 4.0., bet lineāras regresijas aprēķiniem jāizmanto statistisko paketi Polyanalist 4.5. Labākai problēmas saprašanai izejošus datus nepieciešams paradīt ne tikai tabulās, bet arī grafiskā veidā: dati - koku veidā, prognozēšanas kļūdas - grafikos. Nepieciešams arī pieņemt prognozēšanas precizitātes noteikšanas kritēriju.
2.2.1.Risināma uzdevuma problēmas

1. Apskatīt datu intelektuāli - automātiskas analīzes teorētiskus pamatus, klasifikācijas koku teorētiskus pamatus un dot regresijas metodes teorētisko analīzi
2. Apskatīt nopublicētus risinājumus, kuri ir tuvi darba risināmām uzdevumam
3. Analizēt un apstrādāt datu bāzes sakumdatus
4. Sadalīt datu kopas uz testējošo un apmācošo kopu un pēc tam paveikt datu bāzes vērtību aprēķinu
5. Eksperimentāli izpētīt abas datu bāzes ar aprakstītām darbā metodēm. Paveikt eksperimentus kuri rada kā ietekmē datu apjoms un atribūtu svarīgums uz prognozēšanas precizitāti
6. Atrast labāko koku izmantojot kross - pārbaudes metodi, balstoties uz mazāko klasifikācijas kļūdu
7. Salīdzināt visas apskatāmas metodes rezultātus un noteikt labāku prognozēšanas modeļi katrai datu bāzei
8. Noteikt regresijas koku izmantošanas efektivitāti prognozēšanā salīdzinot ar citiem metodēm kuri aprakstīti šajā darbā.…

Autora komentārsAtvērt
Parādīt vairāk līdzīgos ...

Nosūtīt darbu e-pastā

Tavs vārds:

E-pasta adrese, uz kuru nosūtīt darba saiti:

Sveiks!
{Tavs vārds} iesaka Tev apskatīties interneta bibliotēkas Atlants.lv darbu par tēmu „Regresijas koku izmantošanas efektivitātes analīze prognozēšanas uzdevumos”.

Saite uz darbu:
https://www.atlants.lv/w/339000

Sūtīt

E-pasts ir nosūtīts.

Izvēlies autorizēšanās veidu

E-pasts + parole

E-pasts + parole

Norādīta nepareiza e-pasta adrese vai parole!
Ienākt

Aizmirsi paroli?

Draugiem.pase
Facebook
Twitter

Neesi reģistrējies?

Reģistrējies un saņem bez maksas!

Lai saņemtu bezmaksas darbus no Atlants.lv, ir nepieciešams reģistrēties. Tas ir vienkārši un aizņems vien dažas sekundes.

Ja Tu jau esi reģistrējies, vari vienkārši un varēsi saņemt bezmaksas darbus.

Atcelt Reģistrēties