Pievienot darbus Atzīmētie0
Darbs ir veiksmīgi atzīmēts!

Atzīmētie darbi

Skatītie0

Skatītie darbi

Grozs0
Darbs ir sekmīgi pievienots grozam!

Grozs

Reģistrēties

interneta bibliotēka
Atlants.lv bibliotēka

Izdevīgi: šodien akcijas cena!

Parastā cena:
4,99
Ietaupījums:
0,70 (14%)
Cena ar atlaidi*:
4,29
Pirkt
Identifikators:891761
Autors:
Vērtējums:
Publicēts: 02.07.2012.
Valoda: Latviešu
Līmenis: Augstskolas
Literatūras saraksts: 15 vienības
Atsauces: Ir
Laikposms: 2011.g. - 2011.g.
SatursAizvērt
Nr. Sadaļas nosaukums  Lpp.
  IEVADS    5
1.  DATU KVALITĀTES PROBLĒMAS    6
1.1.  Viena avota ietvaros    6
1.1.1.  Kļūdas šūnas līmenī    6
1.1.2.  Integritātes ierobežojumu trūkums    9
1.2.  Daudzi datu avoti    10
1.2.1.  Heterogenitātes konflikts    10
1.2.2.  Aprakstīšanas konflikts    10
1.2.3.  Semantiskais konflikts    11
1.2.4.  Strukturālais konflikts    12
1.2.5.  Dublikāti    13
2.  DATU ATTĪRĪŠANAS PROCESI    14
2.1.  Datu analīze    14
2.2.  Definē transformācijas un kartēšanas nosacījumus    15
2.3.  Verifikācija un transformācija    15
3.  DATU ATTĪRĪŠANAS RĪKI    16
3.1.  WinPure Clean & Match 2010    16
3.2.  Data match 2011    17
4.  APSKATĪTO RĪKU PIELIETOJUMS    18
4.1.  Darbs ar Data Match 2011    18
4.2.  Darbs ar WinPure Clean & Match 2010    22
5.  RĪKU SALĪDZINĀJUMS    25
  IZMANTOTĀ LITERATŪRA    26
Darba fragmentsAizvērt

5. RĪKU SALĪDZINĀJUMS
Abi rīki ir lietoti kā izmēģinājums versijas, kuras ir derīgas apmēram mēnesim. Rīki nav stingri specializēti tikai vienā jomā, izmantojot tos, var risināt vairākas problēmas. Abām izmēģinājuma versijām nebija pieejamas visas funkcijas.
Katrā rīkā var augšupielādēt dažāda formāta datu avotus, taču Data Match 2011 ir piedāvātas lielākas iespējas nekā otram rīkam. Kā arī WinPure Clean & Match dod iespēju strādāt tikai ar divām tabulām vienlaicīgi un katrā no tām maksimālais ierakstu skaits, kurš var būt ielādēts ir 20 ieraksti.
Datu analīzi, statistikas grafiku veidošanu veic abi rīki.
Nevajadzīgo simbolu dzēšana Data Match 2011 rīkā ir lielākā mērā automatizēta, jo nepieciešams tikai norādīt funkciju noteiktai kolonai, atšķirībā no WinPure Clean & Match, kur katrai kolonai atsevišķi ir jāatver dialoglodziņš un jāizvēlas veicamās darbības, kā arī nav iespējams definēt pašam kādus simbolus dzēst un kādus atstāt.
Teksta labošanas posmā Data Match 2011 piedāvā augšupielādēt failu ar nepieciešamām izmaiņām vai vienkārši definēt kādas izmaiņas ir veicamas noteiktai vērtībai, bet WinPure Clean & Match rīkam ir jākonvertē jauna vērtība katram ierakstam.
Tikai WinPure Clean & Match rīks piedāvā sašķelt vai sapludināt kolonu vērtības, kas, veicot praktisko daļu, noderēja, lai vēlāk varētu sekmīgi veikt kartēšanu.
Dublikātu atrašanas process saprotamāks un vieglāk realizējams manuāli WinPure Clean & Match rīkam, kur ir ievērota strikta soļu secība. Piemēram, kamēr nebūs veikta kartēšana, atbilstoši izvēlētajām tabulām un tās laukiem, nebūs iespējas sākt otro soli. Data Match 2011 dublikātu atrašana notiek vieglāk, jo process ir automatizēts – kartēšana, formulu izveide un dzēšana pēc kategorijām.
Kaut gan rīki veic gandrīz vienas un tās pašas funkcijas, taču process ir atšķirīgs. Ar katru no rīkiem tika uzdevumi, kurus viens veica labāk nekā otrs. Tāpēc pilnīgi apstiprināt ieteikums, kurš bija sastopams vairākos avotos – kvalitatīvākus datus var iegūt, ja lietot vairākus rīkus pat tad, ja tie ir specializēti vienai kļūdu grupai.…

Autora komentārsAtvērt
Parādīt vairāk līdzīgos ...

Nosūtīt darbu e-pastā

Tavs vārds:

E-pasta adrese, uz kuru nosūtīt darba saiti:

Sveiks!
{Tavs vārds} iesaka Tev apskatīties interneta bibliotēkas Atlants.lv darbu par tēmu „Datu attīrīšana: problēmas un aktuālās pieejas”.

Saite uz darbu:
https://www.atlants.lv/w/891761

Sūtīt

E-pasts ir nosūtīts.

Izvēlies autorizēšanās veidu

E-pasts + parole

E-pasts + parole

Norādīta nepareiza e-pasta adrese vai parole!
Ienākt

Aizmirsi paroli?

Draugiem.pase
Facebook
Twitter

Neesi reģistrējies?

Reģistrējies un saņem bez maksas!

Lai saņemtu bezmaksas darbus no Atlants.lv, ir nepieciešams reģistrēties. Tas ir vienkārši un aizņems vien dažas sekundes.

Ja Tu jau esi reģistrējies, vari vienkārši un varēsi saņemt bezmaksas darbus.

Atcelt Reģistrēties