Andmete kaevandamine

Mis on andmete hankimine:

Andmete kaevandamine on ingliskeelne termin, mis on seotud infotehnoloogiaga, mille tõlkimine on andmete kaevandamine . See koosneb funktsionaalsusest, mis koondab ja korraldab andmeid, leides neis asjakohaseid mustreid, ühendusi, muutusi ja anomaaliaid .

Mõiste „ kaevandamine” ilmus esmakordselt 1990. aastal andmebaasi kogukondades. Andmete kaevandamine on protsessianalüüsi samm, mida tuntakse KDD-na ( Knowledge Discovery in Databases ), mille sõnasõnaline tõlge on "Knowledge Discovery in Databases".

Andmete kaevandamine võib jagada mõneks põhietapiks: uurimine, mudeli loomine, mustrite määratlemine ja valideerimine ja kontrollimine.

Andmete kaevandamine on arvutite maailmas suhteliselt hiljutine tava ning see kasutab infootsingut, tehisintellekti, mustri äratundmist ja statistilisi meetodeid erinevate andmete vaheliste seoste otsimiseks, mis võimaldavad teil saada kasulikke teadmisi ettevõttele või üksikisikule. Ettevõtte jaoks võib kaevandamine olla oluline vahend, mis suurendab innovatsiooni ja kasumlikkust.

Andmebaaside kasutamine on suurte andmebaaside puhul üsna tavaline ning nende kasutamise lõpptulemust saab kuvada reeglite, hüpoteeside, otsustuspuude, dendrogrammide jne kaudu.

Hästi läbi viidud andmete kaevandamine peaks täitma selliseid ülesandeid nagu anomaalia tuvastamine, assotsieerimisreeglite õppimine (sõltuvuse modelleerimine), klastrite moodustamine, klassifitseerimine, regressioon ja kokkuvõte. Andmetöötlusprotsess toimub tavaliselt andmehoidlas sisalduvate andmete abil .

Andmetöötlusele on pühendatud mitmeid ettevõtteid ja tarkvara, kuna andmebaaside mustrite tuvastamine on üha olulisem. Asjakohaste standardite kindlakstegemine ei ole aga arvutimaailma jaoks ainulaadne. Inimese aju kasutab sarnaseid protsesse, et tuvastada mustrid ja omandada teadmisi.

Viimastel aastatel on andmekaevandust laialdaselt kasutatud teaduse ja tehnika valdkonnas, nagu bioinformaatika, geneetika, meditsiin, haridus ja elektrotehnika.

Andmete kaevandamise mõiste on sageli seotud inimeste käitumise kohta teabe hankimisega . Sel põhjusel tekitab mõnes olukorras andmete kogumine õiguslikke küsimusi ja eraelu puutumatuse ja eetikaga seotud küsimusi. Sellele vaatamata väidavad paljud inimesed, et andmete kaevandamine on eetiliselt neutraalne, kuna sellel ei ole eetilisi tagajärgi.

Reaalsete andmete kaevandamise näited

Andmete kaevandamist kasutavad ettevõtted ja organisatsioonid sageli kasutajate / töötajate / klientide kohta. Näiteks on avalikus sektoris võimalik kontrollida töötaja perekonnaseisu ja palka, mida ta teenib, et näha, kas see mõjutab tema abielu.

Sellised ettevõtted nagu selvehallide ketid saavad kasutada neid ristandmeid koos ostetud toodete kindlaksmääramiseks. Kui toode X ostab ka toote Y, siis võib olla hea mõte paigutada need kaks toodet lähemale, et kliendil oleks lihtsam osta.