Tiedonlouhinta
Tiedonlouhinta (engl. data mining) tarkoittaa joukkoa menetelmiä, joilla pyritään oleellisen tiedon löytämiseen suurista datajoukoista.
Sovelluskohteet
[muokkaa | muokkaa wikitekstiä]Tiedonlouhintaa voidaan soveltaa hyvin laaja-alaisesti, sillä lähtökohdaksi tarvitaan ainoastaan dataa. Tyypillisesti tiedonlouhinnassa käytetty data on esimerkiksi mittauksia teollisuusprosessista, otteita asiakastietokannasta tai vaikkapa web-palvelimen loki-tiedostoja.
Menetelmät
[muokkaa | muokkaa wikitekstiä]Määritelmänä tiedonlouhinta ei rajaa käytettäviä menetelmiä. Useimmiten käytettäviä algoritmeja ovat mm. erilaiset klusteroinnit, korrelaatiot, neuroverkot, itseorganisoituvat kartat, jne. Yleisesti ottaen tiedonlouhinnan menestyksellisessä hyödyntämisessä kaikkein oleellisinta on datan ja sen eri suureiden kokonaisvaltainen ymmärtäminen. Myös pelkkä innovatiivinen lähestymistapa esimerkiksi datan visualisoinnissa voi auttaa näkemään tietovaraston hyötyjä täysin uudesta perspektiivistä.