Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Пређи на садржај

Big data

С Википедије, слободне енциклопедије

Big Data je pojam koji označava velike i kompleksne setove podataka, kod kojih tradicionalne aplikacije za obradu podataka nisu primenljive. Te skupove podataka karakterišu raznovrsnost formata, velike brzine obrade i pristupa, i veliki obim informacija[1]. Izazovi uključuju projektovanje i realizaciju infrastrukture i servisa za skladištenje velikih količina podataka, njihovu pretragu, analizu, deljenje i vizuelizaciju. Termin big data se često odnosi na upotrebu predikativne analitike ili drugih naprednih metoda za izdvajanje vrednosti iz podataka, a ne samo na određenu veličinu skupa podataka.

Big data koncept karakteriše prelazak sa relacionih na nerelacione baze podataka [2]. Kao što su na primer Guglov Bigtable i Amazonov Dynamo. Jedno od rešenja za infrastukturu Big Data je Hadoop, softver otvorenog koda. Big Data pruža mogućnost obrade podataka u realnom vremenu, a pretraga se vrši korišćenjem Map reduce (link) algoritma. Na primer, rezultati pretrage u Gugl pretraživaču se dobijaju u milisekundama upravo zahvaljujući ovim tehnologijama.

Virtualizacija i big data

[уреди | уреди извор]

Virtualizacija velikih podataka način je prikupljanja informacija s više izvora na istom mjestu. Skupljanje je virtualno: za razliku od drugih metoda, većina podataka ostaje na mjestu i preuzima se na zahtjev direktno iz izvornog sistema.[3]

Izveštaj McKinsey Global Institute iz 2011. karakteriše glavne komponente i ekosistem velikih podataka na sledeći način:[4][5]

  • Tehnike za analizu podataka, kao što su A/B testiranje, mašinsko učenje i obrada prirodnog jezika
  • Tehnologije velikih podataka, kao što su poslovna inteligencija, računarstvo u oblaku i baze podataka
  • Vizuelizacija, kao što su grafikoni, grafikoni i drugi prikazi podataka.
  1. ^ Elektronsko poslovanje, Božidar Radenković, Marijana Despotović-Zrakić, Zorica Bogdanović, Dušan Barać, Aleksandra Labus, Fakultet organizacionih nauka, 2015
  2. ^ http://www.christof-strauch.de/nosqldbs.pdf
  3. ^ „What Is Data Virtualization?”. www.datawerks.com (на језику: енглески). Архивирано из оригинала 10. 04. 2018. г. Приступљено 2018-05-14. 
  4. ^ Manyika, James; Chui, Michael; Bughin, Jaques; Brown, Brad; Dobbs, Richard; Roxburgh, Charles; Byers, Angela Hung (мај 2011). „Big Data: The next frontier for innovation, competition, and productivity” (PDF). McKinsey Global Institute. Приступљено 22. 5. 2021. 
  5. ^ Bernard Marr (2016). Big Data in Practice. Wiley. ISBN 978-1119231387.