Čo sú veľké dáta – jednoduché vysvetlenie s príkladom

Výraz Big Data sa čoraz častejšie používa takmer všade na planéte – online aj offline. A netýka sa to len počítačov. Spadá pod všeobecný pojem nazývaný informačné technológie(Information Technology) , ktorý je v súčasnosti súčasťou takmer všetkých ostatných technológií a študijných odborov a podnikov. Big Data nie sú veľký problém. Humbuk okolo toho je určite dosť veľký problém, ktorý vás zmiatne. Tento článok sa zaoberá tým, čo sú veľké dáta(Big Data) . Obsahuje tiež príklad toho, ako NetFlix využíval svoje dáta, alebo skôr Big Data , aby lepšie slúžil potrebám svojich klientov.

Čo sú veľké dáta

Čo sú veľké dáta

Dáta ležiace na serveroch vašej spoločnosti boli dovčera len dátami – triedenými a archivovanými. Zrazu sa slang Big Data stal populárnym a teraz sú dátami vo vašej spoločnosti Big Data . Tento výraz zahŕňa všetky údaje, ktoré vaša organizácia doteraz uchovávala. Zahŕňa údaje uložené v cloude a dokonca aj adresy URL(URLs) , ktoré ste si pridali medzi záložky. Vaša spoločnosť možno nezdigitalizovala všetky údaje. Možno ste už neštrukturovali všetky údaje. Ale potom sú všetky digitálne, papierové, štruktúrované a neštruktúrované údaje s vašou spoločnosťou teraz Big Data .

Stručne povedané, všetky údaje – či už kategorizované alebo nie – prítomné na vašich serveroch sa súhrnne nazývajú VEĽKÉ ÚDAJE(BIG DATA) . Všetky tieto údaje možno použiť na získanie rôznych výsledkov pomocou rôznych typov analýz. Nie je potrebné, aby všetky analýzy využívali všetky údaje. Rôzne analýzy využívajú rôzne časti BIG DATA na vytvorenie potrebných výsledkov a predpovedí.

Veľké údaje(Big Data) sú v podstate údaje, ktoré analyzujete s cieľom získať výsledky, ktoré môžete použiť na predpovede a iné účely. Keď použijete výraz Big Data , vaša spoločnosť alebo organizácia zrazu pracuje s informačnou(Information) technológiou najvyššej úrovne na odvodenie rôznych typov výsledkov pomocou rovnakých údajov, ktoré ste úmyselne alebo neúmyselne uložili v priebehu rokov.

Aké veľké sú veľké dáta

V podstate sú všetky údaje spojené s veľkými údajmi(Big Data) , ale mnohí výskumníci súhlasia s tým, že veľké údaje –(Big Data –) ako také – nemožno manipulovať pomocou bežných tabuliek a bežných nástrojov na správu databáz. Potrebujú špeciálne analytické nástroje, ako je Hadoop (budeme to študovať v samostatnom príspevku), aby bolo možné analyzovať všetky údaje naraz (môže zahŕňať iterácie analýzy).

Na rozdiel od vyššie uvedeného, ​​hoci nie som odborníkom na túto tému, povedal by som, že údaje akejkoľvek organizácie – veľkej alebo malej, organizovanej alebo neorganizovanej – sú pre túto organizáciu veľkými údajmi a že organizácia si môže vybrať svoje vlastné nástroje na analýzu údajov.(Contrary to the above, though I am not an expert on the subject, I would say that data with any organization – big or small, organized or unorganized – is Big Data for that organization and that the organization may choose its own tools to analyze the data.)

Za normálnych okolností ľudia na analýzu údajov vytvárali rôzne súbory údajov na základe jedného alebo viacerých spoločných polí, aby sa analýza stala jednoduchou. V prípade veľkých dát(Big Data) nie je potrebné vytvárať podmnožiny na ich analýzu. Teraz máme nástroje, ktoré dokážu analyzovať údaje bez ohľadu na to, aké veľké sú. Pravdepodobne tieto nástroje samotné kategorizujú údaje, aj keď ich analyzujú.

Považujem za dôležité spomenúť dve vety z knihy „Big Data“ od Jimmyho Gutermana(Jimmy Guterman) :

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-a-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Takže vidíte, že objem aj analýza sú dôležitou súčasťou veľkých dát(Big Data) .

Prečítajte si(Read) : Čo je dolovanie údajov?(What is Data Mining?)

Big Data Concepts

Toto je ďalší bod, s ktorým väčšina ľudí nesúhlasí. Niektorí odborníci tvrdia, že koncepty veľkých dát(Big Data Concepts) sú tri V:

  1. Objem
  2. Rýchlosť
  3. Rozmanitosť

Niektorí iní pridávajú do konceptu niekoľko ďalších V:

  1. Vizualizácia
  2. Vernosť (spoľahlivosť)
  3. Variabilita a
  4. Hodnota

Konceptom veľkých dát(Big Data) sa budem venovať v samostatnom článku, pretože tento príspevok je už veľký. Podľa môjho názoru prvé tri písmená V stačia na vysvetlenie pojmu Big Data .

Príklad veľkých dát – ako to NetFlix(Big Data Example – How NetFlix) použil na riešenie svojich problémov

V roku 2008 došlo v NetFlixe(NetFlix) k výpadku, kvôli ktorému mnohí zákazníci zostali v nevedomosti. Zatiaľ čo niektorí mali stále prístup k streamovacím službám, väčšina z nich nemohla. Niektorým zákazníkom sa podarilo získať vypožičané DVD(DVDs) , zatiaľ čo iným sa to nepodarilo. Blogový príspevok na Wall Street Journal hovorí , že Netflix práve spustil streamovanie na požiadanie.

Výpadok prinútil manažment zamyslieť sa nad možnými budúcimi problémami, a teda; zmenilo sa na veľké dáta(Big Data) . Pomocou týchto údajov analyzovala oblasti s vysokou návštevnosťou, citlivé body a priepustnosť siete atď. a pracovala na nich, aby skrátila prestoje, ak sa v budúcnosti vyskytne problém, keď sa to stalo globálnym. Tu je odkaz(the link) na blog Wall Street Journal(Wall Street Journal Blog) , ak si chcete pozrieť príklady veľkých dát(Big Data) .

Vyššie uvedené sumarizuje, čo sú Big Data v laickom jazyku. Môžete to nazvať veľmi jednoduchým úvodom. Plánujem napísať niekoľko ďalších článkov o súvisiacich faktoroch, ako sú – Koncepty(Concepts) , Analýza(Analysis) , Nástroje(Tools) a využitie veľkých dát(uses of Big Data) , Big Data 3 V atď. Ak by ste medzitým chceli k vyššie uvedenému niečo pridať, komentujte a zdieľajte s nami.

Čítať ďalej(Read next) : Čo je to Web Scraping ?



About the author

Mám vzdelanie v oblasti počítačového inžinierstva a informačných technológií, čo mi dalo jedinečný pohľad na platformy Windows 10 a 11. Najmä mám skúsenosti s Windows 10 " Desktop Experience " a prehliadačom Microsoft Edge. Moje skúsenosti s týmito dvoma platformami mi umožňujú hlboko pochopiť, ako fungujú, a moje odborné znalosti v týchto oblastiach mi umožňujú poskytovať spoľahlivé rady, ako ich zlepšiť.



Related posts