Znanost o podacima – John D. Kelleher, Brendan Tierney

Autor: John D. Kelleher, Brendan Tierney
Broj stranica: 284
Godina izdanja: 2021
Vrsta uveza: meki
Jezik: hrvatski

157,50 kn

Opis

Znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje nejasnih i korisnih uzoraka iz velikih podataka (Big Data) s ciljem poboljšanja donošenja odluka temeljenjim na uvidima u velike podatke. Kao područje djelovanja, znanost o podacima obuhvaća skup načela, definicija problema, algoritama i procesa za izvlačenje neočiglednih, ali korisnih uzoraka ponašanja podataka iz velikih podataka. Ona je usko povezana s područjima rudarenja podataka i strojnog učenja, ali je opsegom od njih šira.

Danas znanost o podacima upravlja donošenjem odluka u gotovo svim dijelovima modernih društava. Neki od načina na koje znanost o podacima može utjecati na vaš svakodnevni život, između ostalog, uključuju: izbor oglasa koji vam se nude putem virtualnog oglašavanja; to su preporuke za filmove koje biste trebali pogledati, knjige koje biste trebali pročitati i prijateljske veze koje biste trebali uspostaviti; prijedloge o tome koje poruke e-pošte svrstati u mapu neželjene pošte; pogodnosti koje će vam se ponuditi prilikom obnove pretplate na uslugu mobitela; ponudu cijene premije zdravstvenog osiguranja koja vam se nudi; razmještaj i dinamiku funkcioniranja semafora u vašem području; sastav lijekova koje trebate; kao i to na kojim mjestima u vašem gradu vreba policija.

Cilj ove knjige je pružiti uvod u znanost o podacima koji pokriva njezina suštinska dostignuća, do razine koja osigurava principijelno razumijevanje područja.

Prvo poglavlje uvodi područje znanosti o podacima i daje kratak prikaz njegova razvoja. Također se objašnjava zašto je znanost o podacima važna danas i navode neki od čimbenika koji utječu na njezino usvajanje. Drugo poglavlje uvodi temeljne pojmove vezane uz same podatke. Ono također opisuje standardne faze provedbe projekata znanosti o podacima: razumijevanje poslovanja, razumijevanje podataka, priprema podataka, modeliranje, vrednovanje i implementacija. Treće poglavlje opisuje tipičnu infrastrukturu organizacija, uspostavljenu za potrebe znanosti o podacima, kao i neka suvremena rješenja vezana uz problem kolanja velikih skupova podataka unutar podatkovne infrastrukture, koja uključuju korištenje strojnog učenja integriranog s bazom podataka, korištenje sustava Hadoop za pohranu podataka i njihovu obradu te razvoj hibridnih sustava baza podataka koji glatko kombiniraju tradicionalna programska rješenja za baze podataka i rješenja slična Hadoopu. Četvrto poglavlje uvodi područje strojnog učenja i objašnjava neke od najpopularnijih algoritama i modela strojnog učenja, uključujući neuronske mreže, modele dubokog učenja i modele stabla odlučivanja. Peto poglavlje usredotočuje se na povezivanje ekspertize u domeni strojnog učenje s problemima iz stvarnog svijeta, prikazom niza standardnih poslovnih problema i opisivanjem njihova rješavanja uz pomoć strojnog učenja. Šesto poglavlje razmatra etičke posljedice znanosti o podacima, najnovija dostignuća u pravnoj regulativi u tom području, kao i neke nove računalne pristupe očuvanju privatnosti pojedinaca u procesima vezanim uz velike podatke. Naposljetku, sedmo poglavlje opisuje neka od područja u kojima će znanost o podacima imati značajan utjecaj u bliskoj budućnosti i postavlja neka od načela koja su važna za to hoće li projekt iz njezina dosega biti uspješan ili ne.