Delavnica: Uvod v obdelavo velepodatkov v Pythonu

Kratek opis: Udeleženci bodo spoznali osnove knjižnice Pandas, ki je trenutno najbolj razširjena knjižnica za delo s podatki za potrebe strojnega učenja, podatkovne znanosti in visoko zmogljivega računalništva. Predstavljene bodo osnovne podatkovne strukture, ki jih nudi knjižnica in funkcije za nalaganje podatkov v formatih CSV in JSON skupaj s funkcijami za analizo in delo s podatki. Na primeru večje obstoječe podatkovne zbirke bo prikazana uporaba namenskih funkcij za prečiščevanje, filtriranje in enostavno vizualizacijo podatkov.

Podrobnejši opis: Na tej delavnici bodo udeleženci pridobili poglobljeno razumevanje osnov knjižnice Pandas, ene izmed najbolj priljubljenih knjižnic za obdelavo podatkov, posebej primerne za potrebe strojnega učenja, podatkovne znanosti in visoko zmogljivega računalništva. Program delavnice bo zajemal predstavitev temeljnih podatkovnih struktur, kot so podatkovni okvirji in serije, ki omogočajo učinkovito shranjevanje in obdelavo podatkov v različnih oblikah.

Osrednji del izobraževanja bo usmerjen v uporabo funkcij knjižnice Pandas za nalaganje podatkov, predvsem v formatih CSV in JSON. Udeleženci bodo spoznali ključne postopke za uvoz in pripravo podatkov, kar vključuje čiščenje, združevanje in organizacijo podatkov ter delo z manjkajočimi vrednostmi. Poleg tega bodo obravnavani pomembni vidiki obdelave podatkov, kot so filtriranje, združevanje ter izvajanje osnovnih statističnih analiz. Delavnica bo vsebovala praktični primer uporabe Pandas na obsežnejši, realni podatkovni zbirki, pri čemer bodo udeleženci pridobili vpogled v postopke čiščenja podatkov, filtriranja in priprave na analizo. Poudarek bo tudi na osnovah vizualizacije, ki omogoča učinkovito predstavitev in raziskovanje podatkov, kar udeležencem omogoča, da odkrijejo pomembne vzorce in trende.

Zahtevnost: Osnovna

Jezik: Slovenski

Termin: 27. 11. 2024 od 9.00 – 13.00

Omejitev števila udeležencev: 30

Virtualna lokacija: MS TEAMS

Priporočeno predznanje: Osnovno poznavanje programskega jezika Python

Ciljna publika: Raziskovalci, inženirji, študenti, podatkovni znanstveniki, podatkovni analitiki

Potek izobraževanja: Izobraževanje poteka na daljavo v okolju MS Teams. Udeleženci sodelujejo s pomočjo zvezkov Jupyter, ki jih odprejo na platformi Google Colab.

Na izobraževanju pridobljena znanja:

Razumevanje postopkov obdelave velepodatkov
Uporaba osnovnih funkcij knjižnice Pandas za obdelavo velepodatkov
Uporaba naprednih funkcij knjižnice Pandas za delo z velepodatki
Optimizacija nalaganja in shranjevanja velepodatkov
Vizualizacija in analiza velepodatkov

Organizator:

Predavatelji:

Ime:	Mladen Borovič
Opis:	Mladen Borovič je asistent na Fakulteti za elektrotehniko, računalništvo in informatiko Univerze v Mariboru (UM FERI). Njegova raziskovalna področja so aplikacije umetne inteligence, priporočilni sistemi in iskalnike, sistemi za detekcijo podobnih vsebin, obdelava naravnega jezika in visokozmogljivo računalništvo.
E-mail:	mladen.borovic@um.si

Več informacij

Več informacij lahko poiščete na spletni strani dogodka, kjer se lahko tudi prijavite.

Kontakt

Uporabniki

Sledite nam