Requirements: Polish
Company: Britenet
Region: remote, poland ,
Praca przy platformach risk compliance, analizie transakcji, systemach audytowych.
- Doswiadczenie w pracy z Azure Databricks, w tym tworzenie i optymalizacja potokw danych przy uzyciu Spark i PySpark
- Bardzo dobra znajomosc Delta Lake, w szczeglnosci w zakresie zarzadzania wersjonowaniem danych, partycjonowaniem i optymalizacja zapytan
- Umiejetnosc modelowania danych z wykorzystaniem podejsc takich jak Kimball, Snowflake lub Data Vault, oraz przeprowadzania tuningu wydajnosci
- Znajomosc Azure Data Factory (ADF), tworzenie i zarzadzanie pipelineami integracji danych
- Doswiadczenie z Azure Functions w kontekscie automatyzacji i orkiestracji przetwarzania danych
- Bieglosc w programowaniu w Pythonie oraz bardzo dobra znajomosc SQL w kontekscie inzynierii danych
- Praktyczna znajomosc formatw danych takich jak Parquet, Avro i JSON
- Znajomosc systemw kontroli wersji (Git) i pracy w zespolach programistycznych, w tym udzialu w przegladach kodu i praktykach CI/CD
- Umiejetnosc analizy duzych zbiorw danych i rozwiazywania problemw zwiazanych z ich przetwarzaniem i jakoscia
- Biegla znajomosc jezyka angielskiego (min. B2)
- Otwartosc na okazjonalna wizyte w biurze w Warszawie lub innym pobliskim oddziale klienta
Praca przy platformach risk compliance, analizie transakcji, systemach audytowych.
,[Projektowanie, implementacja i monitorowanie potokw danych w srodowisku chmurowym z uzyciem narzedzi takich jak Azure Data Factory i Databricks, Zarzadzanie struktura i wydajnoscia danych w Delta Lake, w tym optymalizacja, partycjonowanie i wersjonowanie, Projektowanie modeli danych i optymalizacja zapytan oraz procesw przetwarzania pod katem wydajnosci i skalowalnosci, Tworzenie i automatyzacja przeplyww danych z wykorzystaniem ADF oraz Azure Functions w ramach procesw orkiestracji, Tworzenie skryptw w Pythonie i SQL do przetwarzania, analizy i walidacji danych, Praca zespolowa z uzyciem Git oraz udzial w procesach CI/CD i przegladach kodu] Requirements: Spark, Python, SQL, Databricks, Delta Lake, Azure Data Factory, Git, CI/CD Additionally: Sport subscription, Private healthcare, International projects, Masterclazz training, Free coffee, Canteen, Playroom, Free snacks, Modern office, Startup atmosphere, No dress code.