700 – 900 PLN +VAT (B2B)
Opis projektu:
Dołączysz do zespołu inżynierii danych jako Data Engineer.
Masz okazję stać się kluczową częścią projektowania i budowania platform danych nowej generacji. Będziesz rozwijać, utrzymywać, testować i oceniać przepływy danych.
Po powrocie do biura praca zdalna w wymiarze 20-40%.
- Min. 3 lata doświadczenia z Python i PySpark
Praktyczne doświadczenie w programowaniu z Jenkins lub Bamboo, JIRA, Bitbucket i / lub Git / Stash - Doświadczenie w pracy z Hadoop (Cloudera)
- Biegła znajomość języka angielskiego (w mowie i piśmie)
Zespół pracuje nad aplikacją służącą do klasyfikowania transakcji klientów pod kątem ryzyka, która usprawni proces wykrywania bezprawnych działań w systemie finansowym. Odbywa się to przez wykorzystanie uczenia maszynowego i dużych zbiorów danych. Aplikacja została napisana w języku Python i jest hostowane na platformie Openshift, a dane są przechowywane i Hadoop oraz przetwarzane za pomocą Apache Spark.