Data Scientist Specialist
Miejsce pracy: Warszawa
Opis roli:
- Agregacja dużych wolumenów nieuporządkowanych danych oraz ich transformacja do pożądanego formatu;
- Praca z różnorodnymi językami programowania, w tym R i Python;
- Komunikacja i współpraca z obszarami IT oraz biznesem;
- Wyszukiwanie w danych reguł i wzorców, a także wykrywanie trendów, w celu optymalizacji procesów i poprawy wyników biznesowych;
- Eksploracja danych, ocena ich jakości i specyfiki w kontekście realizowanych projektów analitycznych;
- Wizualizacja i prezentacja danych;
- Uczenie Maszynowe: preprocessing danych, projektowanie i trenowanie modeli;
- Analiza nieustrukturyzowanych danych w celu ustalenia kluczowych możliwości dla biznesu;
- Wyszukiwanie wzorców i powtarzalnych zdarzeń które można wykorzystać w optymalizacji;
- Tworzenie modeli predykcji w oparciu o analizę statystyczno-matematyczną;
- Specyfikacja zakresu i struktury danych niezbędnych do implementacji wybranych technik analitycznych oraz wdrażanie procedury ich przetwarzania;
- Formułowanie i testowanie hipotez optymalizacyjnych;
- Rozwój własnych kompetencji, śledząc najnowsze trendy w branży badań i analiz etc.
Oczekiwania wobec kandydatów:
- Must Have
- Minimum 2 lata doświadczenia przy analizie danych / data mining;
- Wykształcenie wyższe w zakresie nauk ścisłych związanych z informatyką (informatyka, matematyka, fizyka itp.);
- Bardzo dobra znajomość min. jednego z języków programowania np. Python, Java (m.in. 1,5 roku);
- Znajomość metodyk Data Driven Business;
- Znajomość j. angielskiego przynajmniej na poziomie umożliwiającym porozumiewanie się oraz czytanie dokumentacji technicznej;
- Doświadczenie w statystyce, testach i uczeniu maszynowym;
- Biegła znajomość języka SQL;
- Umiejętność wizualizacji danych oraz znajomość technologii raportowania;
- Zaangażowanie, komunikatywność, otwartość, analityczne myślenie, uporządkowanie, precyzja, dobra umiejętność organizacji pracy.
- Deep Learning, Deep Neural Networks znajomość teoretyczna i praktyczna algorytmów Głębokiego Uczenia. Podstawowa znajomość Keras / TensorFlow.
- Doświadczenie w metodach przetwarzania obrazów (Computer Vision), i/lub przetwarzania języka naturalnego (NLP), i/lub OCR.
- Doświadczenie w wykorzystaniu pakietu scikit-learn.
- Umiejętność pracy z repozytorium kodu źródłowego (np. Git);
- Nice To Have
- Praktyczne doświadczenie w tworzeniu oprogramowania wykorzystującego model obliczeń rozproszonych na platformie Hadoop (MapReduce/YARN/Spark RDD);
- Znajomość Apache Hadoop i narzędzi pokrewnych (Hive, Spark) w tym umiejętność konfiguracji narzędzi;