A globális adatláda környezet fenntartása, fejlesztése és optimalizálása, biztosítva a magas adatminőséget, megbízhatóságot és általános teljesítményt
Magas teljesítményű adatfeldolgozási csővezetékek és munkafolyamatok tervezése és megvalósítása Python, Spark és Databricks felhasználásával
Skálázható és hatékony adatintegrációs és feldolgozási megoldások kezelése Azure Data Factory, Databricks és Event Hub használatával
Robosztus adatkezelési folyamatok kialakítása és fejlett adatlekérdezés és minőség-ellenőrzés végrehajtása SQL és big data technológiák használatával
Műveleti feladatok automatizálása és az infrastruktúra karbantartásának támogatása shell scripting és alap UNIX ismeretek felhasználásával
Adatmodellezési kezdeményezések támogatása az összeszerelő struktúrák tervezése érdekében és minden technikai folyamat dokumentálása a működési folyamatosság biztosítása érdekében
Requirements
Erős háttér és ismeretek az adatbázisok kezelésében (általános SQL tudás, adatlekérdezés, adatminőség-ellenőrzés)
Erős programozói ismeretek Python-ban (pandas, numpy)
Fejlett Big Data / adatvarázsló keretrendszer ismerete (Spark, Databricks)
Erős felhő ismeretek és Azure Data Factory, Databricks, Event Hub kezelése
Alap szintű UNIX operációs rendszer ismeretek, különösen shell scripting terén
Alap szintű hálózati problémák és kapcsolatok követelményeinek ismerete
Alap szintű adatmodellezési elvek ismerete
Adatközpontú gondolkodás
Strukturált, analitikai gondolkodás
Jó kommunikációs készségek
Jól szervezett
Képes több műszakos munkavégzésre (hétfőtől péntekig, 07:00