Praca.pl Praca Mazowieckie Warszawa Specjalista ds. sztucznej inteligencji Warszawa
Senior Embedded Engineer/Architect with AI for Edge

Senior Embedded Engineer/Architect with AI for Edge

R Systems
Warszawa
starszy specjalista (senior) / ekspert
pełny etat
umowa o pracę
praca hybrydowa / zdalna
za 2 dni wygasa14 dni temu
We are seeking a talented Edge AI Engineer with specialized expertise in GPU/TPU acceleration to join our team. The ideal candidate will have extensive hands-on experience in local Large Language Models (LLM) inference with embedded GPU/TPU architectures. As Principal Engineer specializing in Edge AI, you will play a crucial role in shaping the future Edge AI solution, leveraging the power of GPU/TPU acceleration and enterprise grade, large scale edge compute. 

The successful candidate will combine technical excellence with effective leadership, creating a positive impact on both projects and team dynamics. 
 
Senior Embedded Engineer/Architect with AI for Edge
Miejsce pracy: Warszawa
Key Responsibilities: 
 
High-Level Design and Architecture 
  • Influence the Edge AI strategy by providing expert advice on design and architecture
  • Make critical decisions regarding technical directions, scalability, and system performance
  • Develop and optimize AI inference models for deployment on edge devices with embedded GPU/TPU accelerators, focusing on local Low Latency Model (LLM) inference
  • Implement and fine-tune low-latency model inference pipelines to meet real-time performance requirements
  • Collaborate with cross-functional teams to integrate AI inference solutions into edge computing platforms and applications
  • Collaborate with the GPU Hardware Design Team to design and optimize GPUs that power next-generation devices
  • Conduct performance profiling and optimization to maximize the efficiency of GPU/TPU acceleration for local LLM inference
  • Work on micro-architecture development, ensuring efficient execution of graphics, compute, and AI workloads within energy and area constraints
  • Stay current with advancements in GPU/TPU technologies and edge AI frameworks, incorporating them into solution designs as appropriate
  • Provide technical expertise and support to project teams, ensuring successful implementation and deployment of edge AI solutions
Team Leadership:  
  • Lead and inspire a team of engineers, providing guidance, setting goals, and ensuring collaboration
  • Oversee project planning, execution, and delivery, ensuring alignment with business objectives 
  • Manage all phases of technical projects, from conception to completion 
  • Develop project specifications, track progress, and control costs
  • Foster a positive work environment, encouraging professional growth and knowledge sharing
Qualifications: 
  • Bachelor’s degree in computer science, Engineering, or a related field; Master’s degree preferred
  • 5+ years of hands-on experience in AI model development and deployment, with a focus on edge computing and local LLM inference
  • Strong programming skills in languages such as Python and C++ 
  • Proficiency in LLM frameworks (e.g., vLLM, Text generation inference, OpenLLM, Ray Serve, and HuggingFace Transformers) and deep learning libraries
  • Extensive experience with GPU/TPU acceleration for AI inference, including optimization techniques (tensor, pipeline, data, sharded data parallelism) and performance tuning, 
  • Hands on experience with one or more GPU frameworks: CUDA, Vulkan, OpenCL  
  • Deep knowledge of GPU memory layout, familiarity with NVIDIA Jatison, ARM Mali or relevant SoC configurations 
  • Knowledge of parallel computation, memory scheduling, and structural optimization 
  • Excellent problem-solving and analytical skills, with a passion for innovation and continuous learning
Additional Skills (Preferred): 
  • Experience with edge device hardware and software integration
  • Familiarity with edge computing architectures and IoT platforms
  • Experience with edge AI applications in domains such as robotics, autonomous vehicles, or industrial automation

We kindly inform we will contact only selected candidates.

If you are interested, please send your application by clicking on the button.

 

At R Systems EU, we embrace diversity. Inclusion is a priority for us, and we are eager to foster an environment where everyone feels valued. By joining us, all candidates will be part of a collective effort to build a future that's both diverse and united. We offer respect to all our candidates and the same recruitment process to all, regardless of their gender, age, nationality, ethnicity, religion, disability, sexual orientation, education, profession, and family status. We promote mutual TRUST and RESPECT in our working environment with the conviction that this will have a positive impact on reputation and business integrity towards all our partners and worldwide clients.
Informujemy, że administratorem danych jest R Systems Computaris Poland z siedzibą w Warszawie, ul. Jana Pawła II 80 (dalej jako "administrator"). Masz prawo do żądania dostępu do swoich danych osobowych, ich sprostowania, usunięcia lub ograniczenia przetwarzania, prawo do wniesienia sprzeciwu wobec przetwarzania, a także prawo do przenoszenia danych oraz wniesienia skargi do organu nadzorczego. Dane osobowe przetwarzane będą w celu realizacji procesu rekrutacji. Podanie danych w zakresie wynikającym z ustawy z dnia 26 czerwca 1974 r. Kodeks pracy jest obowiązkowe. W pozostałym zakresie podanie danych jest dobrowolne. Odmowa podania danych obowiązkowych może skutkować brakiem możliwości przeprowadzenia procesu rekrutacji. Administrator przetwarza dane obowiązkowe na podstawie ciążącego na nim obowiązku prawnego, zaś w zakresie danych dodatkowych podstawą przetwarzania jest zgoda. Dane osobowe będą przetwarzane do czasu zakończenia postępowania rekrutacyjnego i przez okres możliwości dochodzenia ewentualnych roszczeń, a w przypadku wyrażenia zgody na udział w przyszłych postępowaniach rekrutacyjnych - do czasu wycofania tej zgody. Zgoda na przetwarzanie danych osobowych może zostać wycofana w dowolnym momencie. Odbiorcą danych jest serwis Just Join IT oraz inne podmioty, którym powierzyliśmy przetwarzanie danych w związku z rekrutacją.
Aplikuj szybko
?  Co oznacza „Aplikuj szybko”?
„Aplikuj szybko” oznacza, że jednym kliknięciem zaaplikujesz na ogłoszenie. Pracodawca otrzyma CV użyte przez Ciebie przy wcześniejszym aplikowaniu lub ostatni dodany przez Ciebie plik w Moje CV. Aby skorzystać z funkcji “Aplikuj szybko” musisz być zalogowany.
 

Podobne oferty

  • Starszy architekt systemów wbudowanych z AI w Edge

    Praca.pl   Warszawa    praca zdalna / hybrydowa
    specjalista mid / senior / ekspert  umowa o pracę  pełny etat  rekrutacja online  aplikuj bez CV
    11 dni
    Zakres obowiązków: Projektowanie zaawansowanych systemów Edge AI i doradztwo strategiczne w tym obszarze; Decydowanie o technicznych aspektach projektów, ich skalowalności i wydajności; Optymalizacja AI do pracy na urządzeniach zewnętrznych z wykorzystaniem GPU/TPU; Szybka integracja i...
  • AI App Developer with Italian / French / German

    COGNIZANT TECHNOLOGY SOLUTIONS POLAND SP Z O O   Gdańsk    praca hybrydowa
    specjalista junior / mid / senior  umowa o pracę  pełny etat
    5 dni
    Work model: hybrid (3 days per week from the office in Gdansk or Warsaw) Minimum qualification: Bachelor’s degree in Computer Science, Information Technology, or a related field. 5-8 years of experience in app development, preferably using no-code/low-code platforms. Proven experience in creating...