AI Model Optimization and Tool Development Engineer (NPU)
Pangyo (Software Dream Center), South Korea
42dot
42dot 의 AI Model Optimization and Tool Development Engineer (NPU) 는 자율주행 스택 최적화 및 온디바이스(on-device) LLM(대규모 언어 모델) 최적화를 중심으로, NPU 기반 AI 모델 최적화 및 관련 도구를 개발할 엔지니어를 모집합니다. 본 직무는 딥러닝 모델을 하드웨어 가속기에 맞게 최적화하고, 효율적인 실행을 보장하는 툴 체인을 설계하여 자율주행 및 LLM과 같은 AI 기술의 발전을 지원합니다.

Responsibilities

  • AI 모델 최적화
  • 자율주행 스택 및 온디바이스 LLM을 포함한 딥러닝 모델을 NPU 하드웨어에 맞게 최적화
  • 모델 압축(양자화, 프루닝 등), 연산자 퓨전, 메모리 최적화 기법을 활용하여 성능 개선

  • 툴 체인 개발
  • AI 모델 변환 및 최적화를 위한 툴체인 설계 및 구현
  • 딥러닝 프레임워크(TensorFlow, PyTorch 등)와의 통합 및 효율적인 워크플로우 제공
  • NPU 대상 코드 생성 및 디버깅 도구 개발

  • 자율주행 및 LLM 스택 최적화
  • 자율주행에 필요한 AI 모듈(예: 객체 인식, 경로 계획 등)을 최적화하여 실시간 실행 성능 확보
  • LLM 추론 최적화를 통해 메모리 효율성과 속도 향상
  • 멀티모달 AI 스택에서 모델 병렬화 및 분산 실행 기술 적용

  • 성능 분석 및 개선
  • AI 모델의 런타임 성능 분석 및 병목현상 파악
  • 하드웨어 리소스(NPU, GPU, 메모리 등) 활용률을 극대화할 수 있는 기술 구현

  • 리서치 및 신기술 도입
  • AI 모델 최적화 및 NPU 관련 최신 기술 동향을 연구
  • NPU 성능을 극대화할 수 있는 새로운 기법 실험 및 도입

Qualifications

  • 컴퓨터 공학, AI 또는 관련 분야 학사/석사 학위
  • AI 모델 최적화 및 하드웨어 가속기 경험 (3년 이상)
  • NPU, GPU, 또는 ASIC을 활용한 AI 최적화 경험
  • TensorFlow Lite, ONNX, PyTorch와 같은 딥러닝 프레임워크 및 모델 변환 도구 사용 경험
  • 양자화, 프루닝, 지연 평가(Lazy Evaluation)와 같은 모델 압축 및 최적화 기술
  • C++/Python과 같은 프로그래밍 언어 및 하드웨어-가속 코드 작성 경험
  • 메모리 관리 및 병렬 컴퓨팅 기술

Preferred Qualifications

  • 자율주행 스택 (예: SLAM, 경로 계획, 객체 인식) 경험
  • 온디바이스 AI/LLM 관련 최적화 경험
  • LLVM/MLIR 등 컴파일러 기술 활용 경험
  • 임베디드 시스템에서의 AI 최적화 경험
  • 오픈소스 AI 최적화 프로젝트에 기여한 경험

Interview Process

  • 서류전형 - 코딩테스트 - 1차면접 (1시간 내외) - 2차면접 (3시간 내외) - 최종합격
  • 전형절차는 직무별로 다르게 운영될 수 있으며, 일정 및 상황에 따라 변동될 수 있습니다.
  • 전형일정 및 결과는 지원서에 등록하신 이메일로 개별 안내드립니다.

Additional Information

  • 모든 제출파일은 PDF 양식으로 업로드를 부탁드립니다.
  • 국가보훈대상자 및 취업보호대상자는 관계법령에 따라 우대합니다.
  • 장애인 고용촉진 및 직업재활법에 따라 장애인 등록증 소지자를 우대합니다.
  • 42dot은 의뢰하지 않은 서치펌의 이력서를 받지 않으며, 요청하지 않은 이력서에 대해 수수료를 지불하지 않습니다.