Back to jobs
T

ML Engineer (OCR)

SeoulPosted 3 weeks ago
remote

Job Description

합류하게 될 팀에 대해 알려드려요

  • 토스증권 ML Engineer(OCR)은 Automation Platform Team에 속해 있어요.
  • Automation Platform Team(APT)은 '기술로 문제를 해결하여 사람들에게 실질적인 가치를 제공한다'는 미션 아래, 토스증권의 생산성을 10배로 끌어올리고 지속 가능한 스케일업을 만들어가는 팀이에요.
  • 이를 위해 OCR, 스크래핑, QA 자동화 등 다양한 자동화 제품을 직접 만들고 운영하는 end-to-end 엔지니어링을 담당하고 있어요.

 

 

합류하면 함께 할 업무에요

☑️ 토스증권 Retail 업무 자동화 OCR 개발을 담당해요.

  • 토스증권 내 수작업으로 처리되고 있는 다양한 Retail 운영 업무를 OCR로 자동화해요.
  • 외부 기관에서 발급되는 서류와 내부 검수 대상 콘텐츠를 단계적으로 OCR 파이프라인에 편입시키고, 엣지 케이스에 대한 인식률을 끌어올리며 커버리지를 확장해 나가요.
  • 도메인 PO/엔지니어와 직접 문제를 정의하고, OCR이 해결해야 하는 지점과 현실적인 대안을 함께 설계해요.

☑️ OCR 학습 파이프라인을 구축해요.

  • OCR/VLM 모델을 파인튜닝하고 고도화해요.
  • 데이터 수집/전처리/augmentation/평가/배포까지 전 단계를 ML Engineer가 주도해요.

☑️ OCR 모델 스택을 운영을 담당해요.

  • 오픈소스 OCR/VLM, document layout, orientation 분류기 등 현재 스택을 다루며, 필요에 따라 모델을 교체하거나 in-house로 학습한 모델을 도입해요.
  • OCR 모델뿐만 아니라, 전/후처리 로직 등 end-to-end로 품질을 책임져요.

☑️ 운영 환경의 모델 안정성을 책임져요.

  • 서비스 엔지니어와 긴밀하게 협업하며 런타임 안정성과 정확도를 함께 끌어올려요.

 

 

이런 분과 함께하고 싶어요

  • 이미지/문서 처리 경험이 있는 분을 찾고 있어요.
    •  Python(OpenCV, PyMuPDF), Node(sharp) 라이브러리를 활용한 이미지/문서 처리 경험이 필요해요.
    • 대량의 이미지를 범주화하고, 지식베이스에서 잘 찾아낼 수 있도록 임베딩, 인덱싱 구조를 설계/최적화해 본 경험이 있는 분이면 좋아요.
  • VLM/OCR 모델링 경험이 있는 분을 찾고 있어요.
    • SOTA VLM/OCR 모델을 빠르게 적용 및 평가해 본 경험이 필요해요.
    • LoRA 등 도메인 특화 튜닝 경험이나, 작은 모델의 정확도/가용성 최적화 경험, document layout 모델 활용 경험이 있으면 좋아요.
  • 학습 데이터 파이프라인 설계 경험이 있는 분을 찾고 있어요.
    • 도메인 문서를 합성하고 레이블을 자동 생성해 봤거나, 실제 입력 분포를 모사하는 augmentation 전략(스캔,팩스,JPEG 등)을 설계해 본 경험이 필요해요.
    • 또는 학습 데이터가 부족한 상황에서도 개발해 본 경험이 있으면 좋아요.

 

 

이런 경험이 있다면 더 좋아요 

  • 개인정보 태깅, 도장, 저품질 스캔 등 금융 도메인 문서의 특수성을 이해하고 다뤄본 경험이 있다면 더 좋아요.
  • 데이터 수집/전처리 → 모델링 → 서비스 적용까지 전체 파이프라인을 혼자서 끌고 갈 수 있는 분이면 더 좋아요.
  • DVC, MLflow 등으로 학습 데이터와 실험 결과를 재현 가능하게 관리해 본 경험이 있다면 더 좋아요.
  • 새 논문/릴리스를 빠르게 찾아 사내 적용 가능성을 판단할 수 있는 분이면 더 좋아요.
  • 정부 문서, 개인정보 문서 등 학습/재처리 과정에서 사용되는 문서의 보안 및 컴플라이언스 제약을 함께 고려해 본 경험이 있다면 좋아요.
  • DocOwl 등 문서 특화 모델을 실제 프로덕션에 붙여본 경험이 있다면 더 좋아요.
  • Qwen-VL, InternVL 등 vision 모델을 실제 프로덕션에 붙여본 경험이 있다면 더 좋아요.
  • PII 마스킹, 비식별화 파이프라인 설계 경험이 있다면 더 좋아요.

 

이력서는 이렇게 작성하시는 걸 추천해요

  • 해결하려던 문제와 선택한 방법, 그에 따른 결과(지표 변화·제품 변화)를 명확하게 작성해 주세요.
  • 모델 개발뿐 아니라, 운영 과정에서 시도했던 개선 내용도 함께 적어 주시면 좋아요.
  • 전체 구조와 본인의 핵심 기여를 중심으로 작성해 주세요. 외부 공개가 어려운 내용은 제외해 주세요.

 

토스증권에서 사용하는 기술

  • PyTorch, PEFT, onnxruntime-node, vLLM
  • OpenCV, PyMuPDF, sharp
  • NestJS, FastAPI, Gin
  • DBOS, DVC, MLflow

 

토스증권으로의 합류여정

  • 서류접수 > 직무 인터뷰 > 문화적합성 인터뷰 > 레퍼런스 체크 > 처우협의 > 최종합격 및 입사

 

꼭 확인해 주세요

  • 이력서 및 제출 서류에 허위 사실이 발견되거나 근무 이력 중 징계사항이 확인될 경우, 채용이 취소될 수 있어요.
  • 토스증권 내규에 따라 채용 금지자 또는 결격사유 해당자는 채용이 취소될 수 있어요.
  • 장애인 및 국가보훈대상자는 지원 시 관련법에 따라 우대하고 있어요.

 

함께 할 동료를 위한 한마디

"본인이 갖고 있는 기술적 역량을 통해 실질적인 비즈니스 임팩트를 이끌어내고 싶었던 분이라면 큰 만족감을 얻으실 수 있을 거예요!"

  • 토스증권의 OCR 모델링과 파이프라인 전반을 주도적으로 이끌어갈 ML Engineer를 기다려요.

 

See Your Match Score

Sign up and Renata will show you how this job matches your skills and experience.

ML Engineer (OCR) at Toss | Renata