cv

이준구 이력서 – Software Engineer, Data
이준구 프로필 사진

이준구 (Junku Lee)

Software Engineer, Data

📧 simon00102@gmail.com 📞 +82-10-7141-9839
🌐 goulgoul.kr (Blog) 📍 Seoul, Korea

Introduction

“대규모 데이터 시스템의 복잡성을 현대적인 아키텍처로 혁신하는 Software Engineer, Data”

고성능 백엔드 엔진(C++)부터 대규모 클라우드 데이터 플랫폼(AWS)까지, 시스템의 기반을 다지고 데이터 파이프라인의 생애주기 전반을 아우르는 Full-Cycle 엔지니어링을 수행해왔습니다.

NICE P&I에서 C++ 고성능 평가 엔진을 새로 설계 및 구현하여 20년 기간의 데이터를 검증하고 성능을 개선하며 전문성을 길렀습니다. 다양한 형태의 정형/비정형 데이터를 여러 방식(API, 크롤링, RDB, FTP 등)으로 수집하여 가공하고, 이를 웹 서비스 API로 서빙하기까지 데이터 파이프라인의 A to Z를 직접 구현했습니다. 특히 1%의 예외도 허용되지 않는 보안 폐쇄망 환경에서 컨테이너 기반의 MSA 인프라를 프로비저닝하고, 사내 최초로 LGTM 스택을 도입해 전 구간 시스템 관측성을 확보하며 안정적인 서비스 런칭을 이끌었습니다.

현재는 국내 최대 가상자산 거래소(빗썸)에서 이 경험을 확장하여, 파편화된 레거시 스택을 AWS MWAA와 Redshift 기반의 현대적인 레이크하우스 아키텍처로 통합하고, 배치/스트리밍 데이터 파이프라인을 고도화하는 과제들을 리드하고 있습니다. 1일 내에 몰린 억 단위의 폭발적인 트래픽 상황에서도, 제가 직접 설계 및 구현한 데이터 파이프라인은 지연이나 장애 없이 견고하게 동작하며 시스템의 내결함성을 입증해냈습니다.

단순히 주어진 직무 요건과 기술 스택을 소화하는 것을 넘어, 시스템의 근본적인 병목을 뚫어내고 데이터의 흐름을 투명하게 통제하는 인프라를 세우는 데 집중합니다. 안정적인 아키텍처 설계와 꼼꼼한 검증을 바탕으로 기술 부채를 해소하며, 비즈니스에 확실한 임팩트를 창출하는 엔지니어링 리더십을 지향합니다.

Technical Skills

Data Engineering Airflow (MWAA), AWS Glue, Redshift (Spectrum/Serverless), Debezium/Kafka(MSK)/Flink/Iceberg, Clickhouse, RabbitMQ
Backend Python (FastAPI, Django), C++ (Modern 17), C#.NET, SQL, SQLAlchemy
Infra & DevOps AWS, Terraform, EKS, Docker Swarm(On-prem), GitLab CI/CD, Linux (RHEL9/Ubuntu)
Observability CloudWatch, Whatap, LGTM (Loki, Grafana, Tempo, Prometheus), OTel-Collector
AI Openclaw, Skills, MCPs, SubAgents, Gemini CLI, Codex, Claude Code

Work Experience

빗썸 (Bithumb)

2024.12 – Present (Seoul, Korea)

Software Engineer, Data

국내 최대 가상자산 거래소의 데이터 플랫폼팀에서 Data Lake/DW 아키텍처 고도화비즈니스 파이프라인 구축을 전담.

[Architecture & Engineering Leadership]

1. AWS 데이터 플랫폼 현대화 및 통합 (Re:Architect) (2025.05 ~ 2026.03)

Role: Architect & Main Developer

  • Consolidation Strategy: Vertica(IDC), Hive/EMR, Redshift로 파편화된 스택을 MWAA & Redshift(Spectrum) Lakehouse로 통합하여 관리 포인트 일원화 및 SSOT 확보.
  • Redshift Cluster Separation (Producer/Consumer): 기존 단일 클러스터에서 분석, ETL, 서비스 로드가 경합하여 발생하던 간섭(장애) 문제를 해결하기 위해 클러스터 분리 아키텍처 설계 중. ETL 전용의 Producer 클러스터와, 비용 효율적이고 유연한 확장이 가능한 Serverless 기반의 Consumer 클러스터로 역할을 분리하여 서비스 안정성 100% 보장을 목표로 고도화 진행.
  • Architecture Re-design: 데이터 온도에 따른 Hot(Kafka/Clickhouse) – Warm(Debezium/Kafka/Flink) – Cold(S3/Glue) 3-Layer 파이프라인 아키텍처 설계. 최근에는 Warm Path 데이터 수집(Ingestion) 아키텍처 강화를 위해 EKS 클러스터 구축 및 MSK Source/Sink Connector를 도입하여 실시간 파이프라인 고도화 진행 중.

2. MWAA 환경 표준화 및 Data GitOps (CI/CD) 체계 구축 (2026.01 ~ 2026.02)

Role: Technical Lead / SRE

  • MWAA Multi-Cluster Architecture: 엄격한 보안 요구사항(망분리 및 데이터 반출 통제)을 충족하기 위해 Terraform을 활용하여 용도별(보안 검토용 반출망, 분석가용 자유망, 데이터팀 운영망)로 3개의 MWAA 클러스터를 프로비저닝.
  • GitLab Runner & 방화벽/권한 제어: 사내 보안망을 관통하는 배포 환경을 구축하기 위해 GitLab Runner를 직접 세팅하고, 방화벽 및 IAM 권한 제어를 통해 안전한 CI/CD 통로 확보.
  • Dynamic CI/CD Pipeline: DAG 배포와 MWAA 업데이트 파이프라인 분리. 변경된 디렉토리에만 동작하도록 최적화하고, 환경별로 Variables를 동적으로 주입하여 완전 자동화된 Data GitOps 환경을 사내 최초로 완성.

3. 데이터 플랫폼 관측성(Observability) 강화 및 SRE 체계 정립 (2025.01 ~ 2025.04)

Role: Technical Lead / SRE

  • Observability & Alerting: 핵심 메트릭과 임계치를 세분화하여 정의. 크리티컬 장애 발생 시 CloudWatch → Slack → OpsGenie 자동 전화 전파(On-call) 파이프라인을 구축하여 신속한 인지 및 장애 복구 시간(MTTR) 단축 달성.
  • Reliability Engineering: 고가용성 모니터링 환경을 기반으로 DAG 코딩 컨벤션과 리소스 최적화 가이드를 제정하여 RE(Reliability Engineering) 문화를 성공적으로 정착시킴.
[Advanced Data Engineering & Pipeline Optimization]

1. 유동성 공급 인센티브 (주문 랭킹전) 백엔드 및 파이프라인 구축 (2025.11 ~ 2025.12)

Role: Technical Lead & Developer

  • Redshift & Airflow Core: 신규 B2C 서비스 ‘주문 랭킹전’에 필요한 시간 단위 집계 배치 파이프라인 및 백엔드 API 직접 개발.
  • Result: 비상계엄 당시 발생한 극한의 트래픽(1일 내 수억 건 주문) 데이터를 활용한 부하 테스트를 거쳐 파이프라인의 내결함성 검증, 30회 이상의 라운드를 지연 및 장애 없이 운영하여 정규 프로그램화 확정.

2. 타 거래소(업비트) 슬리피지 준실시간 분석 파이프라인 구축 (2025.07 ~ 2025.09)

Role: Data Engineer

  • Modern Data Stack: 타 거래소 주문 데이터 기반으로 지표를 생성하는 10분 단위 마이크로 배치 파이프라인(Clickhouse -> Hive -> Redshift) 구축.
  • Result: 1시간 이상 소요되던 슬리피지 데이터 지연 시간(Latency)을 10분 이내로 단축 및 안정화.
[Business Support & Analytics Engineering]

1. 신규 비즈니스 지원 및 Analytics Engineering 기반 플랫폼 확장 (2025.01 ~ 2025.09)

Role: DW Modeler & Data Analytics Engineer

  • Banking Migration & Data Modeling: 주거래 은행 변경 및 법인 거래 허용에 따른 실적 분석 데이터 파이프라인 구축 등 데이터 마트(DM)를 설계하는 Analytics Engineering 주도.
  • Compliance & Data Quality (DQ): 금감원 감사를 위한 대규모 자산 스냅샷 프로시저 최적화하여 성공적으로 대응. 금융 데이터 정합성을 보장하기 위해 각 단계마다 자체적인 통계/룰 기반 DQ 검증 모듈 연동.
  • Service Expansion: BingX 오더북 공유 등 신규 서비스 마트를 구축하고 향후 dbt 및 Great Expectations 기반 선언적 환경으로 전환하기 용이하도록 쿼리 모듈화 작업 병행.
[AI-Driven Engineering Productivity (AX)]

1. LLM/Agent 기반 데이터 파이프라인 개발 자동화 툴체인 구축

Role: AI Automation Developer

  • 실무 AX(AI Transformation) 도입: 사내 실무 환경에 Claude Code 및 LLM API를 적극 도입하여, 사내 컨벤션에 맞춘 SQL 기반 Airflow DAG 자동 생성기 및 RDB Ingestion 파이프라인 생성기 등 내부 개발 자동화 툴체인을 직접 구축.
  • Result: 파편화된 스크립트와 수작업에 의존하던 파이프라인 구축 리드 타임을 평균 6시간에서 1시간 이내로 획기적으로 단축하여 조직 전체의 엔지니어링 생산성 극대화.

NICE P&I (나이스피앤아이)

2018.08 – 2024.11 (Seoul, Korea)

Team Lead & Software Engineer

NICE P&I에서 금융 평가 및 데이터 분석 전문 기업의 다양한 정형/비정형 데이터를 E2E 풀스택(수집-가공-API 제공)으로 다루며 온프레미스 인프라 구축부터 고성능 C++ 엔진 개발까지 데이터의 전 주기를 리딩.

[Phase 3: MSA & Web Service Modernization (2024)]

1. 보안 폐쇄망 내 차세대 금융 데이터 웹 서비스 (MSA) 백엔드 설계 및 상용화 (2024.03 ~ 2024.11)

Role: Technical Lead & Architect

  • 수행: 5개의 Docker Swarm Cluster와 Linux 환경을 구축하여 기존 Windows 기반 배치 파이프라인을 Container/MSA 기반으로 전면 이관. Python(FastAPI) 기반 Backend API 아키텍처 설계.
  • 성과: 사내 최초로 LGTM(Loki, Grafana, Tempo, Prometheus) 스택을 도입해 전 구간 통합 모니터링을 구축. 복잡한 금융 데이터 실시간 시각화 웹 솔루션을 무장애로 런칭하여 대외 B2B 상용화 기반 및 신규 매출 창출.
[Phase 2: Financial Engineering & Pipeline Automation (2020 ~ 2023)]

1. 비정형 금융 계약서(IRS/CRS) 데이터화 자동화 시스템 (100% 정합성 지향) (2022.07 ~ 2022.12)

Role: Project Lead

  • 수행: PDF Text Layer 파싱과 보수적인 정규식을 결합한 하이브리드 파이프라인 개발. 100% 매칭되는 정형 유형만 자동화하고 나머지는 수동 검토하는 Fail-safe 구조 적용.
  • 성과: 수기 입력 업무의 약 80%를 자동화하여 담당자 업무 시간 단축 및 운영 효율성 개선.

2. 다양한 소스의 금융 데이터 실시간/배치 수집 및 E2E 데이터 파이프라인 구축 (2020.01 – 2022.07)

  • 다양한 정형/비정형 원천 데이터(미국 채권 TRACE 공시, 장내/외 호가, 웹 크롤링)를 여러 방식(REST API, 웹 스크래핑, FTP 등)으로 수집하여 가공·적재하는 파이프라인(Python/SQL) 설계 및 구축.
  • 단순 수집을 넘어, RabbitMQ 메시지 큐 아키텍처를 도입하여 다수 분산 노드 간 동기화를 보장하고, 인프라 세팅부터 비즈니스 로직 구현, 웹 서비스 API 제공까지 아우르는 E2E(End-to-End) 풀스택 데이터 엔지니어링 수행.
[Phase 1: Valuation Engine Development & Process Innovation (2018 ~ 2021)]

1. 차세대 금융자산 평가 엔진 아키텍처 재설계 및 상용화 (2018.08 ~ 2021.12)

Role: Core Engine Developer & Architect

  • 수행: Modern C++(17) 도입 및 객체지향 아키텍처로 리팩토링. 포인터, 레퍼런스, 이동 시맨틱을 적용하여 무의미한 값 복사 오버헤드 제거.
  • 성과: 기존 멀티스레드 대비 싱글 스레드 환경에서 20~30% 빠른 처리 속도 달성. 약 1.4억 건(20년 치) 시장 데이터 백테스팅으로 정합성 입증. 대형 금융기관 납품 완료.

2. 본부 비즈니스 및 프로세스 혁신 (2018.08 ~ 2021.12)

Role: Core Engine Developer & Architect

  • 수행: 본부(약 100명 규모)의 비즈니스 및 프로세스 혁신을 주도. 전 부서 직책자/실무자 등의 면밀한 인터뷰, 프로세스 분석을 통해 문제점 도출 및 개선 방안 제시. 이를 기술적으로 해결할 수 있도록 프로그램 개발 및 운영.
  • 성과: 비정형 데이터 처리 자동화, UI 개선, 업무 자동화 프로그램 개발, 실무자 개발 교육 및 멘토링 등 폭넓은 업무를 수행하며 본부의 개발 역량 강화 및 업무 효율성 개선에 기여.

[Leadership: Team Lead & 조직 문화 아키텍트]

  • Agile & Standard: 5인 규모 데이터 파트 및 20명 규모 대형 MSA API 프로젝트를 리딩하며, 데일리 스크럼과 페어 프로그래밍을 도입해 코드 품질 상향 평준화 유도.
  • Servant Leadership: 마이크로매니징을 지양하고 사내 개발 표준을 가이드라인으로 제시. 팀원들의 인프라/보안 행정적 블로커를 선제적으로 뚫어주며 리딩한 모든 프로젝트를 100% 기한 내 완수.

Personal Projects & Self-Development

  • 홈랩 AI Agent 인프라 구축 (OpenClaw): 개인 서버(Ubuntu, WSL2, Docker) 환경에 LLM 연동 AI Agent(OpenClaw) 툴체인을 구축하여 터미널 제어, 로그 분석 등 개인 개발 환경의 자동화 운영, 개인 업무 및 블로그 작성 자동화.
  • Crypto Arbitrage Trading System: 실시간 오더북 차이를 포착하는 자동매매 시스템을 AWS EC2, C++ 멀티스레딩, RabbitMQ를 활용해 구축.
  • Tech Blog: 기술적 고민과 트러블슈팅 경험 기록 (https://goulgoul.kr)

Education & Certificates

  • 🎓 숭실대학교 일반대학원 융합소프트웨어 석사 (2016.03 – 2018.02)
    빅데이터 연구실 / 논문: Design and Implementation of Harmful Site Discrimination System Using Machine Learning
  • 🎓 숭실대학교 컴퓨터학부 학사 (2012.03 – 2016.02)
  • 📜 정보처리기사 (2015.10)