About
home
Our Team
home
💼

Job Interview - Ep.02 Data Scientist

잡 인터뷰에서는 더 운반을 함께 만들어가고 있는 여러 직무에 대한 소개를 담아봤습니다. 더 운반에서 함께 하고 있는 각 직무 구성원들의 이야기를 바탕으로, 더 운반 조직의 더욱 다채로운 모습들을 살펴보세요 :)
Q1. 문석님, 정운님, 전희님 안녕하세요! 간단한 자기소개 부탁드립니다.
정운님: 안녕하세요. 저는 더 운반 선행개발팀에서 Data Scientist로 근무하고 있는 신정운입니다.
문석님: 안녕하세요. 저는 더 운반 선행개발팀에서 Data Scientist로 근무하고 있는 정문석입니다.
전희님: 안녕하세요. 저는 더 운반 선행개발팀에서 Data Scientist로 근무하고 있는 배전희입니다.
Q2. 현재 선행개발팀에서 각자 어떤 업무들을 맡고 계신지 간단히 소개 부탁드려요!
정운님: 현재 저는 운임 모델링, 배차 계획, 주문 추천 등 다양한 데이터 사이언스 업무를 맡고 있어요. 그 중 운임 모델링에서는 화주와 차주 모두가 만족할 수 있는 최적의 가격을 찾아내는 것이 핵심인데요.
업무를 진행하다보면 데이터 자체가 희소하거나 라벨링이 잘 되지 않아, 특정 조건의 데이터가 누락되는 등 여러 이유로 완벽한 데이터를 얻기 어려운 케이스들도 있지만 이런 장애물을 극복하며 효과적인 운임 모델을 개발하기 위해 노력하고 있습니다!
이외에도 배차 계획 영역에서는 여러 대의 배차 주문이 들어올 경우, 어떤 순서와 시간에 몇 대의 차량을 배정할지 결정하는 스케줄링 알고리즘을 개발하고 있고, 주문 추천 영역에서는 더 운반만의 주문 추천 시스템을 통해 차주가 선호할 만한 화주의 주문을 매칭해주는 일도 담당하고 있어요.
전희님: 저는 현재 화주 분들과의 대화를 통해 운송 주문 접수, 조회와 취소 작업을 지원해주는 챗봇을 개발하고 있어요.
챗봇은 ChatGPT와 같은 대규모 언어 모델인 *LLM을 활용해서 개발 중인데, 화주사 별로 추출된 주문 관련 요청사항을 사용해 학습 데이터 set을 생성하고 fine-tuning을 진행, 또한 LLM을 잘 활용하기 위해 prompt를 적절하게 작성하는 작업도 함께 진행했습니다.
위와 같은 과정을 통해 화주분들의 편의성 제고를 위한 챗봇을 개발했고, 현재는 연 내 화주앱 연동을 목표로 디벨롭하는 과정 중에 있어요!
*LLM: 대형 언어 모델 (Large Language Model). 다양한 자연어 처리(NLP) 작업을 수행할 수 있는 딥 러닝 알고리즘. 이러한 모델들은 방대한 양의 텍스트 데이터로 훈련되어, 다양한 질문과 프롬프트에 대해 일관된 응답을 생성할 수 있으며 맥락에 부합한다.
문석님: 저는 주로 프라이싱 관련 업무를 진행하고 있어요. 조금 더 구체적으로는 더 운반이라는 서비스의 유저가 받고 지불하게 되는 운임을 책정하는 데에는 다양한 요소들을 고려해야 하는데요. 지역, 배송의 시급성, 차종, 화물의 종류 등 여러가지 요소를 고려하여 화주와 차주 모두가 만족할 수 있는 운임을 찾고 물동량의 수요를 예측할 수 있는 모델을 주로 만들고 있습니다.
이 과정에서는 더 운반의 운임 PMO 분과 함께 협업하며, 제가 찾은 운임을 분석하고 해당 운임의 시장 적절성을 판단하는 등 여러 영역에서 프라이싱 업무 고도화를 위해 노력하고 있어요.
Q2-2. 사실 전희님과 문석님 두 분 모두 더 운반에 합류하신지 이제 3개월 가까이 되신 뉴비이시기도 한데요. 합류 후 바로 중요한 프로젝트들을 맡으면서 어려움이 없지는 않으셨을 것 같아요. 혹시 앞서 소개해주셨던 업무 관련된 난관? 혹은 힘들었던 에피소드 같은 것도 있을까요?
전희님: 저 같은 경우에는 사실 Fine-tuning을 위한 학습데이터 set을 만들어야하는데, 저희 고객사인 화주사 별로 쓰는 용어와 주문방식이 모두 다르고, 그에 따라 입력해야하는 메세지가 다 다르다 보니, 이 모든 데이터를 통합해서 일일히 정리하고 하나의 학습데이터 set을 만드는 과정이 정말 많은 시간과 품이 소요되는 일이라 좀 기억에 남는 것 같아요. (하하)
문석님: 제가 맡고있는 프라이싱 업무의 경우 ‘지역적 특색’이 가장 영향을 많이 받게 되는 중요한 요소 중 하나인데, 도서산간 지역은 주문량 자체가 많지 않아, 해당 지역들을 특색 있게 카테고리로 모으는데 어려움이 있었던 것 같아요.
기본적으로 데이터가 없는 지역이 많다보니 이런 난관을 극복하기 위해  다양한 클러스터링 모델 및 물동량과 지역 간의 좌표들을 많이 활용하기 위해 노력했어요.
Q3. Data Science 에도 여러가지 분야가 있는 것으로 알고 있는데, 그동안은 어떤 경험을 쌓아오셨고 개인적으로 어떤 분야에 관심을 갖고 계실까요?
문석님: 저는 미국에서 학부 졸업 후 오랫동안 미국의 항공업계에서 근무하며 주로 수요예측가격 최적화 프로젝트를 많이 맡아왔고, 프라이싱 업무에 대한 다양한 경험도 많이 해볼 수 있었는데요.
그렇다보니 요즘 개인적인 관심사도 관련된 분야에 많이 있는 것 같은데, 사실 최근엔 딥러닝 기술이  발전하면서 가격 모델도 점점 더 정교해지고, *Dynamic Pricing 과 가까워지고 있어요. 저는 이 중 대형 언어 모델인 LLM 을 활용한 수요예측과 가격 최적화에 대한 부분도 많이 살펴보고있고, 추천 모델 개발에도 흥미가 큰 것 같아요.
개인적으로는 앞으로 더 운반 서비스에도 시기적절하게 주문 건 관련 급 세일 혹은 급 운임 상승 이벤트 (?) 등도 적용해보면 재밌지 않을까 하는 생각도 해봤습니다. (하하)
*Dynamic Pricing: 제품 또는 서비스의 가격을 실시간으로 조정하는 전략
정운님: 저는 더 운반 합류 전에 스타트업에서 금융 광고 상품을 추천해주는 딥러닝 모델을 개발하는 업무를 했어요. 모 회사의 인증 앱에서 각 사용자가 특정 금융 상품을 선호할 확률을 예측하여 CTR(클릭율)을 높이는 업무를 주로 담당했고, 대시보드 작업과 같은 데이터 시각화 업무도 수행했습니다.
요즘 저의 관심사이자 목표는 높은 CTR을 달성하는 추천 모델을 개발하는 것인데요. 멀티 모달 모델 등을 활용해서 더 운반 유저의 편의성을 높일 수 있는 AI비서와 같은 것을 개발해, 장기적으로는 LLM을 활용한 음성인식 시스템을 통해 음성 주문 기록에 대한 데이터를 분석하여 선호 주문을 추천 및 생성, 수정해주는 다양한 기능을 구현해보고 싶어요!
전희님: 저는 통계학 베이스로 Data Scientist의 길을 걷게 됐는데요.
더 운반 합류 이전에는 통신 도메인 회사에서 실시간 이상탐지, 가격 및 수요 예측을 위한 머신러닝 모델을 개발해서 시스템에 탑재하거나 플랫폼 구축 사업에 참여해서 데이터 기반의 인사이트를 추출하고 사용자에게 효과적으로 전달될 수 있는 방안을 기획 후 개발하는 경험들을 쌓아왔어요.
개인적으로 현재는 더 운반을 이용하는 화주, 차주분들의 불편함을 어떻게 개선할 수 있는지에 대해 관심이 많은데요. 단순히 더 운반이 타겟하는 미들마일 시장만 바라보는 것이 아니라 대한통운의 전체적인 사업과 더 운반이 어떻게 연결될 수 있고, 그 과정에서 제가 할 수 있는 역할은 무엇인지에 대해 많은 고민을 하고 있어요.
Q4. 더 운반의 데이터 사이언스 관점에서, 현재 하반기 주요 과제로 두고 목표 하시는 것들이 있다면 어떤 것일까요?
문석님: 사실 가장 주요한 목표는 현재 올 해 연말 혹은 내년 초에 새롭게 나갈 프라이싱 모델을 안정적이고 합리적으로 구축하는 것이구요. 그 이후에는 물동량 수요를 예측하는 모델을 사용자 친화적으로 개발하여, 더욱 정확한 물동량 수요 예측을 통해 다양한 비즈니스에 반영될 수 있도록 만들고 싶어요.
정운님: 현재 배차 알고리즘을 개발 중인데, 제가 개발한 해당 알고리즘을 통해 전반적인 비용 절감 효과를 누릴 수 있으면 좋겠다는 바램이 있어요. 그리고 현재는 한 화주사에만 적용중이지만 앞으로는 여러 화주사로 확장해서 추후에는 화주사사와 더 운반 모두에게 양방향으로 도움이 될 수 있는 것을 목표로 개발 중에 있습니다.
전희님: 아무래도 챗봇이 연 내 화주앱 연동을 목표로 하고있다보니 가장 큰 목표인 것 같아요. 현재는 목표 일정을 앞두고 테스트와 보완의 반복되는 과정을 지나고 있고, 모델링은 작업을 마무리하는 단계이고 나머지는 백엔드, 프론트엔드와 어떻게 연결할지 고민을 거듭하고 있어요.
Q5. 실제로 업무를 하면서 느끼시는 Data Scientist 로서의 가장 필요한 역량이 있다면 어떤 것일까요?
문석님: 정보활용능력이 가장 중요하다고 생각해요.
한 마디로 ‘센스가 있어야 한다.’고 생각하는데, 특히 요즘은 매우 빠른 텀으로 새로운 기술과 모델들이 쏟아지고 있는데, 그 중 현재 내가 하고 있는 프로젝트에 도움이 되는 모델을 선별하고, 이를 어떻게 응용해 프로젝트를 발전시킬지 판단하고 구현하는 역량이 Data Scientist의 핵심이라고 생각해요.
정운님: 저는 비즈니스 역량과 기술 역량이 가장 중요하다고 생각해요. 그리고 하나만 꼽자면 비즈니스 역량이 특히나 중요하다고 생각하는데요. 아무래도 해결하려는 문제의 중요성을 파악하고, 모호한 요구사항에서 정확한 문제를 정의하는 능력이 성공적인 결과물 도출에 핵심이기 때문이에요. 결국엔 문제를 해결하고 고객의 편의성을 높이는 것이 목적이기 때문에 아무리 뛰어난 기술을 갖고 있다 하더라도 문제 해결이라는 결과물이 없다면 실패에 가깝다고 생각해요.
전희님: 저도 비즈니스 문제 해결능력이 가장 중요한 역량이라고 생각해요.
당면한 문제 해결을 위해서는 세부적으로 기술 역량과 비즈니스 접근 역량, 두 가지 모두 필요하다고 생각이 드는데 트렌디한 모델을 구현하거나 fancy하게 분석 인사이트를 뽑아도 비즈니스 문제를 해결 할 수 없다면? 반대로 비즈니스적으로는 의미가 있을것 같은데 데이터로 확인할 수 없거나 모델 구현이 어렵다면 아무것도 진전이 되지 않는 상황이 되어버리니까요.
때문에 비즈니스적인 관점에서 유관부서와 인터뷰도 하고 다양한 파트의 전문가들과의 커뮤니케이션을 통해 컨센서스를 맞춰나가는 것과 데이터에 적합한 분석 방법론에 대해 고민하고 프로그래밍 언어를 자연스럽게 사용해서 문제 해결을 위한 분석 결과를 도출하는 과정이 중요한 것 같아요.
Q6. Data Scientist 여러분의 하루 업무 일과 그리고 루틴이 궁금해요! 출근~ 퇴근까지 더 운반의 Data Scientist는 하루를 어떻게 보낼까요?
문석님: 출근하면 먼저 오늘의 해야 할 일을 정리하고, 며칠 간 진행한 작업을 검토해 우선순위를 정해요. 중간중간 틈틈이 기술 뉴스를 살펴보며 프로젝트와 관련된 새로운 모델이 등장했는지도 확인하려고 합니다.
그리고 본격적인 업무 시간에는 데이터를 점검하고 모델을 구현하는 코딩 작업을 주로 진행하면서 모델 평가 방법에 대해서도 많이 고민해보구요. 퇴근 전에는 하루 동안의 업무를 되짚어보고 어떤 점이 좋았고 개선할 부분은 무엇인지 생각해보는 시간을 가지려고 노력해요. (하하)
전희님: 출근하는 길에는 slack과 메일을 확인해요. 새벽 간 배포 등으로 올라오는 이슈들이 있을 수 있다보니, 쌓여있는 소식들을 먼저 보려고 하는 편이에요.
그리고 저는 주차 별 목표를 따로 노트에 작성해두는데, 출근하자마자는 주차 별 목표 중 오늘 처리해야 할 일이 무엇인지를 확인하고, GPU 서버를 연결해서 작업하던 코드를 띄워놓은 후 커피를 한 잔 내리고 업무를 시작합니다. (하하)
퇴근 때까지는 현재 작업중인 챗봇 테스트와 코드 수정을 하다가 다른 파트와의 연동에 있어서 궁금증이나 요청사항이 있을 때 커뮤니케이션하면서 남들과 크게 다르지 않은 하루를 보내는것 같아요.
정운님: 저는 오전에는 주로 운임 모델링 개선을 위한 데이터 분석과 전처리 작업에 집중하고 있어요. 특히 데이터 누락이 있는 부분들을 어떻게 보완할지 고민을 많이 하곤 해요.
점심 식사 후에는 배차 계획 알고리즘 개발에 시간을 할애하는데, 특히 최근에는 다중 배차 주문의 효율적인 처리를 위한 최적화 작업을 진행하고 있습니다. 오후에는 보통 비즈니스 팀과의 미팅이 있어 현재 개발 중인 기능들에 대한 피드백을 주고받고, 실제 현장의 니즈를 파악하려고 해요. 마지막으로 하루를 마무리하기 전에는 내일의 업무 계획을 정리하고 개발 중인 모델들의 성능 지표를 기록하며, 퇴근 전 마지막으로 긴급한 이슈가 없는지 확인하는 편이에요.
Q7. Data Scientist 로서 업무를 하시면서 가장 뿌듯하셨던 경험이 있다면 어떤 것일까요?
정운님: 제가 처음 더 운반에 왔을 때는 V2 버전의 딥러닝 기반 모델을 사용하고 있었는데, 데이터가 희소한 특정 지역에서 V2 모델이 불안정한 가격을 제시하는 문제가 발생하고 있었어요.
그래서 이 문제의 해결을 위해 V3 버전을 새롭게 개발했고, 그 결과 이전보다 가격이 더 안정화 되고, 관련된 리포트 건 수도 줄일 수 있었어요. 특히 데이터가 부족했던 지역에서도 합리적인 가격을 제시할 수 있게 되어 정말 뿌듯했고, 제가 Data Scientist 로서 실질적으로 문제를 해결하고 비즈니스를 개선했다는 점에서 가장 기억에 남는 순간 중 하나인 것 같아요.
문석님: 제가 만든 모델이 좋은 성과를 냈을 때인 것 같아요. 대부분의 학습된 모델이 오랜 기간 동안 제가 원하는대로 작동하지 않곤 하는데, 그렇다보니 어느 순간 모델이 동작되어 성공적인 결과를 얻었을 때의 보람과 기쁨이 더욱 큰 것 같아요.
야구에 비유하자면 홈런과 비슷한 것 같은데요. 계속 삼진아웃을 당해도 스윙을 계속 하고 있으면 언젠간 홈런이 맞아 떨어지는? 그런 상황 같아요.
전희님: 과거에는 제가 개발한 모델이 플랫폼에 올라가고 그 모델이 올라가면서 서비스 사용률이 많아지며, 실제로 사용자들에게 ‘도움이 많이 됐다.’ 라는 피드백을 받았을 때 가장 뿌듯했었구요.
더 운반에 합류한 이후에는 챗봇을 개발하며 원하는 형태의 결과를 바로 확인할 수 있다보니, 챗봇에 답변이 잘 나왔을 때 가장 뿌듯한 것 같아요!
Q8. Data Scientist의 관점에서 바라본 더 운반의 선행개발, 앞으로는 궁극적으로 어떤 비전을 두고 나아가게 될까요?
문석님: 물류 시장에는 아직 적용되지 않은 머신러닝 기술이 많다고 생각해요. 앞으로는 더 다양한 기술을 많은 분야에 접목해서 사용자들의 불편을 미리 해결하고, 각 유저에게 특화된 서비스를 제공하는 것이 궁극적인 더 운반 선행개발의 목표이지 않을까 생각합니다.
특히 프라이싱 영역에서는 개인화된 서비스 혹은 기능을 제공할 수 있도록 하는 방향을 목표로 해도 좋을 것 같다는 생각도 해보고 있어요 :)
전희님: 아직 엄청난 비전에 대해 생각은 해보지 못 했지만, 화주와 차주가 더 운반을 사용하며 분명 지금보다 더 편하게 사용할 수 있게 될 것 같다는 확신이 있어요. 그리고 그 영역에 Data Scientist가 도움될 수 있는 부분이 있다면 해당 영역에 대한 개선과 개발을 이끌어내고 싶어요.
정운님: 저는 기술이 현실의 문제를 해결하고 사람들의 삶을 개선하는 데 기여할 때 가장 큰 가치가 있다고 믿어요. 특히 물류 영역에서 데이터 사이언티스트로서, 화주와 차주 모두에게 도움이 되는 솔루션을 만들어서 더 효율적이고 공정한 시장을 만드는 것이 제 목표이기도 하고,  장기적으로는 LLM과 같은 최신 기술을 적극적으로 도입하여 물류 산업의 디지털 혁신을 이끌어 나가보고 싶어요!
더 운반이 더욱 궁금하시다면? 아래 링크로 놀러오세요!
더 운반 인스타그램
더 운반 유튜브