Home 글또 5기 회고글
Post
Cancel

글또 5기 회고글

반년이 정말 후딱 지나가 버렸다..


정말 반년이 이렇게 빨리 지나갈 줄은 몰랐습니다. 회사 동료의 추천으로 우연히 글또 5기를 신청하게 되었고 덜컥 참여하게 되었습니다. 나름 열심히 활동을 하며 정말 열심히 사시는 분들과 엄청난 실력을 가지고 계신 분들을 많이 만났고, 제가 쓴 글에 비판도 많이 받았던 것 같습니다. 정말 좋은 경험이었습니다.

글을 쓰는 것은 정말 어려운 과정이었습니다. 한 주의 피드백이 끝나면 2주 뒤에 스스로 만족할만한 양질의 글을 쓰기 위해 매일 저녁 시간을 할애해서 노력을 했습니다. 일주일 정도 공부를 해서 어떤 구성으로 글을 작성할지 큰 틀을 잡고, 나머지 일주일 동안은 속을 채우기 위해 좀 더 디테일한 부분에 집중 했습니다. 웬만하면 금요일 정도에 글을 마무리 하려고 노력은 했는데, 아직 많이 부족한 터라 주말까지는 붙잡고 있어야 스스로에게 70% 정도 만족할만한 글을 쓸 수 있었습니다. 돌이켜 보면 결국 스스로에게 100% 만족하는 글을 쓰지는 못했던 것 같습니다.

글을 작성하면서 다른 분들이 내가 쓴 글을 볼 수도 있다고 생각하니, 한 문장을 작성하기 위해 정말 많은 레퍼런스를 찾아봤던 글도 있었습니다. 이런 경험들이 데이터 사이언티스트로서 성장에 큰 도움이 될 것이라고 믿어 의심치 않습니다. 특히 지난 반년 동안 스스로에게 부족했었던 수학 이론 공부를 많이 했고 반년 전의 저에 비해서는 성장했다라는 생각이 들어서 나름 뿌듯한 마음이 많이 듭니다. 하지만 100% 소화를 했다고는 생각하지 않습니다. 앞으로도 꾸준한 노력이 필요할 것 같습니다.

다짐했던 것들은 얼마나 지켜졌나?


글또 5기를 시작하면서 쓴 다짐 글을 다시 한번 보았습니다. 정말 열의 넘치는… 제 자신을 발견 할 수 있었습니다. 그리고 반년 전의 내가 오늘의 나를 보았을 때 과연 만족을 할 수 있을지를 생각해 보았습니다. 개인적으로 평가해본다면 다짐 했던 것에 70% 정도는 이루었다고 생각합니다. 선형대수 이론 공부를 진행 했고, 행렬 분해와 관련된 이론들을 글로 녹여 내었습니다. 특히 고유값과 고유벡터는 제가 계속 명확하게 이해하지 못하고 있었는데, 이번에 글또 활동을 하면서 작성 했던 선형 대수 이론이 모두 고유값과 고유벡터와 관련이 있다보니 반년 전 보다는 이에 대해 감을 잡은 것 같습니다. 다만 머신러닝/딥러닝 관련 논문은 많이 정리하지 못했습니다. 글또 5기 활동을 시작하는 시점부터 현업에서 수행하는 역할이 그 전과는 조금 달라져서… 논문을 읽고 정리하는 글을 ALS 말고는 없었던 것 같네요.

요새는 어떻게 살고 있고 앞으로는 어떻게 살까?


최근에 현업에서 관심 사항과 요구 사항이 또 많이 달라졌습니다. 이제는 머신러닝/딥러닝 모델의 배포 관리, 실험 관리를 잘 해야할 시점이 왔는데요. 그렇게 때문에 최근에는 오히려 엔지니어링 쪽에 관심을 두고 공부하고 있습니다. 앞으로는 컨테이너 오케스트레이션, 머신러닝 실험 관리, A/B 테스트 환경 구축과 관련된 이론이나 실습을 계속 진행하게 될 것 같습니다. 이런 분야 공부는 처음이라 어떤 이론들이 기반이 되어야 할지는 정확히 모르겠지만, 일단은 AWS나 GCP에서 제공하는 여러가지 서비스들을 잘 활용하는 식으로 진행할 것 같습니다(아직까지 오픈 소스 툴을 이용해서 직접 환경을 구축하는 것은 무리 일 것 같네요). 그래서 최근에는 네트워크 공부를 하고 있었고 컨테이너 오케스트레이션을 위해 AWS ECS 서비스를 공부하고 있습니다.

그래도 다행인 것은 새로운 공부를 하는 것이 재미있다는 것입니다. 그래서 앞으로는 지금 공부하는 쪽을 계속해서 발전 시켜서 내 손으로 만든 모델을 지속적으로 실험하고, 배포하고, A/B 테스트 하는 것까지의 모델 라이프 사이클을 모두 관리할 수 있는 데이터 사이언티스트가 되는 것이 목표입니다. 아직까지는 이 것이 얼마나 어려운 일인지 감이 안 잡히는데, 감이 없다는 것은 제가 아직 초보적인 수준이라는 방증이겠죠.

아무튼 같이 글또 5기 활동을 하신 모든 분들께 감사드리고 앞으로 계획 하시는 일들이나 하고 계신 일들이 모두 좋은 결과로서 결실을 맺기를 기원하겠습니다.

This post is licensed under CC BY 4.0 by the author.

'Collaborative Filtering for Implicit Feedback Datasets(ALS)' 논문 리뷰

ECS의 task definition에서 soft/hard memory limit의 의미