[Designing Machine Learning Systems] MLOps를 위한 인프라와 도구

08 Jan 2024 in Study on MLOps

ML 시스템에 적합한 인프라를 설정하는 방법을 알아본다.

[Designing Machine Learning Systems] 연속 학습과 프로덕션 테스트

05 Jan 2024 in Study on MLOps

데이터 분포 시프트에 모델을 적응시키려면 ML 모델을 지속적으로 업데이트해야 한다. 이 장에서는 연속 학습이 무엇이며 어떤 난제가 있는지 알아본다. 그리고 연속 학습을 현실화하기 위한 4단계 계획을 세운다.

[Designing Machine Learning Systems] 데이터 분포 시프트와 모니터링

04 Jan 2024 in Study on MLOps

모델 배포 후에도 이슈를 탐지하기 위해 성능을 지속적으로 모니터링해야 하며 발생한 이슈를 수정하는 업데이트를 계속 배포해야 한다.

[Designing Machine Learning Systems] 모델 배포와 예측 서비스

03 Jan 2024 in Study on MLOps

반복 프로세스의 또 다른 부분인 모델 배포를 알아본다. 배포는 일반적으로 ‘모델을 실행하고 액세스 가능하게 함’을 의미하는 포괄적인 용어이다.

[Designing Machine Learning Systems] 모델 개발과 오프라인 평가

02 Jan 2024 in Study on MLOps

데이터와 피처 엔지니어링에 들인 노력이 출력(예측)값을 제공하는 시스템으로 결실을 맺는 첫번째 단계

[Designing Machine Learning Systems] 피처 엔지니어링

28 Dec 2023 in Study on MLOps

⌜Practical lessons from predicting clicks on ads at facebook⌟에서는 올바른 피처를 보유하는 것이 ML 모델을 개발하는 데 가장 중요하다고 말한다. 책의 필자도 협업했던 많은 회사에서 실행 가능한 모델이 있는 한 올바른 피처를 보유하는 것이 하이퍼파라미터 조정 같은 알고리즘 기법보다 큰 성능 향상을 이끌어내는 경우가 많았다고 한다.

[Designing Machine Learning Systems] 훈련 데이터

27 Dec 2023 in Study on MLOps

데이터 과학 관점에서 데이터를 처리하는 방법을 살펴본다. ML 모델을 개발하고 개선하는 데 훈련 데이터는 매우 중요하다.

[Designing Machine Learning Systems] 데이터 엔지니어링 기초

26 Dec 2023 in Study on MLOps

ML과 빅데이터는 밀접한 연관이 있다. 이 장에서는 데이터 엔지니어링의 기본을 다룬다. 일반적인 ML 프로젝트에서 사용하는 다양한 데이터 소스를 살펴보고 데이터를 저장하는 포맷을 알아본다. 데이터 저장은 해당 데이터를 *검색(retrieval)할 경우 필요하다. 저장된 데이터를 검색하기 위해 데이터 포맷뿐 아니라 데이터가 어떻게 구조화되었는지 알아야 한다. 데이터 모델은 특정 데이터 포맷으로 저장된 데이터가 구조화되는 방식을 정의한다.

Pagination