Contents

Youtube Recommend Master ETL Pipeline

-- Chuyển đổi dữ liệu Youtube thành hệ thống đề xuất Video phù hợp --


Trong project này, mình xây dựng một Data Pipeline đơn giản theo kiến trúc Lambda, sử dụng mô hình ETL(extract - Transform - Load) và bộ dữ liệu Youtube-Trending-Video. Thực hiện Ingestion, Processing, Transformation và Compute dữ liệu bằng công nghệ dữ liệu lớn Apache Spark, phục vụ hệ thống Recommendation Video cho bản thân.

Mã nguồn dự án được công khai trên GitHub tại: GitHub Repository

📹 Demo Video

1. Project Overview

1.1 Objective

1.2 Importance

2. Data Description

3. System Architecture