Zenler Player
Your course is loading. Hang tight.
Road to Data Engineer Online
Back to curriculum
0% Complete
0% Complete
วิธีใช้ระบบเรียนออนไลน์
Welcome to Road to Data Engineer
ข้อมูลสำคัญ
Recorded Video: Orientation
วิธีเข้าชม Live: Q&A
ตารางปฏิทินการ Live
ถาม-ตอบ Pre-Course
ถาม-ตอบ Chapter 0
ถาม-ตอบ Chapter 1
ถาม-ตอบ Chapter 2
ถาม-ตอบ Chapter 3
ถาม-ตอบ Chapter 4
ถาม-ตอบ Chapter 5
ถาม-ตอบ Chapter 6
ถาม-ตอบ Chapter 7
ถาม-ตอบ หัวข้ออื่น ๆ
Introduction: Pre-Course
Slide สำหรับ Pre-Course
Basic Intro
ไฟล์สำหรับ Intro to SQL
Intro to SQL
ไฟล์สำหรับเรียน Intro to Python
Intro to Python
โจทย์ Python และ SQL
โจทย์ Python 1
Recorded: Walk Through เฉลยโจทย์ Python 1
โจทย์ Python 2
Recorded: Walk Through เฉลยโจทย์ Python 2
โจทย์ SQL
Live: Walk Through เฉลยโจทย์ SQL
Recorded Q&A ตอบคำถาม Week Pre-Course
Extra: รวมเฉลยโจทย์ Python บน Snakify ทุกข้อ
ยินดีต้อนรับสู่ Chapter 0
Course Intro
Data Engineer คือใคร
ทำไมอาชีพ Data Engineer ถึงสำคัญในองค์กร
ทำไมเราไม่ควรใช้คนเดียวเป็นทั้ง Data Scientist และ Data Engineer
Big Data คืออะไร และ Big Data Platforms (Hadoop & Cloud)
Data Pipeline & Data Warehouse
3 ประเภทของข้อมูล: Structured, Semi-structured, Unstructured
Database vs Data Warehouse vs Data Lake ต่างกันยังไง
NoSQL Database คืออะไร
Database Model แบบต่าง ๆ & Database Ranking
Programming (Bash, SQL, Python, Java)
Automation (Git, Container, Kubernetes, Airflow, Terraform)
Technology Stack & AI Landscape
สรุป อยากเป็น Data Engineer ต้องรู้อะไรบ้าง
Q&A ท้ายบทที่ 0
Download: Slide CH 0
ยินดีต้อนรับสู่ Chapter 1
Download: Slide CH1
Data Pipeline คืออะไร ทำไมต้องสร้าง
องค์ประกอบของ Data Pipeline
ETL - Extract Transform Load คืออะไร
ETL กับ ELT ต่างกันอย่างไร
สิ่งที่ต้องคิดในการออกแบบ Data Pipeline
ประเภทของ Data Pipeline: Full load vs Incremental load
Batch vs Stream Processing ต่างกันยังไง
เครื่องมือในการทำ ETL: Code vs No Code
Data Integration คืออะไร ทำไมถึงมีประโยชน์
สิ่งที่ต้องทำใน Data Integration
วิธีทำ ปัญหา และวิธีแก้ไขของ Schema Integration
ปัญหา และวิธีแก้ไขของ Data Integration
Workshop 1 ทำอะไรบ้าง
Extra Materials ก่อนเข้าสู่ Workshop 1
ไฟล์สำหรับ Workshop 1
วิธีทำ Workshop 1 & 2 ผ่าน Google Colab
มาทำ Workshop 1 ไปพร้อมกัน
ไฟล์เฉลย Workshop 1
Q&A after Workshop 1
Bonus: วิธีสร้าง Database ฟรี และอัพโหลดข้อมูลด้วย MySQLWorkbench ฟรี
Recorded Q&A ตอบคำถาม Week 2 (CH0 & CH1)
ยินดีต้อนรับสู่ Chapter 2
Download: Slide CH2
Data Cleansing คืออะไร
ทำไมต้องทำความสะอาดข้อมูล
ทำไม Data Cleansing ถึงยาก
ขั้นตอนการทำ Data Cleansing
Data Quality คืออะไร
เครื่องมือ Data Quality - Data Dictionary, Data Lineage, Data Catalog
การทำ EDA - Data Profiling
ประเภทของการทำ EDA
Data Anomaly คืออะไร มีแบบไหนบ้าง
วิธีค้นหาและแก้ไข Syntactical & Semantic Anomalies
วิธีใช้ Regular Expression
Missing Values & Outliers
Hadoop คืออะไร
Hadoop MapReduce ทำงานอย่างไร
Apache Spark คืออะไร
ส่วนเสริมของ Spark
Spark Shell vs PySpark vs Spark-submit
Databricks คืออะไร
ประเภทข้อมูลใน Spark: RDD, DataFrame, DataSet
RDD คืออะไร ทำงานอย่างไร
Spark DataFrame & SparkSQL คืออะไร
แจกเอกสารรวมคำสั่ง Spark
Q&A ท้ายบทที่ 2
Workshop 2 ทำอะไรบ้าง
ไฟล์สำหรับ Workshop 2
มาทำ Workshop 2 ไปพร้อมกัน
ไฟล์เฉลย Workshop 2
Q&A ท้าย Workshop 2
ยินดีต้อนรับสู่ Chapter 3
Download: Slide CH3
On-premise vs Cloud ต่างกันอย่างไร
ประเภทของ Cloud - Public vs VPS vs Private vs Hybrid Cloud
บริการบน Cloud มีอะไรบ้าง: Compute, Storage, XaaS
Managed Service vs Serverless ต่างกันอย่างไร
บริการ Compute ประเภทต่าง ๆ ใน Google Cloud
บริการ Storage ประเภทต่าง ๆ ใน Google Cloud
วิธีเลือก Storage ใน Googel Cloud: Horizontal vs Vertical Scale
Vendor lock-in: ปัญหาสำคัญในการใช้ Cloud
Streaming Data Pipeline บน Google Cloud
Reference Architecture บน Google Cloud และ Azure
Technology Stack บน Cloud
Workshop ของเรา บน Google Cloud
เปรียบเทียบ Google Cloud & Amazon Web Services
GCP in 4 words
วิธีสมัครสมาชิก Google Cloud & รับเครดิตฟรี $300
ไฟล์สำหรับ Workshop 3
มาทำ Workshop 3 ไปพร้อมกัน
Cloud Shell VS Google Cloud Storage
Q&A ท้ายบทที่ 3
Recorded Q&A ตอบคำถาม Week 3 (CH2 & CH3)
ยินดีต้อนรับสู่ Chapter 4
Download: Slide CH4
Review Chapter 1-3
วิธีสร้าง Google Cloud Composer
Apache Airflow คืออะไร
Data Pipeline Orchestration คืออะไร
Cron วิธีการ Orchestration แบบเก่า
เครื่องมือสำหรับทำ Data Orchestration
Airbnb ใช้ Apache Airflow ทำอะไรบ้าง
ส่วนประกอบต่าง ๆ ใน Airflow
DAG คืออะไร + ตัวอย่าง DAG สำหรับทำ ETL
DAG ใน Airflow ประกอบด้วยอะไรบ้าง
SubDAGs ใน Airflow
Web UI ของ Airflow
Google Cloud Composer คืออะไร
Architecture ของ Google Cloud Composer
5 ส่วนในการสร้าง DAG ใน Airflow
ไฟล์สำหรับ Workshop 4
Q&A: Bash Command คืออะไร
Q&A: การตั้งเวลาแบบ Cron ใน Airflow
มาทำ Workshop 4 ไปพร้อมกัน
Q&A ท้าย Workshop 4
Bonus: วิธีใช้ฟีเจอร์ Connection บน Airflow เพื่อเชื่อมต่อ DB4Free.net
ยินดีต้อนรับสู่ Chapter 5
Download: Slide CH5
Serverless มีข้อดีอย่างไร
BigQuery คืออะไร + มีข้อดีอย่างไร
Concept ของ BigQuery: Project, Dataset, Table, Job
วิธีในการโหลดข้อมูลเข้า BigQuery
ไฟล์สำหรับ Workshop 5
มาทำ Workshop 5 ไปพร้อมกัน
Recorded Q&A ตอบคำถาม Week 4 (CH4 & CH 5)
ยินดีต้อนรับสู่ Chapter 6
Download: Slide CH6
Data Visualization คืออะไร มีประโยชน์อย่างไร
โปรแกรมประเภทต่าง ๆ สำหรับทำ Data Visualization
หน้าที่ของ Data Engineer ในงาน Data Visualization
Google Data Studio คืออะไร
Reports & Pages คืออะไร
Data Set & Data Source คืออะไร
Chart, Dimension & Metric คืออะไร
Template & Community Visualizations
เรียน Google Data Studio เพิ่มเติมได้ที่ไหน
ไฟล์สำหรับ Workshop 6
มาทำ Workshop 6 ไปพร้อมกัน
Q&A Chapter 5 & 6
สรุป เราสร้างอะไรไปบ้าง
[สำคัญ] วิธีลบ Project ใน Google Cloud
ยินดีต้อนรับสู่ Chapter 7
Download: Slide CH7
Case Study การทำ ETL
ประเภทของ Data Files อื่น ๆ: Arrow & Parquet
Data Architecture ต้องทำอะไรบ้าง
ทิปการออกแบบ Data Pipeline
Git Branching Strategy
Docker & Kubernetes คืออะไร
Data Protection Policy (GDPR, PDPA) และ PII Data คืออะไร
การ Deploy โมเดล Machine Learning
Machine Learning บน AWS และ Kubeflow
Snowflake: Data Warehouse ใหม่
Delta Lake: Data Lake ใหม่
Data & AI Landscape
การสมัครงาน Data Engineer
Certificate สำหรับ Data Engineer
อาชีพสำหรับต่อยอดจาก Data Engineer: ETL Engineer, ML Engineer, Data Architecture
แนะนำคอร์สและหนังสือด้าน Data Engineer
ลิงค์น่าสนใจสำหรับ Data Engineer
Recorded Q&A ตอบคำถาม Week 5 (CH6 & CH 7)
Video แนะนำ Resource สำหรับศึกษาต่อ
List Resource สำหรับศึกษาต่อ
ยินดีต้อนรับสู่ Guest Speaker Interviews
คุณกานต์ - แนะนำอาชีพ Data Engineer
คุณจีโน่ - แนะนำอาชีพ Data Consultant
คุณฟง - แนะนำอาชีพ Fullstack Developer
Career Guide by คุณกานต์
Special Live: Platform Engineer กับคุณเฮี้ยง
Special Live: Low Cost Data Engineering
Special Live x DataRockie: Full Stack Data
Special Live: Basic Git
Special Live: Advanced Git + CI/CD
Special Live: Docker + Airflow + Kubernetes
ฟอร์มรับทางเข้าทำข้อสอบ
ยินดีต้อนรับทุกท่านสู่โลกของ Data Engineer
วิธีใช้ระบบเรียนออนไลน์
Welcome to Road to Data Engineer
Preview
ข้อมูลสำคัญ
Recorded Video: Orientation
ข้อมูลการ Live และอื่น ๆ
วิธีเข้าชม Live: Q&A
ตารางปฏิทินการ Live
Discussion Board ถาม-ตอบได้ที่นี่
ถาม-ตอบ Pre-Course
ถาม-ตอบ Chapter 0
ถาม-ตอบ Chapter 1
ถาม-ตอบ Chapter 2
ถาม-ตอบ Chapter 3
ถาม-ตอบ Chapter 4
ถาม-ตอบ Chapter 5
ถาม-ตอบ Chapter 6
ถาม-ตอบ Chapter 7
ถาม-ตอบ หัวข้ออื่น ๆ
Pre-Course: ปูพื้นฐานเขียนโปรแกรมสำหรับ Data Engineer - Python & SQL
Introduction: Pre-Course
Slide สำหรับ Pre-Course
Basic Intro
ไฟล์สำหรับ Intro to SQL
Intro to SQL
ไฟล์สำหรับเรียน Intro to Python
Intro to Python
โจทย์ Python และ SQL
โจทย์ Python 1
Recorded: Walk Through เฉลยโจทย์ Python 1
โจทย์ Python 2
Recorded: Walk Through เฉลยโจทย์ Python 2
โจทย์ SQL
Live: Walk Through เฉลยโจทย์ SQL
Recorded Q&A ตอบคำถาม Week Pre-Course
Extra: รวมเฉลยโจทย์ Python บน Snakify ทุกข้อ
Chapter 0: Intro to Data Engineer
ยินดีต้อนรับสู่ Chapter 0
Course Intro
Data Engineer คือใคร
ทำไมอาชีพ Data Engineer ถึงสำคัญในองค์กร
ทำไมเราไม่ควรใช้คนเดียวเป็นทั้ง Data Scientist และ Data Engineer
Big Data คืออะไร และ Big Data Platforms (Hadoop & Cloud)
Data Pipeline & Data Warehouse
3 ประเภทของข้อมูล: Structured, Semi-structured, Unstructured
Database vs Data Warehouse vs Data Lake ต่างกันยังไง
NoSQL Database คืออะไร
Database Model แบบต่าง ๆ & Database Ranking
Programming (Bash, SQL, Python, Java)
Automation (Git, Container, Kubernetes, Airflow, Terraform)
Technology Stack & AI Landscape
สรุป อยากเป็น Data Engineer ต้องรู้อะไรบ้าง
Q&A ท้ายบทที่ 0
Download: Slide CH 0
Chapter 1: การสร้าง Data Pipeline & Data Integration
ยินดีต้อนรับสู่ Chapter 1
Download: Slide CH1
Data Pipeline คืออะไร ทำไมต้องสร้าง
Preview
องค์ประกอบของ Data Pipeline
ETL - Extract Transform Load คืออะไร
ETL กับ ELT ต่างกันอย่างไร
สิ่งที่ต้องคิดในการออกแบบ Data Pipeline
ประเภทของ Data Pipeline: Full load vs Incremental load
Batch vs Stream Processing ต่างกันยังไง
เครื่องมือในการทำ ETL: Code vs No Code
Data Integration คืออะไร ทำไมถึงมีประโยชน์
สิ่งที่ต้องทำใน Data Integration
วิธีทำ ปัญหา และวิธีแก้ไขของ Schema Integration
ปัญหา และวิธีแก้ไขของ Data Integration
Workshop 1: Data Collection ด้วย Python & Pandas
Workshop 1 ทำอะไรบ้าง
Extra Materials ก่อนเข้าสู่ Workshop 1
ไฟล์สำหรับ Workshop 1
วิธีทำ Workshop 1 & 2 ผ่าน Google Colab
มาทำ Workshop 1 ไปพร้อมกัน
ไฟล์เฉลย Workshop 1
Q&A after Workshop 1
Bonus: วิธีสร้าง Database ฟรี และอัพโหลดข้อมูลด้วย MySQLWorkbench ฟรี
Recorded Q&A ตอบคำถาม Week 2 (CH0 & CH1)
Chapter 2: Data Cleansing การทำความสะอาดข้อมูล
ยินดีต้อนรับสู่ Chapter 2
Download: Slide CH2
Data Cleansing คืออะไร
ทำไมต้องทำความสะอาดข้อมูล
Preview
ทำไม Data Cleansing ถึงยาก
ขั้นตอนการทำ Data Cleansing
Data Quality คืออะไร
เครื่องมือ Data Quality - Data Dictionary, Data Lineage, Data Catalog
การทำ EDA - Data Profiling
ประเภทของการทำ EDA
Data Anomaly คืออะไร มีแบบไหนบ้าง
วิธีค้นหาและแก้ไข Syntactical & Semantic Anomalies
วิธีใช้ Regular Expression
Missing Values & Outliers
Hadoop คืออะไร
Hadoop MapReduce ทำงานอย่างไร
Apache Spark คืออะไร
ส่วนเสริมของ Spark
Spark Shell vs PySpark vs Spark-submit
Databricks คืออะไร
ประเภทข้อมูลใน Spark: RDD, DataFrame, DataSet
RDD คืออะไร ทำงานอย่างไร
Spark DataFrame & SparkSQL คืออะไร
แจกเอกสารรวมคำสั่ง Spark
Q&A ท้ายบทที่ 2
Workshop 2: Data Cleansing ด้วย Spark
Workshop 2 ทำอะไรบ้าง
ไฟล์สำหรับ Workshop 2
มาทำ Workshop 2 ไปพร้อมกัน
ไฟล์เฉลย Workshop 2
Q&A ท้าย Workshop 2
Chapter 3: Cloud Computing และ Google Cloud Platform
ยินดีต้อนรับสู่ Chapter 3
Download: Slide CH3
On-premise vs Cloud ต่างกันอย่างไร
ประเภทของ Cloud - Public vs VPS vs Private vs Hybrid Cloud
บริการบน Cloud มีอะไรบ้าง: Compute, Storage, XaaS
Managed Service vs Serverless ต่างกันอย่างไร
บริการ Compute ประเภทต่าง ๆ ใน Google Cloud
บริการ Storage ประเภทต่าง ๆ ใน Google Cloud
วิธีเลือก Storage ใน Googel Cloud: Horizontal vs Vertical Scale
Vendor lock-in: ปัญหาสำคัญในการใช้ Cloud
Streaming Data Pipeline บน Google Cloud
Reference Architecture บน Google Cloud และ Azure
Technology Stack บน Cloud
Workshop ของเรา บน Google Cloud
เปรียบเทียบ Google Cloud & Amazon Web Services
GCP in 4 words
การสมัครสมาชิก และรับเครดิตฟรี Google Cloud
วิธีสมัครสมาชิก Google Cloud & รับเครดิตฟรี $300
Workshop 3: อัพโหลดไฟล์เข้า Data Lake
ไฟล์สำหรับ Workshop 3
มาทำ Workshop 3 ไปพร้อมกัน
Cloud Shell VS Google Cloud Storage
Q&A ท้ายบทที่ 3
Recorded Q&A ตอบคำถาม Week 3 (CH2 & CH3)
Chapter 4: Data Pipeline Orchestration ด้วย Apache Airflow
ยินดีต้อนรับสู่ Chapter 4
Download: Slide CH4
Review Chapter 1-3
วิธีสร้าง Google Cloud Composer
Apache Airflow คืออะไร
Data Pipeline Orchestration คืออะไร
Cron วิธีการ Orchestration แบบเก่า
เครื่องมือสำหรับทำ Data Orchestration
Airbnb ใช้ Apache Airflow ทำอะไรบ้าง
ส่วนประกอบต่าง ๆ ใน Airflow
DAG คืออะไร + ตัวอย่าง DAG สำหรับทำ ETL
DAG ใน Airflow ประกอบด้วยอะไรบ้าง
SubDAGs ใน Airflow
Web UI ของ Airflow
Google Cloud Composer คืออะไร
Architecture ของ Google Cloud Composer
5 ส่วนในการสร้าง DAG ใน Airflow
Workshop 4: Automated Data Pipeline with Airflow
ไฟล์สำหรับ Workshop 4
Q&A: Bash Command คืออะไร
Q&A: การตั้งเวลาแบบ Cron ใน Airflow
มาทำ Workshop 4 ไปพร้อมกัน
Q&A ท้าย Workshop 4
Bonus: วิธีใช้ฟีเจอร์ Connection บน Airflow เพื่อเชื่อมต่อ DB4Free.net
Chapter 5: สร้าง Data Warehouse ด้วย Google BigQuery
ยินดีต้อนรับสู่ Chapter 5
Download: Slide CH5
Serverless มีข้อดีอย่างไร
BigQuery คืออะไร + มีข้อดีอย่างไร
Concept ของ BigQuery: Project, Dataset, Table, Job
วิธีในการโหลดข้อมูลเข้า BigQuery
Workshop 5: สร้าง Big Data Warehouse ด้วย BigQuery
ไฟล์สำหรับ Workshop 5
มาทำ Workshop 5 ไปพร้อมกัน
Recorded Q&A ตอบคำถาม Week 4 (CH4 & CH 5)
Chapter 6: สร้าง Data Visualization ด้วย Google Data Studio
ยินดีต้อนรับสู่ Chapter 6
Download: Slide CH6
Data Visualization คืออะไร มีประโยชน์อย่างไร
โปรแกรมประเภทต่าง ๆ สำหรับทำ Data Visualization
หน้าที่ของ Data Engineer ในงาน Data Visualization
Google Data Studio คืออะไร
Reports & Pages คืออะไร
Data Set & Data Source คืออะไร
Chart, Dimension & Metric คืออะไร
Template & Community Visualizations
เรียน Google Data Studio เพิ่มเติมได้ที่ไหน
Workshop 6: สร้าง Report & Dashboard ด้วย Google Data Studio
ไฟล์สำหรับ Workshop 6
มาทำ Workshop 6 ไปพร้อมกัน
Q&A Chapter 5 & 6
Summary Chapter 1-6
สรุป เราสร้างอะไรไปบ้าง
[สำคัญ] วิธีลบ Project ใน Google Cloud
Chapter 7: Advanced Data Engineering
ยินดีต้อนรับสู่ Chapter 7
Download: Slide CH7
Case Study การทำ ETL
ประเภทของ Data Files อื่น ๆ: Arrow & Parquet
Data Architecture ต้องทำอะไรบ้าง
ทิปการออกแบบ Data Pipeline
Git Branching Strategy
Docker & Kubernetes คืออะไร
Data Protection Policy (GDPR, PDPA) และ PII Data คืออะไร
การ Deploy โมเดล Machine Learning
Machine Learning บน AWS และ Kubeflow
Snowflake: Data Warehouse ใหม่
Delta Lake: Data Lake ใหม่
Data & AI Landscape
การสมัครงาน Data Engineer
Certificate สำหรับ Data Engineer
อาชีพสำหรับต่อยอดจาก Data Engineer: ETL Engineer, ML Engineer, Data Architecture
แนะนำคอร์สและหนังสือด้าน Data Engineer
ลิงค์น่าสนใจสำหรับ Data Engineer
Recorded Q&A ตอบคำถาม Week 5 (CH6 & CH 7)
แนะนำ Resource สำหรับศึกษาต่อ
Video แนะนำ Resource สำหรับศึกษาต่อ
List Resource สำหรับศึกษาต่อ
Guest Speaker Interviews
ยินดีต้อนรับสู่ Guest Speaker Interviews
คุณกานต์ - แนะนำอาชีพ Data Engineer
คุณจีโน่ - แนะนำอาชีพ Data Consultant
คุณฟง - แนะนำอาชีพ Fullstack Developer
Career Guide by คุณกานต์
Special Live: Platform Engineer กับคุณเฮี้ยง
Special Live: Low Cost Data Engineering
Special Live x DataRockie: Full Stack Data
Special Live: Basic Git
Special Live: Advanced Git + CI/CD
Special Live: Docker + Airflow + Kubernetes
รับทางเข้าทำข้อสอบ + Certificate
ฟอร์มรับทางเข้าทำข้อสอบ
×
This is an unpublished lesson. This lesson will not be shown for students unless you set it as Public.
Back to Dashboard
No contents are available in this lesson!
No lessons available !
Back to Dashboard
Lesson contents locked
Enroll to unlock this lesson.
Enroll to unlock
Next Lesson