Big Data (빅데이터)

강좌 소개

이 강좌는 기본적인 빅데이터의 개념부터 시작하여 기술적인 챌린지와 다양한 접근 방법들을 설명하고 직접 프로그래밍을 통해 실습하므로써 빅데이터 문제를 스스로 풀수있는 능력을 기르는 것을 목표로 합니다. 구체적으로, 빅데이터의 기초 이론과 모델에 대한 설명, 데이터베이스와 SQL을 사용한 빅데이터 접근 방법, 그리고 맵리듀스와 하둡, 스파크를 이용한 접근 방법 등 최신 빅데이터 시스템을 이용하여 빅데이터 문제를 직접 코딩하고 해결하는 과정으로 구성되어 있습니다. 또한, 빅데이터에 필요한 통계 이론, 기계학습 및 최적화 이론, 데이터 전처리 방법 등에 대해 강의합니다. 강좌 진행 중 퀴즈, 프로그래밍 숙제, 그리고 시험을 통해 학습 내용을 충분히 이해했는지를 점검할 예정입니다. 컴퓨터 전공자, 또는 비 전공자일 경우, 필요한 수학이나 알고리즘, 프로그래밍 코딩에 대한 기초지식이 있는 분들은 대상으로 강의를 진행할 예정이므로 학습에 어려움이 있을경우 필요한 내용을 스스로 공부하면서 따라올 것을 권장합니다.

강좌 목차

주차	주차
1	Ⅰ. Introduction to Big Data, Data Models	Introduction to Big Data
Data Models
Discussion
2	Ⅱ. Data Analysis with SQL	Relational Algebra and SQLite
SQL and Query Processing
Discussion
3	Ⅲ. MapReduce	Scalable Data Processing
MapReduce Concept
Discussion
4	Ⅳ. Hadoop	Hadoop (HDFS, YARN)
MapReduce Programming
Discussion
5	Reading Week 1	No Lecture, Time to Catch-up
6	Ⅴ. Spark	Spark Concept
Spark Programming
Discussion
7	Ⅵ. NoSQL, Data Measures	NoSQL Concept
Data Measures
Discussion
8	Ⅶ. Statistics, Data Preprocessing	Statistics for Big Data
Data Preprocessing
Discussion
9	Ⅷ. Machine Learning I	Machine Learning Fundamentals, Decision Trees
Naïve Bayes, Rule Learning, Lazy Learning
Discussion
10	Reading Week 2	No Lecture, Time to Catch-up
11	Ⅸ. Machine Learning II	Ensembles, Evaluations
Linear Classification, Artificial Neural Network, Linear SVM
Discussion
12	Ⅹ. Machine Learning III, Optimization	Nonlinear SVM, Ranking SVM
Optimization
Discussion
13	XI. Clustering	Clustering Concepts, Partitioning Methods, Hierarhical Methods
Density-based Methods, Grid-based Methods, Evaluation of Clustering
Discussion
14	XII. Recommender System	Recommender System Ⅰ
Recommender System Ⅱ
Discussion

주차

Ⅰ. Introduction to Big Data, Data Models

Introduction to Big Data

Data Models

Discussion

Ⅱ. Data Analysis with SQL

Relational Algebra and SQLite

SQL and Query Processing

Discussion

Ⅲ. MapReduce

Scalable Data Processing

MapReduce Concept

Discussion

Ⅳ. Hadoop

Hadoop (HDFS, YARN)

MapReduce Programming

Discussion

Reading Week 1

No Lecture, Time to Catch-up

Ⅴ. Spark

Spark Concept

Spark Programming

Discussion

Ⅵ. NoSQL, Data Measures

NoSQL Concept

Data Measures

Discussion

Ⅶ. Statistics, Data Preprocessing

Statistics for Big Data

Data Preprocessing

Discussion

Ⅷ. Machine Learning I

Machine Learning Fundamentals, Decision Trees

Naïve Bayes, Rule Learning, Lazy Learning

Discussion

Reading Week 2

No Lecture, Time to Catch-up

Ⅸ. Machine Learning II

Ensembles, Evaluations

Linear Classification, Artificial Neural Network, Linear SVM

Discussion

Ⅹ. Machine Learning III, Optimization

Nonlinear SVM, Ranking SVM

Optimization

Discussion

XI. Clustering

Clustering Concepts, Partitioning Methods, Hierarhical Methods

Density-based Methods, Grid-based Methods, Evaluation of Clustering

Discussion

XII. Recommender System

Recommender System Ⅰ

Recommender System Ⅱ

Discussion

교수자

유환조

포스텍 컴퓨터공학과 교수

포스텍 정보통신연구소 부소장

University of IOWA Computer Science 교수

University of Illinois at Urbana Champaign Computer Science 박사

홈

프로그램

뉴스

FAQ

Big Data (빅데이터)

강좌 소개

평가 방법

강좌 목차

교수자

유환조

운영팀

이승준