DW606G Outline - IBM Open Platform with Apache Hadoop

IBM Open Platform with Apache Hadoop (DW606G) – Outline

Detailed Course Outline

Unit 1: IBM Open Platform with Apache Hadoop

Unit 2: Apache Ambari

Unit 3: Hadoop Distributed File System

Unit 4: MapReduce and Yarn

Unit 5: Apache Spark

Unit 6: Coordination, management, and governance

Unit 7: Data Movement

Unit 8: Storing and Accessing Data

Topic 1: Representing Data: CSV, XML, JSON, and YAML
Topic 2: Open Source Programming Languages: Pig, Hive, and Other [R, Python, etc]
Topic 3: NoSQL Concepts
Topic 4: Accessing Hadoop data using Hive
Exercise 8: Performing CRUD operations using the HBase shell
Topic 5: Querying Hadoop data using Hive
Exercise 9: Using Hive to Access Hadoop / HBase Data

Unit 9: Advanced Topics