MapReduce Training

This repository is collection of MapReduce and Hadoop eco-system related programs:

Also, look into MapReduce Joins on how to implement MapReduce joins.

From root of this project run:

mvn package

Executing WordCount

hadoop jar mapreduce_cwt-1.0-SNAPSHOT.jar com.cloudwick.mapreduce.wordcount.WordCountDriver \
  input_path \
  output_path

Executing Custom InputFormat

hadoop fs -mkdir fw_input
hadoop fs -put columntext-testdata fw_input

hadoop jar mapreduce_cwt-1.0-SNAPSHOT.jar com.cloudwick.mapreduce.inputformat.FixedWidthColumnTextDriver \
  fw_input \
  fw_output

Executing Custom OutputFormat

hadoop jar mapreduce_cwt-1.0-SNAPSHOT.jar com.cloudwick.mapreduce.outputformat.FixedWidthColumnTextDriver \
  fw_output \
  fw_output2

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
src		src
.gitignore		.gitignore
ReadMe.md		ReadMe.md
pom.xml		pom.xml

Provide feedback