Skip to content

pagutierrez/tutorial-hadoop

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

65 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Tutorial de introducción a la programación MapReduce en Hadoop

Introducción

Este tutorial pretende presentar varios ejemplos sencillos que permitan familiarizarse con los conceptos fundamentales del desarrollo de programas en el entorno MapReduce de Java, concretamente, en la implementación proporcionada por Hadoop. Se asume que ya se conocen los aspectos básicos del modelo MapReduce. En caso contrario, se recomienda consultar los apuntes de clase y el artículo original que propone este modelo de programación paralela (MapReduce: Simplified Data Processing on Large Clusters de Jeffrey Dean y Sanjay Ghemawat), en cuyas ideas se basa la implementación de MapReduce de libre distribución incluida en Hadoop.

Este tutorial supone una pequeña introducción al mundo de Hadoop, pero deberías consultar en Internet si deseas disponer de más información.

El tutorial describe como instalar Hadoop, como escribir una primera aplicación, como compilarla, ejecutarla y comprobar la salida:

  1. Instalación de Hadoop y ejecución del MapReduce nulo
  2. Ejemplo WordCount y primeros ejercicios
  3. Aspectos adicionales y ejercicio final

Referencias

Este tutorial se ha realizado basándonos en gran medida en los siguientes tutoriales:

  1. Introducción a la programación MapReduce en Hadoop. Universidad Politécnica de Madrid (UPM).
  2. Hadoop Tutorial Stanford University.

About

Tutorial sobre Hadoop

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  

Languages