Welcome to Scribd!

0% found this document useful (0 votes)

35 views

12 CodigoNetbeans

Uploaded by

The document provides instructions for installing Hadoop on NetBeans, creating a Java project called "countword" that uses Hadoop libraries to count word frequencies, compiling the program, and then executing it on Hadoop to count words in input files. The program takes the input and output directories as arguments and uses mappers to tokenize the text, reducers to sum word counts, and outputs the results.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

12 CodigoNetbeans

Uploaded by

Miguel Angel

0% found this document useful (0 votes)

35 views5 pages

Original Description:

12 CodigoNetbeans

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

35 views5 pages

12 CodigoNetbeans

Uploaded by

Miguel Angel

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 5

Search inside document

Descargar

https://netbeans.org/downloads/8.0.1/

Java EE

Instalar

File/New Project

Project Location: C:\Users\Usuario\Desktop\ejemplos (en el escritorio en un carpeta

ejemplos)

Create Main Class: countword.Countword

Finish

Dentro de la Ventana Proyectos hacer click derecho en el icono de countword

Hacer click en “Properties”

Click en “Libraries”

Click en “Add JAR/Folder”

carpeta:"hadoop-2.8.0/share/hadoop/common"

seleccionar:"hadoop-common-2.8.0.jar"

Open

Add JAR/Folder

carpeta:"hadoop-2.8.0/share/hadoop/mapreduce"

seleccionar:"hadoop-mapreduce-client-core-2.8.0.jar"

seleccionar:"hadoop-mapreduce-client-common-2.8.0.jar"

seleccionar:"hadoop-mapreduce-client-jobclient-2.8.0.jar"

Copiar el código en la clase Countword

package countword;

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.lib.input.FileSplit;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.util.GenericOptionsParser;

public class Countword {

public static class TokenizerMapper
extends Mapper<Object, Text, Text, IntWritable>{

private final static IntWritable one = new IntWritable(1);

private Text word = new Text();

public void map(Object key, Text value, Context context

) throws IOException, InterruptedException {
String filename = ((FileSplit)context.getInputSplit()).getPath().getName();

StringTokenizer itr = new StringTokenizer(value.toString());

while (itr.hasMoreTokens()) {
word.set(itr.nextToken().toLowerCase().replaceAll("[^a-z]+","") +" "+ filename); // get rid
of speicial char
context.write(word, one);
}
}
}

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();

public void reduce(Text key, Iterable<IntWritable> values,

Context context
) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
sum += val.get();
}
result.set(sum);
context.write(key, result);
}
}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();

Job job = new Job(conf, "word count");

job.setJarByClass(Countword.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(args[1]));
FileOutputFormat.setOutputPath(job, new Path(args[2]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

Compilar el programa.
Tendrás el archivo

Copiarlo a c:/
Ejemplo 1

cd/
hadoop dfsadmin -safemode leave
hadoop fs -mkdir /input_dir
hadoop fs -put C:/input_file.txt /input_dir
hadoop fs -ls /input_dir/
hadoop dfs -cat /input_dir/input_file.txt

hadoop jar C:/countword.jar Countword /input_dir /output_dir

Ejemplo 2

cd/
hadoop dfsadmin -safemode leave
hadoop fs -mkdir /input_dir
hadoop fs -put C:/shake.txt /input_dir
hadoop fs -ls /input_dir/
hadoop dfs -cat /input_dir/shake.txt

hadoop jar C:/countword.jar Countword /input_dir /output_dir

Machine Code For Beginners PDF
Document51 pages
Machine Code For Beginners PDF
Miguel Angel
100% (2)
Invivo Precess 3160 Service Manual
Document192 pages
Invivo Precess 3160 Service Manual
luis
100% (2)
Teamspeak 3 Manual
Document50 pages
Teamspeak 3 Manual
api-273725672
100% (1)
SAT Math Workbook D1-12 PDF
Document157 pages
SAT Math Workbook D1-12 PDF
ADITYA Sirohi
No ratings yet
Running Jar Program
Document3 pages
Running Jar Program
nkr189
No ratings yet
Execute Java Map Reduce Sample Using Eclipse
Document9 pages
Execute Java Map Reduce Sample Using Eclipse
Arjun S
No ratings yet
Practical 2c
Document2 pages
Practical 2c
rodylogin69
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
Wordcount
Document3 pages
Wordcount
21020279 Trần Diệu Anh
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
Document5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
riya k
No ratings yet
Week-8 de
Document9 pages
Week-8 de
cseiot 2022
No ratings yet
DSBDA GRP B Print
Document21 pages
DSBDA GRP B Print
tmhrrsmorde
No ratings yet
CSF443 Lab-Report Nimish Shandilya 1000016934
Document17 pages
CSF443 Lab-Report Nimish Shandilya 1000016934
itmailhere
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
Mcsl26 See QP Solution 2024
Document33 pages
Mcsl26 See QP Solution 2024
harshith123cs
No ratings yet
Step 2 - First MapReduce Program
Document25 pages
Step 2 - First MapReduce Program
Santosh Kumar Desai
No ratings yet
BDA Lab
Document13 pages
BDA Lab
MACHARLA SUPRIYA
No ratings yet
02-Wordcount Mapreduce
Document5 pages
02-Wordcount Mapreduce
Mohammed Thawfeeq
No ratings yet
Cp5261 Da Lab Me-Cse 2021 - Edit
Document88 pages
Cp5261 Da Lab Me-Cse 2021 - Edit
950322243028
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
Map Reduce Example
Document6 pages
Map Reduce Example
Jajang Nurjaman
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Document3 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Christiam Niño
No ratings yet
DBMS Mini Project Report
Document15 pages
DBMS Mini Project Report
Abhijeet
No ratings yet
6 - Simple Wordcount
Document2 pages
6 - Simple Wordcount
Xavier TxA
No ratings yet
579 BDA Week-04
Document1 page
579 BDA Week-04
alluarjunrrrr
No ratings yet
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
No ratings yet
Exp 9 - Merged
Document13 pages
Exp 9 - Merged
Abhishek Tiwari
No ratings yet
Hadoop Map Reduce
Document8 pages
Hadoop Map Reduce
Salah Eddine Hebabaze
No ratings yet
Build Grad Le
Document4 pages
Build Grad Le
ravish chadha
No ratings yet
Exp 9
Document7 pages
Exp 9
Abhishek Tiwari
No ratings yet
1-Implementing A Java Program
Document13 pages
1-Implementing A Java Program
pratigya g
No ratings yet
Lab Manual
Document86 pages
Lab Manual
pthuynh709
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
NPR College of Engineering and Technology Department of Computer Science & Engg.
Document38 pages
NPR College of Engineering and Technology Department of Computer Science & Engg.
lathikacharan
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
Document2 pages
To Count Using Map and Reduce Program: Wordcount - Java
Ramya Devi
No ratings yet
Big Data Manual
Document82 pages
Big Data Manual
rethinakumari
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
Word Count Program With MapReduce and Java
Document7 pages
Word Count Program With MapReduce and Java
chetna
No ratings yet
Big Data
Document67 pages
Big Data
B21A4530 Ashritha
No ratings yet
Isat-U Computer Department ICT104 - Intermediate Programming Prof. Loreto G. Gabawa JR
Document7 pages
Isat-U Computer Department ICT104 - Intermediate Programming Prof. Loreto G. Gabawa JR
JesseVillanueva
No ratings yet
Nur Chasanah - TI822116 - TID - Uas Pbo2
Document35 pages
Nur Chasanah - TI822116 - TID - Uas Pbo2
chasanahn310104
No ratings yet
Java
Document3 pages
Java
pasopem528
No ratings yet
JLibrary Managment System Documentation
Document68 pages
JLibrary Managment System Documentation
aregawi weleabezgi
No ratings yet
IRFinal
Document46 pages
IRFinal
sahayajeicy10
No ratings yet
BDF Programs
Document32 pages
BDF Programs
nadigenibharathi70
No ratings yet
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
Document22 pages
Developing A Simple Map-Reduce Program For Hadoop: Big Data Course CS6350 Professor: Dr. Latifur Khan
Kaushal Prajapati
No ratings yet
Ayushman Bhattcharya - MCAN - 293 - Java Assignment4
Document25 pages
Ayushman Bhattcharya - MCAN - 293 - Java Assignment4
Ayushman Bhattacharya
No ratings yet
BDA4
Document7 pages
BDA4
nikithakatta0
No ratings yet
BDA LabManual
Document20 pages
BDA LabManual
posprojectz
No ratings yet
Java Programs
Document31 pages
Java Programs
Raghu Gowda
No ratings yet
Java Full
Document10 pages
Java Full
aneeshshinde167
No ratings yet
Java Assignment Richa
Document25 pages
Java Assignment Richa
Richa
No ratings yet
Hadoop Training in Hyderabad
Document49 pages
Hadoop Training in Hyderabad
kellytechnologies
No ratings yet
Java Manual R-22
Document35 pages
Java Manual R-22
my stories
No ratings yet
Analyzing The Data With Hadoop
Document13 pages
Analyzing The Data With Hadoop
Vyshnavi Thottempudi
No ratings yet
J2EE Web Application Development (PDFDrive)
Document344 pages
J2EE Web Application Development (PDFDrive)
miguel.reyes
No ratings yet
Java Practical File (11-25)
Document20 pages
Java Practical File (11-25)
Siddharth Dev Kapoor
No ratings yet
OddEven Program
Document2 pages
OddEven Program
harshith123cs
No ratings yet
CMake Lists
Document4 pages
CMake Lists
engelo89
No ratings yet
Notepadinstructions For MinGW and JDK
Document3 pages
Notepadinstructions For MinGW and JDK
Justin Wright
No ratings yet
Map Reduce
Document4 pages
Map Reduce
chetanruparel07aws
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
Rating: 3 out of 5 stars
3/5 (4)
Fundus Photograph-Based Deep Learning Algorithms in Detecting Diabetic Retinopathy
Document13 pages
Fundus Photograph-Based Deep Learning Algorithms in Detecting Diabetic Retinopathy
Miguel Angel
No ratings yet
Impact of Deep Learning Assistance On The Histopathologic Review of Lymph Nodes For Metastatic Breast Cancer
Document11 pages
Impact of Deep Learning Assistance On The Histopathologic Review of Lymph Nodes For Metastatic Breast Cancer
Miguel Angel
No ratings yet
Graph500 BigData2016 Paper
Document8 pages
Graph500 BigData2016 Paper
Miguel Angel
No ratings yet
Exercises in Probability (T. Cacoullos)
Document250 pages
Exercises in Probability (T. Cacoullos)
Miguel Angel
No ratings yet
Computer Vision and Deep Learning 1708702317
Document93 pages
Computer Vision and Deep Learning 1708702317
Goudou Vedalie
No ratings yet
GridDataReport-PRAK 2 DATA
Document7 pages
GridDataReport-PRAK 2 DATA
Paksindra96
No ratings yet
Preparation of Papers in Two Column Format For ISEC 2018
Document5 pages
Preparation of Papers in Two Column Format For ISEC 2018
Mateus Souza
No ratings yet
The Future of Artificial Intelligence
Document3 pages
The Future of Artificial Intelligence
Shaik Jabeer
No ratings yet
TC2931en-Ed01 Installation Procedure For OmniVista8770 R5.0.23
Document79 pages
TC2931en-Ed01 Installation Procedure For OmniVista8770 R5.0.23
locuras34
No ratings yet
10 How To Play (1) :: A Week Carefully!
Document2 pages
10 How To Play (1) :: A Week Carefully!
Emma Nuelle
No ratings yet
Game Thesis Introduction
Document5 pages
Game Thesis Introduction
erikamorrisfortlauderdale
100% (2)
Case Study: Hashmap Performance Improvement in Java 8
Document2 pages
Case Study: Hashmap Performance Improvement in Java 8
raja
No ratings yet
Manual SDC2 EN
Document54 pages
Manual SDC2 EN
Roberto Amaral Furlani
No ratings yet
The Update Process: Changelog
Document7 pages
The Update Process: Changelog
Adolf
No ratings yet
A Primer On Process Mining Practical Skills With Python and Graphviz by Diogo R. Ferreira
Document101 pages
A Primer On Process Mining Practical Skills With Python and Graphviz by Diogo R. Ferreira
Chas
No ratings yet
Continue Break: 2. Java Branching Statements
Document8 pages
Continue Break: 2. Java Branching Statements
Xxentt
No ratings yet
MVP Software User Manual: MVP Maestro II - Design Client MVP System Configuration Tool
Document50 pages
MVP Software User Manual: MVP Maestro II - Design Client MVP System Configuration Tool
Dan Cool
No ratings yet
WINGPC Manual
Document81 pages
WINGPC Manual
Andre Costa
No ratings yet
Comparison of C Sharp and Visual Basic
Document10 pages
Comparison of C Sharp and Visual Basic
sanchi.varma
No ratings yet
Programming Languages
Document5 pages
Programming Languages
Saad Kolsawala
No ratings yet
NC101 Module 4
Document9 pages
NC101 Module 4
Sarah May Nacion Moresco
No ratings yet
NCR Aptra Activate
Document2 pages
NCR Aptra Activate
Kakeeto Nassif
No ratings yet
MathChE MATLAB ODE Part1
Document16 pages
MathChE MATLAB ODE Part1
Arm Charoenkool
No ratings yet
Unreal Engine
Document40 pages
Unreal Engine
Ream Fahdi
No ratings yet
Audi - TB - 01-03-05 - Readiness Quick Reference
Document14 pages
Audi - TB - 01-03-05 - Readiness Quick Reference
Miguel Carrillo
No ratings yet
RA 8792 (ECA) : An Act Providing For The Recognition and
Document18 pages
RA 8792 (ECA) : An Act Providing For The Recognition and
Sam One
No ratings yet
Enterprise Resource Planning (ERP)
Document36 pages
Enterprise Resource Planning (ERP)
Anamika Sonawane
No ratings yet
ZMT User Manual Rev6
Document18 pages
ZMT User Manual Rev6
Ramiro Lozano Rueda
No ratings yet
Latex MSC Thesis Template
Document7 pages
Latex MSC Thesis Template
tifqbfgig
100% (2)
BVIP Log Collector Tool For VRM Stand-Alone Systems and DIVAR IP
Document1 page
BVIP Log Collector Tool For VRM Stand-Alone Systems and DIVAR IP
Ziko Itchi
No ratings yet
Installation of Keil Microcontroller Development Kit (MDK)
Document3 pages
Installation of Keil Microcontroller Development Kit (MDK)
Nhật
No ratings yet