Word Count

Uploaded by

This document contains code for a MapReduce word count program in Java. It includes a Driver class that runs the job, a Mapper class that tokenizes the input text and emits each word along with a count of 1, and a Reducer class that sums the counts for each word. Sample input and output data is provided showing the word counts calculated from the given text.

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Word Count

Uploaded by

niharika sunkara

0% found this document useful (0 votes)

72 views3 pages

Original Description:

WordCount

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

0% found this document useful (0 votes)

72 views3 pages

Word Count

Uploaded by

niharika sunkara

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Download as pdf or txt

Jump to Page

You are on page 1of 3

Search inside document

WORD COUNT:

DRIVER:

import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import java.io.*;
import java.util.*;
public class wc{
public static void main(String args[]) throws Exception
{
Configuration conf=new Configuration();

Job job=Job.getInstance(conf,"xyz");
//job.setJarByClass(WordCount.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(LongWritable.class);
//job.setNumReduceTasks(2);
job.setMapperClass(wcmapper.class);
job.setReducerClass(wcreducer.class);
//job.setPartitionerClass(wcpartition.class);
//job.setCombinerClass(wccombiner.class);
FileInputFormat.setInputPaths(job,new Path(args[0]));
FileOutputFormat.setOutputPath(job,new Path(args[1]));
job.setJarByClass(wc.class);
job.waitForCompletion(true);
}
}

MAPPER:

import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.LongWritable;
import java.io.*;
public class wcmapper extends
Mapper<LongWritable,Text,Text,LongWritable>
{
LongWritable one=new LongWritable(1);

public void map(LongWritable key,Text value,Context context)

throws IOException,InterruptedException
{
String line=value.toString();
String[] wordsinline=line.split(" ");
for(int i=0;i<wordsinline.length;i++)
context.write(new Text(wordsinline[i]),one);
}
}

REDUCER:

import org.apache.hadoop.mapreduce.*;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.io.LongWritable;
import java.io.*;
public class wcreducer extends
Reducer<Text,LongWritable,Text,LongWritable>
{
LongWritable totalWc=new LongWritable();
public void reduce(Text
key,Iterable<LongWritable>values,Context context)throws
IOException,InterruptedException
{
long wordcount=0;
for(LongWritable val:values)
{
wordcount=wordcount+val.get();
}
totalWc.set(wordcount);
context.write(key,totalWc);
}
}

INPUT:

hadoop programs
this is hadoop lab
we are working on map reduce

OUTPUT:

Rest Assured Api Testing PDF
Document15 pages
Rest Assured Api Testing PDF
Automation Testing
No ratings yet
Driver
Document1 page
Driver
Vinay Gupta
No ratings yet
Practical 2c
Document2 pages
Practical 2c
rodylogin69
No ratings yet
MapReduce Example
Document3 pages
MapReduce Example
Ravi Chander
No ratings yet
DSBDA GRP B Print
Document21 pages
DSBDA GRP B Print
tmhrrsmorde
No ratings yet
Mcsl26 See QP Solution 2024
Document33 pages
Mcsl26 See QP Solution 2024
harshith123cs
No ratings yet
Bda Final 11jan
Document7 pages
Bda Final 11jan
G dileep Kumar
No ratings yet
Hadoop Sorting
Document2 pages
Hadoop Sorting
kavya kav
No ratings yet
Experiment 6 BDA
Document4 pages
Experiment 6 BDA
pabocon672
No ratings yet
Wordcount
Document3 pages
Wordcount
21020279 Trần Diệu Anh
No ratings yet
ADA Lab Manual
Document34 pages
ADA Lab Manual
nalluri_08
No ratings yet
6 - Simple Wordcount
Document2 pages
6 - Simple Wordcount
Xavier TxA
No ratings yet
Week 10
Document4 pages
Week 10
THANU SREE
No ratings yet
Exp 4 Word Count
Document4 pages
Exp 4 Word Count
munish kumar agarwal
No ratings yet
Word Count Program
Document3 pages
Word Count Program
harshith123cs
No ratings yet
ContarPalabras Java
Document2 pages
ContarPalabras Java
Yeisson Miranda
No ratings yet
OddEven Program
Document2 pages
OddEven Program
harshith123cs
No ratings yet
Hadoop WordCount
Document2 pages
Hadoop WordCount
kavya kav
No ratings yet
1ST PROGRAM Hadoop
Document5 pages
1ST PROGRAM Hadoop
akshithasonia333
No ratings yet
Lab Manual
Document86 pages
Lab Manual
pthuynh709
No ratings yet
BDA3
Document7 pages
BDA3
nikithakatta0
No ratings yet
Pig & Pig Optimizations: Thejas Nair Dev in Pig Team at Yahoo! Apache Pig PMC Member
Document23 pages
Pig & Pig Optimizations: Thejas Nair Dev in Pig Team at Yahoo! Apache Pig PMC Member
thejasmn
No ratings yet
BDA Lab
Document13 pages
BDA Lab
MACHARLA SUPRIYA
No ratings yet
Run Wordcount
Document3 pages
Run Wordcount
Khushi Patil
No ratings yet
DA Lab Program-2
Document6 pages
DA Lab Program-2
Diksha Padiyar
No ratings yet
Running Jar Program
Document3 pages
Running Jar Program
nkr189
No ratings yet
Hadoop Map Reduce
Document8 pages
Hadoop Map Reduce
Salah Eddine Hebabaze
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
Document7 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
SARAVANAN
No ratings yet
Hbase
Document1 page
Hbase
Vinay Gupta
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
Document2 pages
To Count Using Map and Reduce Program: Wordcount - Java
Ramya Devi
No ratings yet
Codigo Haddop
Document3 pages
Codigo Haddop
Liliana Munar Muñoz
No ratings yet
Cloudera Academic Partnership 4 PDF
Document38 pages
Cloudera Academic Partnership 4 PDF
EL MAMOUN ABDELLAH
No ratings yet
BDT Lab Manual
Document48 pages
BDT Lab Manual
Vishnu Vardhan H
No ratings yet
BDA LabManual
Document20 pages
BDA LabManual
posprojectz
No ratings yet
579 BDA Week-04
Document1 page
579 BDA Week-04
alluarjunrrrr
No ratings yet
Average of Integer: Driver
Document3 pages
Average of Integer: Driver
niharika sunkara
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
Document11 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
saiconze
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Document61 pages
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
Parth
No ratings yet
CSF443 Lab-Report Nimish Shandilya 1000016934
Document17 pages
CSF443 Lab-Report Nimish Shandilya 1000016934
itmailhere
No ratings yet
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Document3 pages
Prácticas Bigdata: 1. Lanzar Un Proceso Mapreduce Contra El Cluster
Christiam Niño
No ratings yet
Hadoop
Document51 pages
Hadoop
Ravitej Tadinada
No ratings yet
Outputs 1.2 To 3.3
Document10 pages
Outputs 1.2 To 3.3
cigejo2983
No ratings yet
BDA Lab 8 Manual
Document7 pages
BDA Lab 8 Manual
Mydah Nasir
No ratings yet
Program: Domparser - Java
Document4 pages
Program: Domparser - Java
Janani Shree
No ratings yet
Hadoop Training in Hyderabad
Document49 pages
Hadoop Training in Hyderabad
kellytechnologies
No ratings yet
Cp5261 Da Lab Me-Cse 2021 - Edit
Document88 pages
Cp5261 Da Lab Me-Cse 2021 - Edit
950322243028
No ratings yet
Part B Assignment - No - 1
Document6 pages
Part B Assignment - No - 1
opscoldy
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
02-Wordcount Mapreduce
Document5 pages
02-Wordcount Mapreduce
Mohammed Thawfeeq
No ratings yet
Step 2 - First MapReduce Program
Document25 pages
Step 2 - First MapReduce Program
Santosh Kumar Desai
No ratings yet
Lecture 4 PDF
Document38 pages
Lecture 4 PDF
AnnaDumitrache
No ratings yet
Java
Document3 pages
Java
pasopem528
No ratings yet
SalesData Map Reduce
Document3 pages
SalesData Map Reduce
bhavana16686
No ratings yet
12 CodigoNetbeans
Document5 pages
12 CodigoNetbeans
Miguel Angel
No ratings yet
Big Data
Document67 pages
Big Data
B21A4530 Ashritha
No ratings yet
Hadoop Streaming Hadoop Pipes Swig: 4 Inputs and Outputs
Document1 page
Hadoop Streaming Hadoop Pipes Swig: 4 Inputs and Outputs
p001
No ratings yet
Big Data Manual
Document82 pages
Big Data Manual
rethinakumari
No ratings yet
BDALab Assn4
Document9 pages
BDALab Assn4
Deepti Agrawal
No ratings yet
cài đặt hadoop
Document6 pages
cài đặt hadoop
21111060679
No ratings yet
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
Rating: 3 out of 5 stars
3/5 (4)
Aim: Program To Implement Linkedlist Program:: Package Import Import Public Class Public Static Void New
Document1 page
Aim: Program To Implement Linkedlist Program:: Package Import Import Public Class Public Static Void New
niharika sunkara
No ratings yet
Aim: Program To Implement Linkedlist Without Using In-Built Class. Program
Document5 pages
Aim: Program To Implement Linkedlist Without Using In-Built Class. Program
niharika sunkara
No ratings yet
AIM: Program To Implement Binary Search Program
Document2 pages
AIM: Program To Implement Binary Search Program
niharika sunkara
No ratings yet
Map Reduced B Seminar
Document17 pages
Map Reduced B Seminar
niharika sunkara
No ratings yet
Average of Integer: Driver
Document3 pages
Average of Integer: Driver
niharika sunkara
No ratings yet
Av Grating
Document5 pages
Av Grating
niharika sunkara
No ratings yet
Unit 51
Document20 pages
Unit 51
niharika sunkara
No ratings yet
Ee4213 ch8
Document93 pages
Ee4213 ch8
niharika sunkara
No ratings yet