0% found this document useful (0 votes)

47 views

Lecture 8 Syntax Analysis

This document provides an overview of syntax analysis in compiler design. It discusses how a syntax analyzer or parser takes the output of a lexical analyzer (tokens) as input and checks the syntax against context-free grammar rules to generate a parse tree. Context-free grammars use productions to describe the structure of a language and are recognized by push-down automata. The document also covers derivations, ambiguity, associativity, precedence and how parse trees depict the structure and order of operations in an expression.

Uploaded by

Ali Rayhan

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

47 views

Lecture 8 Syntax Analysis

Uploaded by

Ali Rayhan

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 37

SYNTAX ANALYSIS

LECTURE 8
LECTURE OUTLINE

• SYNTAX ANALYSIS
• CONTEXT FREE GRAMMAR
• DERIVATIONS
• AMBIGUITY
• ASSOCIATIVE
• PRECEDENT
• PRECEDENCE
SYNTAX ANALYSIS
source program

lexical analyzer

tokens

syntax analyzer

parse tree

semantic analyzer

parser tree
SYNTAX ANALYSIS

• SYNTAX ANALYSIS OR PARSING IS THE SECOND PHASE OF A COMPILER.

• WE HAVE SEEN THAT A LEXICAL ANALYZER CAN IDENTIFY TOKENS WITH THE HELP OF
REGULAR EXPRESSIONS AND PATTERN RULES.
• BUT A LEXICAL ANALYZER CANNOT CHECK THE SYNTAX OF A GIVEN SENTENCE DUE
TO THE LIMITATIONS OF THE REGULAR EXPRESSIONS.
• REGULAR EXPRESSIONS CANNOT CHECK BALANCING TOKENS, SUCH AS PARENTHESIS.
• THEREFORE, THIS PHASE USES CONTEXT-FREE GRAMMAR (CFG), WHICH IS
RECOGNIZED BY PUSH-DOWN AUTOMATA
SYNTAX ANALYSIS

• A PARSE TREE DEPICTS ASSOCIATIVITY AND PRECEDENCE OF OPERATORS. THE DEEPEST SUB-
TREE IS TRAVERSED FIRST, THEREFORE THE OPERATOR IN THAT SUB-TREE GETS PRECEDENCE
OVER THE OPERATOR WHICH IS IN THE PARENT NODES.

IF ( EXPRESSION ) STATEMENT ELSE STATEMENT

SYNTAX ANALYSIS

• THAT IS, AN IF-ELSE STATEMENT IS THE CONCATENATION OF THE KEYWORD IF, AN OPENING
PARENTHESIS, AN EXPRESSION, A CLOSING PARENTHESIS, A STATEMENT, THE KEYWORD ELSE,
AND ANOTHER STATEMENT.
• USING THE VARIABLE EXPR TO DENOTE AN EXPRESSION AND THE VARIABLE STMT TO DENOTE A
STATEMENT, THIS STRUCTURING RULE CAN BE EXPRESSED AS

STMT IF ( EXPR ) STMT ELSE STMT

SYNTAX ANALYSIS

STMT IF ( EXPR ) STMT ELSE STMT

• IN WHICH THE ARROW MAY BE READ AS "CAN HAVE THE FORM." SUCH A RULE IS CALLED AM
PRODUCTION. IN A PRODUCTION, LEXICAL ELEMENTS LIKE THE KEYWORD IF AND THE
PARENTHESES
• ARE CALLED TERMINALS. VARIABLES LIKE EXPR AND STMT REPRESENT SEQUENCES OF
TERMINALS AND ARE CALLED NONTERMINALS.
CONTEXT-FREE GRAMMAR

• CFG, ON THE OTHER HAND, IS A SUPERSET OF REGULAR GRAMMAR

• IT IMPLIES THAT EVERY REGULAR GRAMMAR IS ALSO CONTEXT-FREE, BUT THERE
EXISTS SOME PROBLEMS, WHICH ARE BEYOND THE SCOPE OF REGULAR
GRAMMAR.
• CFG IS A HELPFUL TOOL IN DESCRIBING THE SYNTAX OF PROGRAMMING
LANGUAGES.
CONTEXT FREE GRAMMAR
DEFINITION

• A CONTEXT-FREE GRAMMAR HAS FOUR COMPONENTS:

1. A SET OF TERMINAL SYMBOLS, SOMETIMES REFERRED TO AS "TOKENS." THE
TERIILINALS. ARE THE ELEMENTARY SYMBOLS OF THE LANGUAGE DEFINED BY THE
GRAMMAR.
2. A SET OF NONTERMINALS, SOMETIMES CALLED "SYNTACTIC VARIABLES." EACH
NONTERMINAL REPRESENTS A SET OF STRINGS OF TERMINALS, IN A MANNER WE
SHALL DESCRIBE.
DEFINITION

• A SET OF PRODUCTIONS (P). THE PRODUCTIONS OF A GRAMMAR SPECIFY THE MANNER IN

WHICH THE TERMINALS AND NON-TERMINALS CAN BE COMBINED TO FORM STRINGS.
• EACH PRODUCTION CONSISTS OF A NON-TERMINAL CALLED THE LEFT SIDE OF THE
PRODUCTION, AN ARROW, AND A SEQUENCE OF TOKENS AND/OR ON- TERMINALS, CALLED
THE RIGHT SIDE OF THE PRODUCTION.
• ONE OF THE NON-TERMINALS IS DESIGNATED AS THE START SYMBOL (S); FROM WHERE THE
PRODUCTION BEGINS.
DEFINITION

G=(S ,N,P,S)
• S IS A FINITE SET OF TERMINALS
• N IS A FINITE SET OF NON-TERMINALS
• P IS A FINITE SUBSET OF PRODUCTION RULES
• S IS THE START SYMBOL
EXAMPLE
• WE TAKE THE PROBLEM OF PALINDROME LANGUAGE, WHICH CANNOT BE DESCRIBED BY
MEANS OF REGULAR EXPRESSION. THAT IS, L = { W | W = WR } IS NOT A REGULAR
LANGUAGE. BUT IT CAN BE DESCRIBED BY MEANS OF CFG, AS ILLUSTRATED BELOW:
G = ( V, Σ, P, S )
V = { Q, Z, N }
Σ = { 0, 1 }
P = { Q → Z | Q → N | Q → ℇ | Z → 0Q0 | N → 1Q1 }
S={Q}
THIS GRAMMAR DESCRIBES PALINDROME LANGUAGE, SUCH AS: 1001, 11100111, 00100,
1010101, 11111, ETC.
SYNTAX ANALYZERS

• A SYNTAX ANALYZER OR PARSER TAKES THE INPUT FROM A LEXICAL ANALYZER IN THE FORM
OF TOKEN STREAMS. THE PARSER ANALYZES THE SOURCE CODE (TOKEN STREAM) AGAINST THE
PRODUCTION RULES TO DETECT ANY ERRORS IN THE CODE. THE OUTPUT OF THIS PHASE IS A
PARSE TREE.
• THIS WAY, THE PARSER ACCOMPLISHES TWO TASKS, I.E., PARSING THE CODE, LOOKING FOR
ERRORS, AND GENERATING A PARSE TREE AS THE OUTPUT OF THE PHASE.
• PARSERS ARE EXPECTED TO PARSE THE WHOLE CODE EVEN IF SOME ERRORS EXIST IN THE
PROGRAM. PARSERS USE ERROR RECOVERING STRATEGIES.
SYNTAX ANALYZERS
DERIVATION

• A DERIVATION IS BASICALLY A SEQUENCE OF PRODUCTION RULES, IN ORDER TO GET THE

INPUT STRING. DURING PARSING, WE TAKE TWO DECISIONS FOR SOME SENTENTIAL FORM OF
INPUT:
• DECIDING THE NON-TERMINAL WHICH IS TO BE REPLACED.
• DECIDING THE PRODUCTION RULE, BY WHICH, THE NON-TERMINAL WILL BE REPLACED.
• TO DECIDE WHICH NON-TERMINAL TO BE REPLACED WITH PRODUCTION RULE, WE CAN HAVE
TWO OPTIONS.
• LEFT-MOST DERIVATION
• RIGHT-MOST DERIVATION
DERIVATION

LEFT-MOST DERIVATION
• IF THE SENTENTIAL FORM OF AN INPUT IS SCANNED AND REPLACED FROM LEFT TO RIGHT, IT
IS CALLED LEFT-MOST DERIVATION. THE SENTENTIAL FORM DERIVED BY THE LEFT-MOST
DERIVATION IS CALLED THE LEFT-SENTENTIAL FORM.

RIGHT-MOST DERIVATION
• IF WE SCAN AND REPLACE THE INPUT WITH PRODUCTION RULES, FROM RIGHT TO LEFT, IT IS
KNOWN AS RIGHT-MOST DERIVATION. THE SENTENTIAL FORM DERIVED FROM THE RIGHT-
MOST DERIVATION IS CALLED THE RIGHT-SENTENTIAL FORM.
EXAMPLE

PRODUCTION RULES:

E→E+E
E→E*E
INPUT STRING: ID + ID * ID
LEFT-MOST DERIVATION
THE LEFT-MOST DERIVATION IS:
E→E*E
E→E+E*E
E → ID + E * E
E → ID + ID * E
E → ID + ID * ID
NOTICE THAT THE LEFT-MOST SIDE NON-TERMINAL IS ALWAYS PROCESSED FIRST
RIGHT-MOST DERIVATION

THE RIGHT-MOST DERIVATION IS:

E→E+E
E→E+E*E
E → E + E * ID
E → E + ID * ID
E → ID + ID * ID
PARSE TREE

• A PARSE TREE IS A GRAPHICAL DEPICTION OF A DERIVATION.

• IT IS CONVENIENT TO SEE HOW STRINGS ARE DERIVED FROM THE START
SYMBOL.
• THE START SYMBOL OF THE DERIVATION BECOMES THE ROOT OF THE PARSE
TREE.
LEFT-MOST DERIVATION

• WE TAKE THE LEFT-MOST DERIVATION OF A + B * C

E→E*E
E→E+E*E
E → ID + E * E
E → ID + ID * E
E → ID + ID * ID
ATIO
DESCRIPTION OF EXAMPLE

IN A PARSE TREE:
• ALL LEAF NODES ARE TERMINALS.
• ALL INTERIOR NODES ARE NON-TERMINALS.
• IN-ORDER TRAVERSAL GIVES ORIGINAL INPUT STRING.
A PARSE TREE DEPICTS ASSOCIATIVITY AND PRECEDENCE OF OPERATORS.
THE DEEPEST SUB-TREE IS TRAVERSED FIRST, THEREFORE THE OPERATOR IN THAT SUB-TREE GETS
PRECEDENCE OVER THE OPERATOR WHICH IS IN THE PARENT NODES.
AMBIGUITY

• GRAMMAR THAT PRODUCES MORE THAN ONE PARSE TREE FOR SOME SENTENCE IS SAID TO BE
AMBIGUOUS. PUT ANOTHER WAY.
• AN AMBIGUOUS GRAMMAR IS ONE THAT PRODUCES MORE THAN ONE LEFTMOST DERIVATION
OR MORE THAN ONE RIGHTMOST DERIVATION FOR THE SAME SENTENCE.
• FOR MOST PARSERS, IT IS DESIRABLE THAT THE GRAMMAR BE MADE UNAMBIGUOUS, FOR IF IT
IS NOT , WE CANNOT UNIQUELY DETERMINE WHICH PARSE TREE TO SELECT FOR A SENTENCE.
EXAMPLE

THE ARITHMETIC EXPRESSION GRAMMAR PERMITS TWO DISTINCT LEFTMOST DERIVATIONS FOR
THE SENTENCE ID + ID * ID:
E =} E + E E =} E * E
=} ID + E :::} E + E * E
=} ID + E * E =} ID + E * E
=} ID + ID * E :=} ID + ID * E
=} ID + ID * ID :=} ID + ID * ID
TWO PARSE TREES FOR ID+ID*ID

.
EXPLANATION

• THAT THE PARSE TREE REFLECTS THE COMMONLY ASSUMED PRECEDENCE OF + AND *.
• WHILE THE TREE DOES NOT. THAT IS, IT IS CUSTOMARY TO TREAT OPERATOR * AS HAVING
HIGHER PRECEDENCE THAN +.
• CORRESPONDING TO THE FACT THAT WE WOULD NORMALLY EVALUATE AN EXPRESSION LIKE
A + B * C AS A + (B * C) , RATHER THAN AS (A + B) * C.
AMBIGUITY

• THE LANGUAGE GENERATED BY AN AMBIGUOUS GRAMMAR IS SAID TO BE INHERENTLY

AMBIGUOUS.
• AMBIGUITY IN GRAMMAR IS NOT GOOD FOR A COMPILER CONSTRUCTION. NO METHOD
CAN DETECT AND REMOVE AMBIGUITY AUTOMATICALLY.
• BUT IT CAN BE REMOVED BY EITHER RE-WRITING THE WHOLE GRAMMAR WITHOUT
AMBIGUITY, OR BY SETTING AND FOLLOWING ASSOCIATIVITY AND PRECEDENCE
CONSTRAINTS.
ASSOCIATIVE

• IF AN OPERAND HAS OPERATORS ON BOTH SIDES, THE SIDE ON WHICH THE OPERATOR TAKES
THIS OPERAND IS DECIDED BY THE ASSOCIATIVITY OF THOSE OPERATORS.
• IF THE OPERATION IS LEFT-ASSOCIATIVE, THEN THE OPERAND WILL BE TAKEN BY THE LEFT
OPERATOR; OR IF THE OPERATION IS RIGHT-ASSOCIATIVE, THE RIGHT OPERATOR WILL TAKE
THE OPERAND.
EXAMPLE
• OPERATIONS SUCH AS ADDITION, MULTIPLICATION, SUBTRACTION, AND DIVISION ARE LEFT
ASSOCIATIVE. IF THE EXPRESSION CONTAINS:
ID OP ID OP ID
IT WILL BE EVALUATED AS:
(ID OP ID) OP ID
FOR EXAMPLE, (ID + ID) + ID
OPERATIONS LIKE EXPONENTIATION ARE RIGHT ASSOCIATIVE, I.E., THE ORDER OF EVALUATION IN
THE SAME EXPRESSION WILL BE:
ID OP (ID OP ID)
PRECEDENCE
• IF TWO DIFFERENT OPERATORS SHARE A COMMON OPERAND, THE PRECEDENCE OF
OPERATORS DECIDES WHICH WILL TAKE THE OPERAND.
• THAT IS, 2+3*4 CAN HAVE TWO DIFFERENT PARSE TREES, ONE CORRESPONDING TO (2+3)*4
AND ANOTHER CORRESPONDING TO 2+(3*4).
• BY SETTING PRECEDENCE AMONG OPERATORS, THIS PROBLEM CAN BE EASILY REMOVED.

• AS IN THE PREVIOUS EXAMPLE, MATHEMATICALLY * (MULTIPLICATION) HAS PRECEDENCE OVER

+ (ADDITION), SO THE EXPRESSION 2+3*4 WILL ALWAYS BE INTERPRETED AS:
2 + (3 * 4)
THESE METHODS DECREASE THE CHANCES OF AMBIGUITY IN A LANGUAGE OR ITS GRAMMAR.
PARSE TREE FOR -(ID + ID)
E => -E => -(E) => -(E+E) => -(ID+E)=>-(ID+ID)

Impact 11 - Ocak Answer Key
100% (1)
Impact 11 - Ocak Answer Key
4 pages
Boolean Expressions
No ratings yet
Boolean Expressions
21 pages
2024_CD-Ch03_Syntaxx_Analysis
No ratings yet
2024_CD-Ch03_Syntaxx_Analysis
28 pages
Compiler Design - Syntax Analysis
No ratings yet
Compiler Design - Syntax Analysis
14 pages
Compiler 3
No ratings yet
Compiler 3
11 pages
Syntax Analysis
No ratings yet
Syntax Analysis
73 pages
CH03
No ratings yet
CH03
57 pages
Syntax Analysis: EECS 483 - Lecture 4 University of Michigan Monday, September 17, 2006
No ratings yet
Syntax Analysis: EECS 483 - Lecture 4 University of Michigan Monday, September 17, 2006
28 pages
1 Syntax Analyzer
No ratings yet
1 Syntax Analyzer
33 pages
Compiler Design Chapter-3
0% (1)
Compiler Design Chapter-3
177 pages
Unit - 4 Syntax Analysis
No ratings yet
Unit - 4 Syntax Analysis
25 pages
4th - Syntax Analysis
No ratings yet
4th - Syntax Analysis
29 pages
CC_unit_3
No ratings yet
CC_unit_3
51 pages
3 Role of Parser
No ratings yet
3 Role of Parser
135 pages
Chapter 3
No ratings yet
Chapter 3
180 pages
CD Chapter-3
No ratings yet
CD Chapter-3
105 pages
KCA015 Unit2
No ratings yet
KCA015 Unit2
29 pages
Unit - 3 Mid - 1
No ratings yet
Unit - 3 Mid - 1
37 pages
Syntax Analysis: CD: Compiler Design
No ratings yet
Syntax Analysis: CD: Compiler Design
36 pages
2014-CD Ch-03 SAn
No ratings yet
2014-CD Ch-03 SAn
21 pages
Chapter-3-Syntax Analysis
No ratings yet
Chapter-3-Syntax Analysis
126 pages
CC-Lec 5 Week 5 Cfgs
No ratings yet
CC-Lec 5 Week 5 Cfgs
29 pages
Lex
No ratings yet
Lex
13 pages
Lecture 5
No ratings yet
Lecture 5
28 pages
1 Syntax Analyzer
No ratings yet
1 Syntax Analyzer
33 pages
Chapter 3 - Syntax Analysis Part One
No ratings yet
Chapter 3 - Syntax Analysis Part One
17 pages
Unit-2 F&CD
No ratings yet
Unit-2 F&CD
31 pages
Compiler Design - Syntax Analysis
No ratings yet
Compiler Design - Syntax Analysis
11 pages
Parsing Part - 1
No ratings yet
Parsing Part - 1
53 pages
CH-3 Syntax Analyzer
No ratings yet
CH-3 Syntax Analyzer
41 pages
Parsing Notes
No ratings yet
Parsing Notes
96 pages
Topic #4: Syntactic Analysis (Parsing) : INF 524 Compiler Construction Spring 2011
No ratings yet
Topic #4: Syntactic Analysis (Parsing) : INF 524 Compiler Construction Spring 2011
44 pages
Chapter 3 - Syntax Analysis
No ratings yet
Chapter 3 - Syntax Analysis
16 pages
Compiler Theory: (A Simple Syntax-Directed Translator)
No ratings yet
Compiler Theory: (A Simple Syntax-Directed Translator)
50 pages
Chapter 3
No ratings yet
Chapter 3
77 pages
Chapter 3 (Part 1)
No ratings yet
Chapter 3 (Part 1)
33 pages
2-Role of Parser and Parse Tree-02!08!2024
No ratings yet
2-Role of Parser and Parse Tree-02!08!2024
69 pages
ACD-UNIT-4 Notes
No ratings yet
ACD-UNIT-4 Notes
32 pages
Module 2a - With soln
No ratings yet
Module 2a - With soln
90 pages
Parsing Part - 1
No ratings yet
Parsing Part - 1
53 pages
2.2 - Syntax Analysis (Upto Top-down Parsing)
No ratings yet
2.2 - Syntax Analysis (Upto Top-down Parsing)
91 pages
Ch2 Modified
No ratings yet
Ch2 Modified
39 pages
CS602PC - Compiler Design Lecture Notes Unit 2
No ratings yet
CS602PC - Compiler Design Lecture Notes Unit 2
42 pages
Atcd Unit 2
No ratings yet
Atcd Unit 2
49 pages
COSC3054 Lec 03 I Grammars (4)
No ratings yet
COSC3054 Lec 03 I Grammars (4)
96 pages
Compiler Design 3
No ratings yet
Compiler Design 3
9 pages
Unit 2
No ratings yet
Unit 2
39 pages
3-Module 2 - Role of Parser - Parse Tree-02-08-2024
No ratings yet
3-Module 2 - Role of Parser - Parse Tree-02-08-2024
76 pages
4.parsing
No ratings yet
4.parsing
32 pages
Topic 2 - Syntax and Semantics Lecture Notes
No ratings yet
Topic 2 - Syntax and Semantics Lecture Notes
50 pages
SE Compiler Chapter 3-Parser
No ratings yet
SE Compiler Chapter 3-Parser
27 pages
Theme
No ratings yet
Theme
11 pages
CD UNIT 3
No ratings yet
CD UNIT 3
76 pages
Syntax Analyzer
No ratings yet
Syntax Analyzer
38 pages
CD Unit 2
No ratings yet
CD Unit 2
19 pages
Automata Theory Lec-03
No ratings yet
Automata Theory Lec-03
58 pages
Syntax Analysis: - Check Syntax and Construct Abstract Syntax Tree
No ratings yet
Syntax Analysis: - Check Syntax and Construct Abstract Syntax Tree
22 pages
Compiler Construction Week 04 Syntax Analysis I)
No ratings yet
Compiler Construction Week 04 Syntax Analysis I)
41 pages
202 Great Cover Letters
From Everand
202 Great Cover Letters
Michael Betrus
5/5 (1)
Algebra
From Everand
Algebra
Beverly Nance
5/5 (2)
Hunt A Killer: The Detective's Puzzle Book: True-Crime Inspired Ciphers, Codes, and Brain Games
From Everand
Hunt A Killer: The Detective's Puzzle Book: True-Crime Inspired Ciphers, Codes, and Brain Games
Hunt A Killer
No ratings yet
EXAMs Jenny
No ratings yet
EXAMs Jenny
2 pages
GST 111 (Note 1) English
No ratings yet
GST 111 (Note 1) English
16 pages
Answers Grammar 6
No ratings yet
Answers Grammar 6
29 pages
Persuasive Speech
No ratings yet
Persuasive Speech
4 pages
Assignment 11- Business Writing
No ratings yet
Assignment 11- Business Writing
10 pages
Year 2 Yearly Schemr of Work 2024-2025 - SCC
No ratings yet
Year 2 Yearly Schemr of Work 2024-2025 - SCC
13 pages
Perhatikan Contoh Berikut: Dialogue 1
No ratings yet
Perhatikan Contoh Berikut: Dialogue 1
3 pages
Kinds of Sentence
No ratings yet
Kinds of Sentence
18 pages
sabak
No ratings yet
sabak
3 pages
Smile 3..1 Blerina
No ratings yet
Smile 3..1 Blerina
40 pages
ENGLISH LANGUAGE
No ratings yet
ENGLISH LANGUAGE
6 pages
Compound Complex Simple Sentence Key
No ratings yet
Compound Complex Simple Sentence Key
1 page
Evolve Digital Level 5A Grammar Summaries
No ratings yet
Evolve Digital Level 5A Grammar Summaries
18 pages
Daily Lesson Plan English Language Year 6
No ratings yet
Daily Lesson Plan English Language Year 6
5 pages
Planificare Unitati Cls A IV A INSP
No ratings yet
Planificare Unitati Cls A IV A INSP
10 pages
Academic English Grammar in Use
No ratings yet
Academic English Grammar in Use
34 pages
Propositional Logic (MM)
No ratings yet
Propositional Logic (MM)
33 pages
The Essentials of Academic Writing For International Students
No ratings yet
The Essentials of Academic Writing For International Students
3 pages
Ela and Language Development Second
No ratings yet
Ela and Language Development Second
8 pages
JSS2 CBT Questions For 2ND Term
No ratings yet
JSS2 CBT Questions For 2ND Term
3 pages
Communicative Language Teaching (CLT) - The Communicative Approach
No ratings yet
Communicative Language Teaching (CLT) - The Communicative Approach
5 pages
Teaching Through Songs
No ratings yet
Teaching Through Songs
3 pages
19ecs303 - Formal Languages and Automata Theory
No ratings yet
19ecs303 - Formal Languages and Automata Theory
3 pages
Unit One
No ratings yet
Unit One
9 pages
ecce-b2-accelerator
No ratings yet
ecce-b2-accelerator
28 pages
A1 Grammar lessons and exercises - Test-English 3
No ratings yet
A1 Grammar lessons and exercises - Test-English 3
1 page
PRESENT PERFECT - Tense: Job Interview: Talk About Experiences
No ratings yet
PRESENT PERFECT - Tense: Job Interview: Talk About Experiences
10 pages
Planificare Calendaristica Clasa A IV-a
No ratings yet
Planificare Calendaristica Clasa A IV-a
28 pages
MyPractice - Question Bank - Results
No ratings yet
MyPractice - Question Bank - Results
19 pages