remove trailing whitespace
[cython.git] / Cython / Compiler / Parsing.py
1 # cython: auto_cpdef=True, infer_types=True, language_level=3, py2_import=True
2 #
3 #   Pyrex Parser
4 #
5
6 # This should be done automatically
7 import cython
8 cython.declare(Nodes=object, ExprNodes=object, EncodedString=object)
9
10 import os
11 import re
12 import sys
13
14 from Cython.Compiler.Scanning import PyrexScanner, FileSourceDescriptor
15 import Nodes
16 import ExprNodes
17 import StringEncoding
18 from StringEncoding import EncodedString, BytesLiteral, _unicode, _bytes
19 from ModuleNode import ModuleNode
20 from Errors import error, warning, InternalError
21 from Cython import Utils
22 import Future
23 import Options
24
25 class Ctx(object):
26     #  Parsing context
27     level = 'other'
28     visibility = 'private'
29     cdef_flag = 0
30     typedef_flag = 0
31     api = 0
32     overridable = 0
33     nogil = 0
34     namespace = None
35     templates = None
36
37     def __init__(self, **kwds):
38         self.__dict__.update(kwds)
39
40     def __call__(self, **kwds):
41         ctx = Ctx()
42         d = ctx.__dict__
43         d.update(self.__dict__)
44         d.update(kwds)
45         return ctx
46
47 def p_ident(s, message = "Expected an identifier"):
48     if s.sy == 'IDENT':
49         name = s.systring
50         s.next()
51         return name
52     else:
53         s.error(message)
54
55 def p_ident_list(s):
56     names = []
57     while s.sy == 'IDENT':
58         names.append(s.systring)
59         s.next()
60         if s.sy != ',':
61             break
62         s.next()
63     return names
64
65 #------------------------------------------
66 #
67 #   Expressions
68 #
69 #------------------------------------------
70
71 def p_binop_operator(s):
72     pos = s.position()
73     op = s.sy
74     s.next()
75     return op, pos
76
77 def p_binop_expr(s, ops, p_sub_expr):
78     n1 = p_sub_expr(s)
79     while s.sy in ops:
80         op, pos = p_binop_operator(s)
81         n2 = p_sub_expr(s)
82         n1 = ExprNodes.binop_node(pos, op, n1, n2)
83         if op == '/':
84             if Future.division in s.context.future_directives:
85                 n1.truedivision = True
86             else:
87                 n1.truedivision = None # unknown
88     return n1
89
90 #lambdef: 'lambda' [varargslist] ':' test
91
92 def p_lambdef(s, allow_conditional=True):
93     # s.sy == 'lambda'
94     pos = s.position()
95     s.next()
96     if s.sy == ':':
97         args = []
98         star_arg = starstar_arg = None
99     else:
100         args, star_arg, starstar_arg = p_varargslist(
101             s, terminator=':', annotated=False)
102     s.expect(':')
103     if allow_conditional:
104         expr = p_test(s)
105     else:
106         expr = p_test_nocond(s)
107     return ExprNodes.LambdaNode(
108         pos, args = args,
109         star_arg = star_arg, starstar_arg = starstar_arg,
110         result_expr = expr)
111
112 #lambdef_nocond: 'lambda' [varargslist] ':' test_nocond
113
114 def p_lambdef_nocond(s):
115     return p_lambdef(s, allow_conditional=False)
116
117 #test: or_test ['if' or_test 'else' test] | lambdef
118
119 def p_test(s):
120     if s.sy == 'lambda':
121         return p_lambdef(s)
122     pos = s.position()
123     expr = p_or_test(s)
124     if s.sy == 'if':
125         s.next()
126         test = p_or_test(s)
127         s.expect('else')
128         other = p_test(s)
129         return ExprNodes.CondExprNode(pos, test=test, true_val=expr, false_val=other)
130     else:
131         return expr
132
133 #test_nocond: or_test | lambdef_nocond
134
135 def p_test_nocond(s):
136     if s.sy == 'lambda':
137         return p_lambdef_nocond(s)
138     else:
139         return p_or_test(s)
140
141 #or_test: and_test ('or' and_test)*
142
143 def p_or_test(s):
144     return p_rassoc_binop_expr(s, ('or',), p_and_test)
145
146 def p_rassoc_binop_expr(s, ops, p_subexpr):
147     n1 = p_subexpr(s)
148     if s.sy in ops:
149         pos = s.position()
150         op = s.sy
151         s.next()
152         n2 = p_rassoc_binop_expr(s, ops, p_subexpr)
153         n1 = ExprNodes.binop_node(pos, op, n1, n2)
154     return n1
155
156 #and_test: not_test ('and' not_test)*
157
158 def p_and_test(s):
159     #return p_binop_expr(s, ('and',), p_not_test)
160     return p_rassoc_binop_expr(s, ('and',), p_not_test)
161
162 #not_test: 'not' not_test | comparison
163
164 def p_not_test(s):
165     if s.sy == 'not':
166         pos = s.position()
167         s.next()
168         return ExprNodes.NotNode(pos, operand = p_not_test(s))
169     else:
170         return p_comparison(s)
171
172 #comparison: expr (comp_op expr)*
173 #comp_op: '<'|'>'|'=='|'>='|'<='|'<>'|'!='|'in'|'not' 'in'|'is'|'is' 'not'
174
175 def p_comparison(s):
176     n1 = p_starred_expr(s)
177     if s.sy in comparison_ops:
178         pos = s.position()
179         op = p_cmp_op(s)
180         n2 = p_starred_expr(s)
181         n1 = ExprNodes.PrimaryCmpNode(pos,
182             operator = op, operand1 = n1, operand2 = n2)
183         if s.sy in comparison_ops:
184             n1.cascade = p_cascaded_cmp(s)
185     return n1
186
187 def p_test_or_starred_expr(s):
188     if s.sy == '*':
189         return p_starred_expr(s)
190     else:
191         return p_test(s)
192
193 def p_starred_expr(s):
194     pos = s.position()
195     if s.sy == '*':
196         starred = True
197         s.next()
198     else:
199         starred = False
200     expr = p_bit_expr(s)
201     if starred:
202         expr = ExprNodes.StarredTargetNode(pos, expr)
203     return expr
204
205 def p_cascaded_cmp(s):
206     pos = s.position()
207     op = p_cmp_op(s)
208     n2 = p_starred_expr(s)
209     result = ExprNodes.CascadedCmpNode(pos,
210         operator = op, operand2 = n2)
211     if s.sy in comparison_ops:
212         result.cascade = p_cascaded_cmp(s)
213     return result
214
215 def p_cmp_op(s):
216     if s.sy == 'not':
217         s.next()
218         s.expect('in')
219         op = 'not_in'
220     elif s.sy == 'is':
221         s.next()
222         if s.sy == 'not':
223             s.next()
224             op = 'is_not'
225         else:
226             op = 'is'
227     else:
228         op = s.sy
229         s.next()
230     if op == '<>':
231         op = '!='
232     return op
233
234 comparison_ops = (
235     '<', '>', '==', '>=', '<=', '<>', '!=',
236     'in', 'is', 'not'
237 )
238
239 #expr: xor_expr ('|' xor_expr)*
240
241 def p_bit_expr(s):
242     return p_binop_expr(s, ('|',), p_xor_expr)
243
244 #xor_expr: and_expr ('^' and_expr)*
245
246 def p_xor_expr(s):
247     return p_binop_expr(s, ('^',), p_and_expr)
248
249 #and_expr: shift_expr ('&' shift_expr)*
250
251 def p_and_expr(s):
252     return p_binop_expr(s, ('&',), p_shift_expr)
253
254 #shift_expr: arith_expr (('<<'|'>>') arith_expr)*
255
256 def p_shift_expr(s):
257     return p_binop_expr(s, ('<<', '>>'), p_arith_expr)
258
259 #arith_expr: term (('+'|'-') term)*
260
261 def p_arith_expr(s):
262     return p_binop_expr(s, ('+', '-'), p_term)
263
264 #term: factor (('*'|'/'|'%') factor)*
265
266 def p_term(s):
267     return p_binop_expr(s, ('*', '/', '%', '//'), p_factor)
268
269 #factor: ('+'|'-'|'~'|'&'|typecast|sizeof) factor | power
270
271 def p_factor(s):
272     # little indirection for C-ification purposes
273     return _p_factor(s)
274
275 def _p_factor(s):
276     sy = s.sy
277     if sy in ('+', '-', '~'):
278         op = s.sy
279         pos = s.position()
280         s.next()
281         return ExprNodes.unop_node(pos, op, p_factor(s))
282     elif sy == '&':
283         pos = s.position()
284         s.next()
285         arg = p_factor(s)
286         return ExprNodes.AmpersandNode(pos, operand = arg)
287     elif sy == "<":
288         return p_typecast(s)
289     elif sy == 'IDENT' and s.systring == "sizeof":
290         return p_sizeof(s)
291     else:
292         return p_power(s)
293
294 def p_typecast(s):
295     # s.sy == "<"
296     pos = s.position()
297     s.next()
298     base_type = p_c_base_type(s)
299     if base_type.name is None:
300         s.error("Unknown type")
301     declarator = p_c_declarator(s, empty = 1)
302     if s.sy == '?':
303         s.next()
304         typecheck = 1
305     else:
306         typecheck = 0
307     s.expect(">")
308     operand = p_factor(s)
309     return ExprNodes.TypecastNode(pos,
310         base_type = base_type,
311         declarator = declarator,
312         operand = operand,
313         typecheck = typecheck)
314
315 def p_sizeof(s):
316     # s.sy == ident "sizeof"
317     pos = s.position()
318     s.next()
319     s.expect('(')
320     # Here we decide if we are looking at an expression or type
321     # If it is actually a type, but parsable as an expression,
322     # we treat it as an expression here.
323     if looking_at_expr(s):
324         operand = p_test(s)
325         node = ExprNodes.SizeofVarNode(pos, operand = operand)
326     else:
327         base_type = p_c_base_type(s)
328         declarator = p_c_declarator(s, empty = 1)
329         node = ExprNodes.SizeofTypeNode(pos,
330             base_type = base_type, declarator = declarator)
331     s.expect(')')
332     return node
333
334 def p_yield_expression(s):
335     # s.sy == "yield"
336     pos = s.position()
337     s.next()
338     if s.sy != ')' and s.sy not in statement_terminators:
339         arg = p_testlist(s)
340     else:
341         arg = None
342     return ExprNodes.YieldExprNode(pos, arg=arg)
343
344 def p_yield_statement(s):
345     # s.sy == "yield"
346     yield_expr = p_yield_expression(s)
347     return Nodes.ExprStatNode(yield_expr.pos, expr=yield_expr)
348
349 #power: atom trailer* ('**' factor)*
350
351 def p_power(s):
352     if s.systring == 'new' and s.peek()[0] == 'IDENT':
353         return p_new_expr(s)
354     n1 = p_atom(s)
355     while s.sy in ('(', '[', '.'):
356         n1 = p_trailer(s, n1)
357     if s.sy == '**':
358         pos = s.position()
359         s.next()
360         n2 = p_factor(s)
361         n1 = ExprNodes.binop_node(pos, '**', n1, n2)
362     return n1
363
364 def p_new_expr(s):
365     # s.systring == 'new'.
366     pos = s.position()
367     s.next()
368     cppclass = p_c_base_type(s)
369     return p_call(s, ExprNodes.NewExprNode(pos, cppclass = cppclass))
370
371 #trailer: '(' [arglist] ')' | '[' subscriptlist ']' | '.' NAME
372
373 def p_trailer(s, node1):
374     pos = s.position()
375     if s.sy == '(':
376         return p_call(s, node1)
377     elif s.sy == '[':
378         return p_index(s, node1)
379     else: # s.sy == '.'
380         s.next()
381         name = EncodedString( p_ident(s) )
382         return ExprNodes.AttributeNode(pos,
383             obj = node1, attribute = name)
384
385 # arglist:  argument (',' argument)* [',']
386 # argument: [test '='] test       # Really [keyword '='] test
387
388 def p_call_parse_args(s, allow_genexp = True):
389     # s.sy == '('
390     pos = s.position()
391     s.next()
392     positional_args = []
393     keyword_args = []
394     star_arg = None
395     starstar_arg = None
396     while s.sy not in ('**', ')'):
397         if s.sy == '*':
398             if star_arg:
399                 s.error("only one star-arg parameter allowed",
400                     pos = s.position())
401             s.next()
402             star_arg = p_test(s)
403         else:
404             arg = p_test(s)
405             if s.sy == '=':
406                 s.next()
407                 if not arg.is_name:
408                     s.error("Expected an identifier before '='",
409                         pos = arg.pos)
410                 encoded_name = EncodedString(arg.name)
411                 keyword = ExprNodes.IdentifierStringNode(arg.pos, value = encoded_name)
412                 arg = p_test(s)
413                 keyword_args.append((keyword, arg))
414             else:
415                 if keyword_args:
416                     s.error("Non-keyword arg following keyword arg",
417                         pos = arg.pos)
418                 if star_arg:
419                     s.error("Non-keyword arg following star-arg",
420                         pos = arg.pos)
421                 positional_args.append(arg)
422         if s.sy != ',':
423             break
424         s.next()
425
426     if s.sy == 'for':
427         if len(positional_args) == 1 and not star_arg:
428             positional_args = [ p_genexp(s, positional_args[0]) ]
429     elif s.sy == '**':
430         s.next()
431         starstar_arg = p_test(s)
432         if s.sy == ',':
433             s.next()
434     s.expect(')')
435     return positional_args, keyword_args, star_arg, starstar_arg
436
437 def p_call_build_packed_args(pos, positional_args, keyword_args, star_arg):
438     arg_tuple = None
439     keyword_dict = None
440     if positional_args or not star_arg:
441         arg_tuple = ExprNodes.TupleNode(pos,
442             args = positional_args)
443     if star_arg:
444         star_arg_tuple = ExprNodes.AsTupleNode(pos, arg = star_arg)
445         if arg_tuple:
446             arg_tuple = ExprNodes.binop_node(pos,
447                 operator = '+', operand1 = arg_tuple,
448                 operand2 = star_arg_tuple)
449         else:
450             arg_tuple = star_arg_tuple
451     if keyword_args:
452         keyword_args = [ExprNodes.DictItemNode(pos=key.pos, key=key, value=value)
453                           for key, value in keyword_args]
454         keyword_dict = ExprNodes.DictNode(pos,
455             key_value_pairs = keyword_args)
456     return arg_tuple, keyword_dict
457
458 def p_call(s, function):
459     # s.sy == '('
460     pos = s.position()
461
462     positional_args, keyword_args, star_arg, starstar_arg = \
463                      p_call_parse_args(s)
464
465     if not (keyword_args or star_arg or starstar_arg):
466         return ExprNodes.SimpleCallNode(pos,
467             function = function,
468             args = positional_args)
469     else:
470         arg_tuple, keyword_dict = p_call_build_packed_args(
471             pos, positional_args, keyword_args, star_arg)
472         return ExprNodes.GeneralCallNode(pos,
473             function = function,
474             positional_args = arg_tuple,
475             keyword_args = keyword_dict,
476             starstar_arg = starstar_arg)
477
478 #lambdef: 'lambda' [varargslist] ':' test
479
480 #subscriptlist: subscript (',' subscript)* [',']
481
482 def p_index(s, base):
483     # s.sy == '['
484     pos = s.position()
485     s.next()
486     subscripts = p_subscript_list(s)
487     if len(subscripts) == 1 and len(subscripts[0]) == 2:
488         start, stop = subscripts[0]
489         result = ExprNodes.SliceIndexNode(pos,
490             base = base, start = start, stop = stop)
491     else:
492         indexes = make_slice_nodes(pos, subscripts)
493         if len(indexes) == 1:
494             index = indexes[0]
495         else:
496             index = ExprNodes.TupleNode(pos, args = indexes)
497         result = ExprNodes.IndexNode(pos,
498             base = base, index = index)
499     s.expect(']')
500     return result
501
502 def p_subscript_list(s):
503     items = [p_subscript(s)]
504     while s.sy == ',':
505         s.next()
506         if s.sy == ']':
507             break
508         items.append(p_subscript(s))
509     return items
510
511 #subscript: '.' '.' '.' | test | [test] ':' [test] [':' [test]]
512
513 def p_subscript(s):
514     # Parse a subscript and return a list of
515     # 1, 2 or 3 ExprNodes, depending on how
516     # many slice elements were encountered.
517     pos = s.position()
518     start = p_slice_element(s, (':',))
519     if s.sy != ':':
520         return [start]
521     s.next()
522     stop = p_slice_element(s, (':', ',', ']'))
523     if s.sy != ':':
524         return [start, stop]
525     s.next()
526     step = p_slice_element(s, (':', ',', ']'))
527     return [start, stop, step]
528
529 def p_slice_element(s, follow_set):
530     # Simple expression which may be missing iff
531     # it is followed by something in follow_set.
532     if s.sy not in follow_set:
533         return p_test(s)
534     else:
535         return None
536
537 def expect_ellipsis(s):
538     s.expect('.')
539     s.expect('.')
540     s.expect('.')
541
542 def make_slice_nodes(pos, subscripts):
543     # Convert a list of subscripts as returned
544     # by p_subscript_list into a list of ExprNodes,
545     # creating SliceNodes for elements with 2 or
546     # more components.
547     result = []
548     for subscript in subscripts:
549         if len(subscript) == 1:
550             result.append(subscript[0])
551         else:
552             result.append(make_slice_node(pos, *subscript))
553     return result
554
555 def make_slice_node(pos, start, stop = None, step = None):
556     if not start:
557         start = ExprNodes.NoneNode(pos)
558     if not stop:
559         stop = ExprNodes.NoneNode(pos)
560     if not step:
561         step = ExprNodes.NoneNode(pos)
562     return ExprNodes.SliceNode(pos,
563         start = start, stop = stop, step = step)
564
565 #atom: '(' [yield_expr|testlist_comp] ')' | '[' [listmaker] ']' | '{' [dict_or_set_maker] '}' | '`' testlist '`' | NAME | NUMBER | STRING+
566
567 def p_atom(s):
568     pos = s.position()
569     sy = s.sy
570     if sy == '(':
571         s.next()
572         if s.sy == ')':
573             result = ExprNodes.TupleNode(pos, args = [])
574         elif s.sy == 'yield':
575             result = p_yield_expression(s)
576         else:
577             result = p_testlist_comp(s)
578         s.expect(')')
579         return result
580     elif sy == '[':
581         return p_list_maker(s)
582     elif sy == '{':
583         return p_dict_or_set_maker(s)
584     elif sy == '`':
585         return p_backquote_expr(s)
586     elif sy == '.':
587         expect_ellipsis(s)
588         return ExprNodes.EllipsisNode(pos)
589     elif sy == 'INT':
590         return p_int_literal(s)
591     elif sy == 'FLOAT':
592         value = s.systring
593         s.next()
594         return ExprNodes.FloatNode(pos, value = value)
595     elif sy == 'IMAG':
596         value = s.systring[:-1]
597         s.next()
598         return ExprNodes.ImagNode(pos, value = value)
599     elif sy == 'BEGIN_STRING':
600         kind, bytes_value, unicode_value = p_cat_string_literal(s)
601         if kind == 'c':
602             return ExprNodes.CharNode(pos, value = bytes_value)
603         elif kind == 'u':
604             return ExprNodes.UnicodeNode(pos, value = unicode_value, bytes_value = bytes_value)
605         elif kind == 'b':
606             return ExprNodes.BytesNode(pos, value = bytes_value)
607         else:
608             return ExprNodes.StringNode(pos, value = bytes_value, unicode_value = unicode_value)
609     elif sy == 'IDENT':
610         name = EncodedString( s.systring )
611         s.next()
612         if name == "None":
613             return ExprNodes.NoneNode(pos)
614         elif name == "True":
615             return ExprNodes.BoolNode(pos, value=True)
616         elif name == "False":
617             return ExprNodes.BoolNode(pos, value=False)
618         elif name == "NULL" and not s.in_python_file:
619             return ExprNodes.NullNode(pos)
620         else:
621             return p_name(s, name)
622     else:
623         s.error("Expected an identifier or literal")
624
625 def p_int_literal(s):
626     pos = s.position()
627     value = s.systring
628     s.next()
629     unsigned = ""
630     longness = ""
631     while value[-1] in u"UuLl":
632         if value[-1] in u"Ll":
633             longness += "L"
634         else:
635             unsigned += "U"
636         value = value[:-1]
637     # '3L' is ambiguous in Py2 but not in Py3.  '3U' and '3LL' are
638     # illegal in Py2 Python files.  All suffixes are illegal in Py3
639     # Python files.
640     is_c_literal = None
641     if unsigned:
642         is_c_literal = True
643     elif longness:
644         if longness == 'LL' or s.context.language_level >= 3:
645             is_c_literal = True
646     if s.in_python_file:
647         if is_c_literal:
648             error(pos, "illegal integer literal syntax in Python source file")
649         is_c_literal = False
650     return ExprNodes.IntNode(pos,
651                              is_c_literal = is_c_literal,
652                              value = value,
653                              unsigned = unsigned,
654                              longness = longness)
655
656 def p_name(s, name):
657     pos = s.position()
658     if not s.compile_time_expr and name in s.compile_time_env:
659         value = s.compile_time_env.lookup_here(name)
660         rep = repr(value)
661         if isinstance(value, bool):
662             return ExprNodes.BoolNode(pos, value = value)
663         elif isinstance(value, int):
664             return ExprNodes.IntNode(pos, value = rep)
665         elif isinstance(value, long):
666             return ExprNodes.IntNode(pos, value = rep, longness = "L")
667         elif isinstance(value, float):
668             return ExprNodes.FloatNode(pos, value = rep)
669         elif isinstance(value, _unicode):
670             return ExprNodes.UnicodeNode(pos, value = value)
671         elif isinstance(value, _bytes):
672             return ExprNodes.BytesNode(pos, value = value)
673         else:
674             error(pos, "Invalid type for compile-time constant: %s"
675                 % value.__class__.__name__)
676     return ExprNodes.NameNode(pos, name = name)
677
678 def p_cat_string_literal(s):
679     # A sequence of one or more adjacent string literals.
680     # Returns (kind, bytes_value, unicode_value)
681     # where kind in ('b', 'c', 'u', '')
682     kind, bytes_value, unicode_value = p_string_literal(s)
683     if kind == 'c' or s.sy != 'BEGIN_STRING':
684         return kind, bytes_value, unicode_value
685     bstrings, ustrings = [bytes_value], [unicode_value]
686     bytes_value = unicode_value = None
687     while s.sy == 'BEGIN_STRING':
688         pos = s.position()
689         next_kind, next_bytes_value, next_unicode_value = p_string_literal(s)
690         if next_kind == 'c':
691             error(pos, "Cannot concatenate char literal with another string or char literal")
692         elif next_kind != kind:
693             error(pos, "Cannot mix string literals of different types, expected %s'', got %s''" %
694                   (kind, next_kind))
695         else:
696             bstrings.append(next_bytes_value)
697             ustrings.append(next_unicode_value)
698     # join and rewrap the partial literals
699     if kind in ('b', 'c', '') or kind == 'u' and None not in bstrings:
700         # Py3 enforced unicode literals are parsed as bytes/unicode combination
701         bytes_value = BytesLiteral( StringEncoding.join_bytes(bstrings) )
702         bytes_value.encoding = s.source_encoding
703     if kind in ('u', ''):
704         unicode_value = EncodedString( u''.join([ u for u in ustrings if u is not None ]) )
705     return kind, bytes_value, unicode_value
706
707 def p_opt_string_literal(s, required_type='u'):
708     if s.sy == 'BEGIN_STRING':
709         kind, bytes_value, unicode_value = p_string_literal(s, required_type)
710         if required_type == 'u':
711             return unicode_value
712         elif required_type == 'b':
713             return bytes_value
714         else:
715             s.error("internal parser configuration error")
716     else:
717         return None
718
719 def check_for_non_ascii_characters(string):
720     for c in string:
721         if c >= u'\x80':
722             return True
723     return False
724
725 def p_string_literal(s, kind_override=None):
726     # A single string or char literal.  Returns (kind, bvalue, uvalue)
727     # where kind in ('b', 'c', 'u', '').  The 'bvalue' is the source
728     # code byte sequence of the string literal, 'uvalue' is the
729     # decoded Unicode string.  Either of the two may be None depending
730     # on the 'kind' of string, only unprefixed strings have both
731     # representations.
732
733     # s.sy == 'BEGIN_STRING'
734     pos = s.position()
735     is_raw = 0
736     is_python3_source = s.context.language_level >= 3
737     has_non_ASCII_literal_characters = False
738     kind = s.systring[:1].lower()
739     if kind == 'r':
740         kind = ''
741         is_raw = 1
742     elif kind in 'ub':
743         is_raw = s.systring[1:2].lower() == 'r'
744     elif kind != 'c':
745         kind = ''
746     if kind == '' and kind_override is None and Future.unicode_literals in s.context.future_directives:
747         chars = StringEncoding.StrLiteralBuilder(s.source_encoding)
748         kind = 'u'
749     else:
750         if kind_override is not None and kind_override in 'ub':
751             kind = kind_override
752         if kind == 'u':
753             chars = StringEncoding.UnicodeLiteralBuilder()
754         elif kind == '':
755             chars = StringEncoding.StrLiteralBuilder(s.source_encoding)
756         else:
757             chars = StringEncoding.BytesLiteralBuilder(s.source_encoding)
758     while 1:
759         s.next()
760         sy = s.sy
761         systr = s.systring
762         #print "p_string_literal: sy =", sy, repr(s.systring) ###
763         if sy == 'CHARS':
764             chars.append(systr)
765             if is_python3_source and not has_non_ASCII_literal_characters and check_for_non_ascii_characters(systr):
766                 has_non_ASCII_literal_characters = True
767         elif sy == 'ESCAPE':
768             if is_raw:
769                 chars.append(systr)
770                 if is_python3_source and not has_non_ASCII_literal_characters \
771                        and check_for_non_ascii_characters(systr):
772                     has_non_ASCII_literal_characters = True
773             else:
774                 c = systr[1]
775                 if c in u"01234567":
776                     chars.append_charval( int(systr[1:], 8) )
777                 elif c in u"'\"\\":
778                     chars.append(c)
779                 elif c in u"abfnrtv":
780                     chars.append(
781                         StringEncoding.char_from_escape_sequence(systr))
782                 elif c == u'\n':
783                     pass
784                 elif c == u'x':
785                     if len(systr) == 4:
786                         chars.append_charval( int(systr[2:], 16) )
787                     else:
788                         s.error("Invalid hex escape '%s'" % systr)
789                 elif c in u'Uu':
790                     if kind in ('u', ''):
791                         if len(systr) in (6,10):
792                             chrval = int(systr[2:], 16)
793                             if chrval > 1114111: # sys.maxunicode:
794                                 s.error("Invalid unicode escape '%s'" % systr)
795                         else:
796                             s.error("Invalid unicode escape '%s'" % systr)
797                     else:
798                         # unicode escapes in byte strings are not unescaped
799                         chrval = None
800                     chars.append_uescape(chrval, systr)
801                 else:
802                     chars.append(u'\\' + systr[1:])
803                     if is_python3_source and not has_non_ASCII_literal_characters \
804                            and check_for_non_ascii_characters(systr):
805                         has_non_ASCII_literal_characters = True
806         elif sy == 'NEWLINE':
807             chars.append(u'\n')
808         elif sy == 'END_STRING':
809             break
810         elif sy == 'EOF':
811             s.error("Unclosed string literal", pos = pos)
812         else:
813             s.error(
814                 "Unexpected token %r:%r in string literal" %
815                     (sy, s.systring))
816     if kind == 'c':
817         unicode_value = None
818         bytes_value = chars.getchar()
819         if len(bytes_value) != 1:
820             error(pos, u"invalid character literal: %r" % bytes_value)
821     else:
822         bytes_value, unicode_value = chars.getstrings()
823         if is_python3_source and has_non_ASCII_literal_characters:
824             # Python 3 forbids literal non-ASCII characters in byte strings
825             if kind != 'u':
826                 s.error("bytes can only contain ASCII literal characters.", pos = pos)
827             bytes_value = None
828     s.next()
829     return (kind, bytes_value, unicode_value)
830
831 # list_display      ::=      "[" [listmaker] "]"
832 # listmaker     ::=     expression ( comp_for | ( "," expression )* [","] )
833 # comp_iter     ::=     comp_for | comp_if
834 # comp_for     ::=     "for" expression_list "in" testlist [comp_iter]
835 # comp_if     ::=     "if" test [comp_iter]
836
837 def p_list_maker(s):
838     # s.sy == '['
839     pos = s.position()
840     s.next()
841     if s.sy == ']':
842         s.expect(']')
843         return ExprNodes.ListNode(pos, args = [])
844     expr = p_test(s)
845     if s.sy == 'for':
846         target = ExprNodes.ListNode(pos, args = [])
847         append = ExprNodes.ComprehensionAppendNode(
848             pos, expr=expr, target=ExprNodes.CloneNode(target))
849         loop = p_comp_for(s, append)
850         s.expect(']')
851         return ExprNodes.ComprehensionNode(
852             pos, loop=loop, append=append, target=target,
853             # list comprehensions leak their loop variable in Py2
854             has_local_scope = s.context.language_level >= 3)
855     else:
856         if s.sy == ',':
857             s.next()
858             exprs = p_simple_expr_list(s, expr)
859         else:
860             exprs = [expr]
861         s.expect(']')
862         return ExprNodes.ListNode(pos, args = exprs)
863
864 def p_comp_iter(s, body):
865     if s.sy == 'for':
866         return p_comp_for(s, body)
867     elif s.sy == 'if':
868         return p_comp_if(s, body)
869     else:
870         # insert the 'append' operation into the loop
871         return body
872
873 def p_comp_for(s, body):
874     # s.sy == 'for'
875     pos = s.position()
876     s.next()
877     kw = p_for_bounds(s, allow_testlist=False)
878     kw.update(dict(else_clause = None, body = p_comp_iter(s, body)))
879     return Nodes.ForStatNode(pos, **kw)
880
881 def p_comp_if(s, body):
882     # s.sy == 'if'
883     pos = s.position()
884     s.next()
885     test = p_test_nocond(s)
886     return Nodes.IfStatNode(pos,
887         if_clauses = [Nodes.IfClauseNode(pos, condition = test,
888                                          body = p_comp_iter(s, body))],
889         else_clause = None )
890
891 #dictmaker: test ':' test (',' test ':' test)* [',']
892
893 def p_dict_or_set_maker(s):
894     # s.sy == '{'
895     pos = s.position()
896     s.next()
897     if s.sy == '}':
898         s.next()
899         return ExprNodes.DictNode(pos, key_value_pairs = [])
900     item = p_test(s)
901     if s.sy == ',' or s.sy == '}':
902         # set literal
903         values = [item]
904         while s.sy == ',':
905             s.next()
906             if s.sy == '}':
907                 break
908             values.append( p_test(s) )
909         s.expect('}')
910         return ExprNodes.SetNode(pos, args=values)
911     elif s.sy == 'for':
912         # set comprehension
913         target = ExprNodes.SetNode(pos, args=[])
914         append = ExprNodes.ComprehensionAppendNode(
915             item.pos, expr=item, target=ExprNodes.CloneNode(target))
916         loop = p_comp_for(s, append)
917         s.expect('}')
918         return ExprNodes.ComprehensionNode(
919             pos, loop=loop, append=append, target=target)
920     elif s.sy == ':':
921         # dict literal or comprehension
922         key = item
923         s.next()
924         value = p_test(s)
925         if s.sy == 'for':
926             # dict comprehension
927             target = ExprNodes.DictNode(pos, key_value_pairs = [])
928             append = ExprNodes.DictComprehensionAppendNode(
929                 item.pos, key_expr=key, value_expr=value,
930                 target=ExprNodes.CloneNode(target))
931             loop = p_comp_for(s, append)
932             s.expect('}')
933             return ExprNodes.ComprehensionNode(
934                 pos, loop=loop, append=append, target=target)
935         else:
936             # dict literal
937             items = [ExprNodes.DictItemNode(key.pos, key=key, value=value)]
938             while s.sy == ',':
939                 s.next()
940                 if s.sy == '}':
941                     break
942                 key = p_test(s)
943                 s.expect(':')
944                 value = p_test(s)
945                 items.append(
946                     ExprNodes.DictItemNode(key.pos, key=key, value=value))
947             s.expect('}')
948             return ExprNodes.DictNode(pos, key_value_pairs=items)
949     else:
950         # raise an error
951         s.expect('}')
952     return ExprNodes.DictNode(pos, key_value_pairs = [])
953
954 # NOTE: no longer in Py3 :)
955 def p_backquote_expr(s):
956     # s.sy == '`'
957     pos = s.position()
958     s.next()
959     args = [p_test(s)]
960     while s.sy == ',':
961         s.next()
962         args.append(p_test(s))
963     s.expect('`')
964     if len(args) == 1:
965         arg = args[0]
966     else:
967         arg = ExprNodes.TupleNode(pos, args = args)
968     return ExprNodes.BackquoteNode(pos, arg = arg)
969
970 def p_simple_expr_list(s, expr=None):
971     exprs = expr is not None and [expr] or []
972     while s.sy not in expr_terminators:
973         exprs.append( p_test(s) )
974         if s.sy != ',':
975             break
976         s.next()
977     return exprs
978
979 def p_test_or_starred_expr_list(s, expr=None):
980     exprs = expr is not None and [expr] or []
981     while s.sy not in expr_terminators:
982         exprs.append( p_test_or_starred_expr(s) )
983         if s.sy != ',':
984             break
985         s.next()
986     return exprs
987
988
989 #testlist: test (',' test)* [',']
990
991 def p_testlist(s):
992     pos = s.position()
993     expr = p_test(s)
994     if s.sy == ',':
995         s.next()
996         exprs = p_simple_expr_list(s, expr)
997         return ExprNodes.TupleNode(pos, args = exprs)
998     else:
999         return expr
1000
1001 # testlist_star_expr: (test|star_expr) ( comp_for | (',' (test|star_expr))* [','] )
1002
1003 def p_testlist_star_expr(s):
1004     pos = s.position()
1005     expr = p_test_or_starred_expr(s)
1006     if s.sy == ',':
1007         s.next()
1008         exprs = p_test_or_starred_expr_list(s, expr)
1009         return ExprNodes.TupleNode(pos, args = exprs)
1010     else:
1011         return expr
1012
1013 # testlist_comp: (test|star_expr) ( comp_for | (',' (test|star_expr))* [','] )
1014
1015 def p_testlist_comp(s):
1016     pos = s.position()
1017     expr = p_test_or_starred_expr(s)
1018     if s.sy == ',':
1019         s.next()
1020         exprs = p_test_or_starred_expr_list(s, expr)
1021         return ExprNodes.TupleNode(pos, args = exprs)
1022     elif s.sy == 'for':
1023         return p_genexp(s, expr)
1024     else:
1025         return expr
1026
1027 def p_genexp(s, expr):
1028     # s.sy == 'for'
1029     loop = p_comp_for(s, Nodes.ExprStatNode(
1030         expr.pos, expr = ExprNodes.YieldExprNode(expr.pos, arg=expr)))
1031     return ExprNodes.GeneratorExpressionNode(expr.pos, loop=loop)
1032
1033 expr_terminators = (')', ']', '}', ':', '=', 'NEWLINE')
1034
1035 #-------------------------------------------------------
1036 #
1037 #   Statements
1038 #
1039 #-------------------------------------------------------
1040
1041 def p_global_statement(s):
1042     # assume s.sy == 'global'
1043     pos = s.position()
1044     s.next()
1045     names = p_ident_list(s)
1046     return Nodes.GlobalNode(pos, names = names)
1047
1048 def p_nonlocal_statement(s):
1049     pos = s.position()
1050     s.next()
1051     names = p_ident_list(s)
1052     return Nodes.NonlocalNode(pos, names = names)
1053
1054 def p_expression_or_assignment(s):
1055     expr_list = [p_testlist_star_expr(s)]
1056     while s.sy == '=':
1057         s.next()
1058         if s.sy == 'yield':
1059             expr = p_yield_expression(s)
1060         else:
1061             expr = p_testlist_star_expr(s)
1062         expr_list.append(expr)
1063     if len(expr_list) == 1:
1064         if re.match(r"([+*/\%^\&|-]|<<|>>|\*\*|//)=", s.sy):
1065             lhs = expr_list[0]
1066             if not isinstance(lhs, (ExprNodes.AttributeNode, ExprNodes.IndexNode, ExprNodes.NameNode) ):
1067                 error(lhs.pos, "Illegal operand for inplace operation.")
1068             operator = s.sy[:-1]
1069             s.next()
1070             if s.sy == 'yield':
1071                 rhs = p_yield_expression(s)
1072             else:
1073                 rhs = p_testlist(s)
1074             return Nodes.InPlaceAssignmentNode(lhs.pos, operator = operator, lhs = lhs, rhs = rhs)
1075         expr = expr_list[0]
1076         if isinstance(expr, (ExprNodes.UnicodeNode, ExprNodes.StringNode, ExprNodes.BytesNode)):
1077             return Nodes.PassStatNode(expr.pos)
1078         else:
1079             return Nodes.ExprStatNode(expr.pos, expr = expr)
1080
1081     rhs = expr_list[-1]
1082     if len(expr_list) == 2:
1083         return Nodes.SingleAssignmentNode(rhs.pos,
1084             lhs = expr_list[0], rhs = rhs)
1085     else:
1086         return Nodes.CascadedAssignmentNode(rhs.pos,
1087             lhs_list = expr_list[:-1], rhs = rhs)
1088
1089 def p_print_statement(s):
1090     # s.sy == 'print'
1091     pos = s.position()
1092     ends_with_comma = 0
1093     s.next()
1094     if s.sy == '>>':
1095         s.next()
1096         stream = p_test(s)
1097         if s.sy == ',':
1098             s.next()
1099             ends_with_comma = s.sy in ('NEWLINE', 'EOF')
1100     else:
1101         stream = None
1102     args = []
1103     if s.sy not in ('NEWLINE', 'EOF'):
1104         args.append(p_test(s))
1105         while s.sy == ',':
1106             s.next()
1107             if s.sy in ('NEWLINE', 'EOF'):
1108                 ends_with_comma = 1
1109                 break
1110             args.append(p_test(s))
1111     arg_tuple = ExprNodes.TupleNode(pos, args = args)
1112     return Nodes.PrintStatNode(pos,
1113         arg_tuple = arg_tuple, stream = stream,
1114         append_newline = not ends_with_comma)
1115
1116 def p_exec_statement(s):
1117     # s.sy == 'exec'
1118     pos = s.position()
1119     s.next()
1120     args = [ p_bit_expr(s) ]
1121     if s.sy == 'in':
1122         s.next()
1123         args.append(p_test(s))
1124         if s.sy == ',':
1125             s.next()
1126             args.append(p_test(s))
1127     else:
1128         error(pos, "'exec' currently requires a target mapping (globals/locals)")
1129     return Nodes.ExecStatNode(pos, args = args)
1130
1131 def p_del_statement(s):
1132     # s.sy == 'del'
1133     pos = s.position()
1134     s.next()
1135     # FIXME: 'exprlist' in Python
1136     args = p_simple_expr_list(s)
1137     return Nodes.DelStatNode(pos, args = args)
1138
1139 def p_pass_statement(s, with_newline = 0):
1140     pos = s.position()
1141     s.expect('pass')
1142     if with_newline:
1143         s.expect_newline("Expected a newline")
1144     return Nodes.PassStatNode(pos)
1145
1146 def p_break_statement(s):
1147     # s.sy == 'break'
1148     pos = s.position()
1149     s.next()
1150     return Nodes.BreakStatNode(pos)
1151
1152 def p_continue_statement(s):
1153     # s.sy == 'continue'
1154     pos = s.position()
1155     s.next()
1156     return Nodes.ContinueStatNode(pos)
1157
1158 def p_return_statement(s):
1159     # s.sy == 'return'
1160     pos = s.position()
1161     s.next()
1162     if s.sy not in statement_terminators:
1163         value = p_testlist(s)
1164     else:
1165         value = None
1166     return Nodes.ReturnStatNode(pos, value = value)
1167
1168 def p_raise_statement(s):
1169     # s.sy == 'raise'
1170     pos = s.position()
1171     s.next()
1172     exc_type = None
1173     exc_value = None
1174     exc_tb = None
1175     if s.sy not in statement_terminators:
1176         exc_type = p_test(s)
1177         if s.sy == ',':
1178             s.next()
1179             exc_value = p_test(s)
1180             if s.sy == ',':
1181                 s.next()
1182                 exc_tb = p_test(s)
1183     if exc_type or exc_value or exc_tb:
1184         return Nodes.RaiseStatNode(pos,
1185             exc_type = exc_type,
1186             exc_value = exc_value,
1187             exc_tb = exc_tb)
1188     else:
1189         return Nodes.ReraiseStatNode(pos)
1190
1191 def p_import_statement(s):
1192     # s.sy in ('import', 'cimport')
1193     pos = s.position()
1194     kind = s.sy
1195     s.next()
1196     items = [p_dotted_name(s, as_allowed = 1)]
1197     while s.sy == ',':
1198         s.next()
1199         items.append(p_dotted_name(s, as_allowed = 1))
1200     stats = []
1201     for pos, target_name, dotted_name, as_name in items:
1202         dotted_name = EncodedString(dotted_name)
1203         if kind == 'cimport':
1204             stat = Nodes.CImportStatNode(pos,
1205                 module_name = dotted_name,
1206                 as_name = as_name)
1207         else:
1208             if as_name and "." in dotted_name:
1209                 name_list = ExprNodes.ListNode(pos, args = [
1210                         ExprNodes.IdentifierStringNode(pos, value = EncodedString("*"))])
1211             else:
1212                 name_list = None
1213             stat = Nodes.SingleAssignmentNode(pos,
1214                 lhs = ExprNodes.NameNode(pos,
1215                     name = as_name or target_name),
1216                 rhs = ExprNodes.ImportNode(pos,
1217                     module_name = ExprNodes.IdentifierStringNode(
1218                         pos, value = dotted_name),
1219                     level = None,
1220                     name_list = name_list))
1221         stats.append(stat)
1222     return Nodes.StatListNode(pos, stats = stats)
1223
1224 def p_from_import_statement(s, first_statement = 0):
1225     # s.sy == 'from'
1226     pos = s.position()
1227     s.next()
1228     if s.sy == '.':
1229         # count relative import level
1230         level = 0
1231         while s.sy == '.':
1232             level += 1
1233             s.next()
1234         if s.sy == 'cimport':
1235             s.error("Relative cimport is not supported yet")
1236     else:
1237         level = None
1238     if level is not None and s.sy == 'import':
1239         # we are dealing with "from .. import foo, bar"
1240         dotted_name_pos, dotted_name = s.position(), ''
1241     elif level is not None and s.sy == 'cimport':
1242         # "from .. cimport"
1243         s.error("Relative cimport is not supported yet")
1244     else:
1245         (dotted_name_pos, _, dotted_name, _) = \
1246             p_dotted_name(s, as_allowed = 0)
1247     if s.sy in ('import', 'cimport'):
1248         kind = s.sy
1249         s.next()
1250     else:
1251         s.error("Expected 'import' or 'cimport'")
1252
1253     is_cimport = kind == 'cimport'
1254     is_parenthesized = False
1255     if s.sy == '*':
1256         imported_names = [(s.position(), "*", None, None)]
1257         s.next()
1258     else:
1259         if s.sy == '(':
1260             is_parenthesized = True
1261             s.next()
1262         imported_names = [p_imported_name(s, is_cimport)]
1263     while s.sy == ',':
1264         s.next()
1265         if is_parenthesized and s.sy == ')':
1266             break
1267         imported_names.append(p_imported_name(s, is_cimport))
1268     if is_parenthesized:
1269         s.expect(')')
1270     dotted_name = EncodedString(dotted_name)
1271     if dotted_name == '__future__':
1272         if not first_statement:
1273             s.error("from __future__ imports must occur at the beginning of the file")
1274         elif level is not None:
1275             s.error("invalid syntax")
1276         else:
1277             for (name_pos, name, as_name, kind) in imported_names:
1278                 if name == "braces":
1279                     s.error("not a chance", name_pos)
1280                     break
1281                 try:
1282                     directive = getattr(Future, name)
1283                 except AttributeError:
1284                     s.error("future feature %s is not defined" % name, name_pos)
1285                     break
1286                 s.context.future_directives.add(directive)
1287         return Nodes.PassStatNode(pos)
1288     elif kind == 'cimport':
1289         return Nodes.FromCImportStatNode(pos,
1290             module_name = dotted_name,
1291             imported_names = imported_names)
1292     else:
1293         imported_name_strings = []
1294         items = []
1295         for (name_pos, name, as_name, kind) in imported_names:
1296             encoded_name = EncodedString(name)
1297             imported_name_strings.append(
1298                 ExprNodes.IdentifierStringNode(name_pos, value = encoded_name))
1299             items.append(
1300                 (name,
1301                  ExprNodes.NameNode(name_pos,
1302                                     name = as_name or name)))
1303         import_list = ExprNodes.ListNode(
1304             imported_names[0][0], args = imported_name_strings)
1305         dotted_name = EncodedString(dotted_name)
1306         return Nodes.FromImportStatNode(pos,
1307             module = ExprNodes.ImportNode(dotted_name_pos,
1308                 module_name = ExprNodes.IdentifierStringNode(pos, value = dotted_name),
1309                 level = level,
1310                 name_list = import_list),
1311             items = items)
1312
1313 imported_name_kinds = ('class', 'struct', 'union')
1314
1315 def p_imported_name(s, is_cimport):
1316     pos = s.position()
1317     kind = None
1318     if is_cimport and s.systring in imported_name_kinds:
1319         kind = s.systring
1320         s.next()
1321     name = p_ident(s)
1322     as_name = p_as_name(s)
1323     return (pos, name, as_name, kind)
1324
1325 def p_dotted_name(s, as_allowed):
1326     pos = s.position()
1327     target_name = p_ident(s)
1328     as_name = None
1329     names = [target_name]
1330     while s.sy == '.':
1331         s.next()
1332         names.append(p_ident(s))
1333     if as_allowed:
1334         as_name = p_as_name(s)
1335     return (pos, target_name, u'.'.join(names), as_name)
1336
1337 def p_as_name(s):
1338     if s.sy == 'IDENT' and s.systring == 'as':
1339         s.next()
1340         return p_ident(s)
1341     else:
1342         return None
1343
1344 def p_assert_statement(s):
1345     # s.sy == 'assert'
1346     pos = s.position()
1347     s.next()
1348     cond = p_test(s)
1349     if s.sy == ',':
1350         s.next()
1351         value = p_test(s)
1352     else:
1353         value = None
1354     return Nodes.AssertStatNode(pos, cond = cond, value = value)
1355
1356 statement_terminators = (';', 'NEWLINE', 'EOF')
1357
1358 def p_if_statement(s):
1359     # s.sy == 'if'
1360     pos = s.position()
1361     s.next()
1362     if_clauses = [p_if_clause(s)]
1363     while s.sy == 'elif':
1364         s.next()
1365         if_clauses.append(p_if_clause(s))
1366     else_clause = p_else_clause(s)
1367     return Nodes.IfStatNode(pos,
1368         if_clauses = if_clauses, else_clause = else_clause)
1369
1370 def p_if_clause(s):
1371     pos = s.position()
1372     test = p_test(s)
1373     body = p_suite(s)
1374     return Nodes.IfClauseNode(pos,
1375         condition = test, body = body)
1376
1377 def p_else_clause(s):
1378     if s.sy == 'else':
1379         s.next()
1380         return p_suite(s)
1381     else:
1382         return None
1383
1384 def p_while_statement(s):
1385     # s.sy == 'while'
1386     pos = s.position()
1387     s.next()
1388     test = p_test(s)
1389     body = p_suite(s)
1390     else_clause = p_else_clause(s)
1391     return Nodes.WhileStatNode(pos,
1392         condition = test, body = body,
1393         else_clause = else_clause)
1394
1395 def p_for_statement(s):
1396     # s.sy == 'for'
1397     pos = s.position()
1398     s.next()
1399     kw = p_for_bounds(s, allow_testlist=True)
1400     body = p_suite(s)
1401     else_clause = p_else_clause(s)
1402     kw.update(dict(body = body, else_clause = else_clause))
1403     return Nodes.ForStatNode(pos, **kw)
1404
1405 def p_for_bounds(s, allow_testlist=True):
1406     target = p_for_target(s)
1407     if s.sy == 'in':
1408         s.next()
1409         iterator = p_for_iterator(s, allow_testlist)
1410         return dict( target = target, iterator = iterator )
1411     elif not s.in_python_file:
1412         if s.sy == 'from':
1413             s.next()
1414             bound1 = p_bit_expr(s)
1415         else:
1416             # Support shorter "for a <= x < b" syntax
1417             bound1, target = target, None
1418         rel1 = p_for_from_relation(s)
1419         name2_pos = s.position()
1420         name2 = p_ident(s)
1421         rel2_pos = s.position()
1422         rel2 = p_for_from_relation(s)
1423         bound2 = p_bit_expr(s)
1424         step = p_for_from_step(s)
1425         if target is None:
1426             target = ExprNodes.NameNode(name2_pos, name = name2)
1427         else:
1428             if not target.is_name:
1429                 error(target.pos,
1430                     "Target of for-from statement must be a variable name")
1431             elif name2 != target.name:
1432                 error(name2_pos,
1433                     "Variable name in for-from range does not match target")
1434         if rel1[0] != rel2[0]:
1435             error(rel2_pos,
1436                 "Relation directions in for-from do not match")
1437         return dict(target = target,
1438                     bound1 = bound1,
1439                     relation1 = rel1,
1440                     relation2 = rel2,
1441                     bound2 = bound2,
1442                     step = step,
1443                     )
1444     else:
1445         s.expect('in')
1446         return {}
1447
1448 def p_for_from_relation(s):
1449     if s.sy in inequality_relations:
1450         op = s.sy
1451         s.next()
1452         return op
1453     else:
1454         s.error("Expected one of '<', '<=', '>' '>='")
1455
1456 def p_for_from_step(s):
1457     if s.sy == 'IDENT' and s.systring == 'by':
1458         s.next()
1459         step = p_bit_expr(s)
1460         return step
1461     else:
1462         return None
1463
1464 inequality_relations = ('<', '<=', '>', '>=')
1465
1466 def p_target(s, terminator):
1467     pos = s.position()
1468     expr = p_starred_expr(s)
1469     if s.sy == ',':
1470         s.next()
1471         exprs = [expr]
1472         while s.sy != terminator:
1473             exprs.append(p_starred_expr(s))
1474             if s.sy != ',':
1475                 break
1476             s.next()
1477         return ExprNodes.TupleNode(pos, args = exprs)
1478     else:
1479         return expr
1480
1481 def p_for_target(s):
1482     return p_target(s, 'in')
1483
1484 def p_for_iterator(s, allow_testlist=True):
1485     pos = s.position()
1486     if allow_testlist:
1487         expr = p_testlist(s)
1488     else:
1489         expr = p_or_test(s)
1490     return ExprNodes.IteratorNode(pos, sequence = expr)
1491
1492 def p_try_statement(s):
1493     # s.sy == 'try'
1494     pos = s.position()
1495     s.next()
1496     body = p_suite(s)
1497     except_clauses = []
1498     else_clause = None
1499     if s.sy in ('except', 'else'):
1500         while s.sy == 'except':
1501             except_clauses.append(p_except_clause(s))
1502         if s.sy == 'else':
1503             s.next()
1504             else_clause = p_suite(s)
1505         body = Nodes.TryExceptStatNode(pos,
1506             body = body, except_clauses = except_clauses,
1507             else_clause = else_clause)
1508         if s.sy != 'finally':
1509             return body
1510         # try-except-finally is equivalent to nested try-except/try-finally
1511     if s.sy == 'finally':
1512         s.next()
1513         finally_clause = p_suite(s)
1514         return Nodes.TryFinallyStatNode(pos,
1515             body = body, finally_clause = finally_clause)
1516     else:
1517         s.error("Expected 'except' or 'finally'")
1518
1519 def p_except_clause(s):
1520     # s.sy == 'except'
1521     pos = s.position()
1522     s.next()
1523     exc_type = None
1524     exc_value = None
1525     if s.sy != ':':
1526         exc_type = p_test(s)
1527         # normalise into list of single exception tests
1528         if isinstance(exc_type, ExprNodes.TupleNode):
1529             exc_type = exc_type.args
1530         else:
1531             exc_type = [exc_type]
1532         if s.sy == ',' or (s.sy == 'IDENT' and s.systring == 'as'):
1533             s.next()
1534             exc_value = p_test(s)
1535         elif s.sy == 'IDENT' and s.systring == 'as':
1536             # Py3 syntax requires a name here
1537             s.next()
1538             pos2 = s.position()
1539             name = p_ident(s)
1540             exc_value = ExprNodes.NameNode(pos2, name = name)
1541     body = p_suite(s)
1542     return Nodes.ExceptClauseNode(pos,
1543         pattern = exc_type, target = exc_value, body = body)
1544
1545 def p_include_statement(s, ctx):
1546     pos = s.position()
1547     s.next() # 'include'
1548     unicode_include_file_name = p_string_literal(s, 'u')[2]
1549     s.expect_newline("Syntax error in include statement")
1550     if s.compile_time_eval:
1551         include_file_name = unicode_include_file_name
1552         include_file_path = s.context.find_include_file(include_file_name, pos)
1553         if include_file_path:
1554             s.included_files.append(include_file_name)
1555             f = Utils.open_source_file(include_file_path, mode="rU")
1556             source_desc = FileSourceDescriptor(include_file_path)
1557             s2 = PyrexScanner(f, source_desc, s, source_encoding=f.encoding, parse_comments=s.parse_comments)
1558             try:
1559                 tree = p_statement_list(s2, ctx)
1560             finally:
1561                 f.close()
1562             return tree
1563         else:
1564             return None
1565     else:
1566         return Nodes.PassStatNode(pos)
1567
1568 def p_with_statement(s):
1569     s.next() # 'with'
1570     if s.systring == 'template' and not s.in_python_file:
1571         node = p_with_template(s)
1572     else:
1573         node = p_with_items(s)
1574     return node
1575
1576 def p_with_items(s):
1577     pos = s.position()
1578     if not s.in_python_file and s.sy == 'IDENT' and s.systring == 'nogil':
1579         state = s.systring
1580         s.next()
1581         if s.sy == ',':
1582             s.next()
1583             body = p_with_items(s)
1584         else:
1585             body = p_suite(s)
1586         return Nodes.GILStatNode(pos, state = state, body = body)
1587     else:
1588         manager = p_test(s)
1589         target = None
1590         if s.sy == 'IDENT' and s.systring == 'as':
1591             s.next()
1592             target = p_starred_expr(s)
1593         if s.sy == ',':
1594             s.next()
1595             body = p_with_items(s)
1596         else:
1597             body = p_suite(s)
1598     return Nodes.WithStatNode(pos, manager = manager,
1599                               target = target, body = body)
1600
1601 def p_with_template(s):
1602     pos = s.position()
1603     templates = []
1604     s.next()
1605     s.expect('[')
1606     templates.append(s.systring)
1607     s.next()
1608     while s.systring == ',':
1609         s.next()
1610         templates.append(s.systring)
1611         s.next()
1612     s.expect(']')
1613     if s.sy == ':':
1614         s.next()
1615         s.expect_newline("Syntax error in template function declaration")
1616         s.expect_indent()
1617         body_ctx = Ctx()
1618         body_ctx.templates = templates
1619         func_or_var = p_c_func_or_var_declaration(s, pos, body_ctx)
1620         s.expect_dedent()
1621         return func_or_var
1622     else:
1623         error(pos, "Syntax error in template function declaration")
1624
1625 def p_simple_statement(s, first_statement = 0):
1626     #print "p_simple_statement:", s.sy, s.systring ###
1627     if s.sy == 'global':
1628         node = p_global_statement(s)
1629     elif s.sy == 'nonlocal':
1630         node = p_nonlocal_statement(s)
1631     elif s.sy == 'print':
1632         node = p_print_statement(s)
1633     elif s.sy == 'exec':
1634         node = p_exec_statement(s)
1635     elif s.sy == 'del':
1636         node = p_del_statement(s)
1637     elif s.sy == 'break':
1638         node = p_break_statement(s)
1639     elif s.sy == 'continue':
1640         node = p_continue_statement(s)
1641     elif s.sy == 'return':
1642         node = p_return_statement(s)
1643     elif s.sy == 'raise':
1644         node = p_raise_statement(s)
1645     elif s.sy in ('import', 'cimport'):
1646         node = p_import_statement(s)
1647     elif s.sy == 'from':
1648         node = p_from_import_statement(s, first_statement = first_statement)
1649     elif s.sy == 'yield':
1650         node = p_yield_statement(s)
1651     elif s.sy == 'assert':
1652         node = p_assert_statement(s)
1653     elif s.sy == 'pass':
1654         node = p_pass_statement(s)
1655     else:
1656         node = p_expression_or_assignment(s)
1657     return node
1658
1659 def p_simple_statement_list(s, ctx, first_statement = 0):
1660     # Parse a series of simple statements on one line
1661     # separated by semicolons.
1662     stat = p_simple_statement(s, first_statement = first_statement)
1663     pos = stat.pos
1664     stats = []
1665     if not isinstance(stat, Nodes.PassStatNode):
1666         stats.append(stat)
1667     while s.sy == ';':
1668         #print "p_simple_statement_list: maybe more to follow" ###
1669         s.next()
1670         if s.sy in ('NEWLINE', 'EOF'):
1671             break
1672         stat = p_simple_statement(s, first_statement = first_statement)
1673         if isinstance(stat, Nodes.PassStatNode):
1674             continue
1675         stats.append(stat)
1676         first_statement = False
1677
1678     if not stats:
1679         stat = Nodes.PassStatNode(pos)
1680     elif len(stats) == 1:
1681         stat = stats[0]
1682     else:
1683         stat = Nodes.StatListNode(pos, stats = stats)
1684     s.expect_newline("Syntax error in simple statement list")
1685     return stat
1686
1687 def p_compile_time_expr(s):
1688     old = s.compile_time_expr
1689     s.compile_time_expr = 1
1690     expr = p_testlist(s)
1691     s.compile_time_expr = old
1692     return expr
1693
1694 def p_DEF_statement(s):
1695     pos = s.position()
1696     denv = s.compile_time_env
1697     s.next() # 'DEF'
1698     name = p_ident(s)
1699     s.expect('=')
1700     expr = p_compile_time_expr(s)
1701     value = expr.compile_time_value(denv)
1702     #print "p_DEF_statement: %s = %r" % (name, value) ###
1703     denv.declare(name, value)
1704     s.expect_newline()
1705     return Nodes.PassStatNode(pos)
1706
1707 def p_IF_statement(s, ctx):
1708     pos = s.position()
1709     saved_eval = s.compile_time_eval
1710     current_eval = saved_eval
1711     denv = s.compile_time_env
1712     result = None
1713     while 1:
1714         s.next() # 'IF' or 'ELIF'
1715         expr = p_compile_time_expr(s)
1716         s.compile_time_eval = current_eval and bool(expr.compile_time_value(denv))
1717         body = p_suite(s, ctx)
1718         if s.compile_time_eval:
1719             result = body
1720             current_eval = 0
1721         if s.sy != 'ELIF':
1722             break
1723     if s.sy == 'ELSE':
1724         s.next()
1725         s.compile_time_eval = current_eval
1726         body = p_suite(s, ctx)
1727         if current_eval:
1728             result = body
1729     if not result:
1730         result = Nodes.PassStatNode(pos)
1731     s.compile_time_eval = saved_eval
1732     return result
1733
1734 def p_statement(s, ctx, first_statement = 0):
1735     cdef_flag = ctx.cdef_flag
1736     decorators = None
1737     if s.sy == 'ctypedef':
1738         if ctx.level not in ('module', 'module_pxd'):
1739             s.error("ctypedef statement not allowed here")
1740         #if ctx.api:
1741         #    error(s.position(), "'api' not allowed with 'ctypedef'")
1742         return p_ctypedef_statement(s, ctx)
1743     elif s.sy == 'DEF':
1744         return p_DEF_statement(s)
1745     elif s.sy == 'IF':
1746         return p_IF_statement(s, ctx)
1747     elif s.sy == 'DECORATOR':
1748         if ctx.level not in ('module', 'class', 'c_class', 'function', 'property', 'module_pxd', 'c_class_pxd'):
1749             s.error('decorator not allowed here')
1750         s.level = ctx.level
1751         decorators = p_decorators(s)
1752         if s.sy not in ('def', 'cdef', 'cpdef', 'class'):
1753             s.error("Decorators can only be followed by functions or classes")
1754     elif s.sy == 'pass' and cdef_flag:
1755         # empty cdef block
1756         return p_pass_statement(s, with_newline = 1)
1757
1758     overridable = 0
1759     if s.sy == 'cdef':
1760         cdef_flag = 1
1761         s.next()
1762     elif s.sy == 'cpdef':
1763         cdef_flag = 1
1764         overridable = 1
1765         s.next()
1766     if cdef_flag:
1767         if ctx.level not in ('module', 'module_pxd', 'function', 'c_class', 'c_class_pxd'):
1768             s.error('cdef statement not allowed here')
1769         s.level = ctx.level
1770         node = p_cdef_statement(s, ctx(overridable = overridable))
1771         if decorators is not None:
1772             if not isinstance(node, (Nodes.CFuncDefNode, Nodes.CVarDefNode, Nodes.CClassDefNode)):
1773                 s.error("Decorators can only be followed by functions or classes")
1774             node.decorators = decorators
1775         return node
1776     else:
1777         if ctx.api:
1778             s.error("'api' not allowed with this statement")
1779         elif s.sy == 'def':
1780             # def statements aren't allowed in pxd files, except
1781             # as part of a cdef class
1782             if ('pxd' in ctx.level) and (ctx.level != 'c_class_pxd'):
1783                 s.error('def statement not allowed here')
1784             s.level = ctx.level
1785             return p_def_statement(s, decorators)
1786         elif s.sy == 'class':
1787             if ctx.level not in ('module', 'function', 'class', 'other'):
1788                 s.error("class definition not allowed here")
1789             return p_class_statement(s, decorators)
1790         elif s.sy == 'include':
1791             if ctx.level not in ('module', 'module_pxd'):
1792                 s.error("include statement not allowed here")
1793             return p_include_statement(s, ctx)
1794         elif ctx.level == 'c_class' and s.sy == 'IDENT' and s.systring == 'property':
1795             return p_property_decl(s)
1796         elif s.sy == 'pass' and ctx.level != 'property':
1797             return p_pass_statement(s, with_newline = 1)
1798         else:
1799             if ctx.level in ('c_class_pxd', 'property'):
1800                 s.error("Executable statement not allowed here")
1801             if s.sy == 'if':
1802                 return p_if_statement(s)
1803             elif s.sy == 'while':
1804                 return p_while_statement(s)
1805             elif s.sy == 'for':
1806                 return p_for_statement(s)
1807             elif s.sy == 'try':
1808                 return p_try_statement(s)
1809             elif s.sy == 'with':
1810                 return p_with_statement(s)
1811             else:
1812                 return p_simple_statement_list(
1813                     s, ctx, first_statement = first_statement)
1814
1815 def p_statement_list(s, ctx, first_statement = 0):
1816     # Parse a series of statements separated by newlines.
1817     pos = s.position()
1818     stats = []
1819     while s.sy not in ('DEDENT', 'EOF'):
1820         stat = p_statement(s, ctx, first_statement = first_statement)
1821         if isinstance(stat, Nodes.PassStatNode):
1822             continue
1823         stats.append(stat)
1824         first_statement = False
1825     if not stats:
1826         return Nodes.PassStatNode(pos)
1827     elif len(stats) == 1:
1828         return stats[0]
1829     else:
1830         return Nodes.StatListNode(pos, stats = stats)
1831
1832 def p_suite(s, ctx = Ctx(), with_doc = 0, with_pseudo_doc = 0):
1833     pos = s.position()
1834     s.expect(':')
1835     doc = None
1836     stmts = []
1837     if s.sy == 'NEWLINE':
1838         s.next()
1839         s.expect_indent()
1840         if with_doc or with_pseudo_doc:
1841             doc = p_doc_string(s)
1842         body = p_statement_list(s, ctx)
1843         s.expect_dedent()
1844     else:
1845         if ctx.api:
1846             s.error("'api' not allowed with this statement")
1847         if ctx.level in ('module', 'class', 'function', 'other'):
1848             body = p_simple_statement_list(s, ctx)
1849         else:
1850             body = p_pass_statement(s)
1851             s.expect_newline("Syntax error in declarations")
1852     if with_doc:
1853         return doc, body
1854     else:
1855         return body
1856
1857 def p_positional_and_keyword_args(s, end_sy_set, templates = None):
1858     """
1859     Parses positional and keyword arguments. end_sy_set
1860     should contain any s.sy that terminate the argument list.
1861     Argument expansion (* and **) are not allowed.
1862
1863     Returns: (positional_args, keyword_args)
1864     """
1865     positional_args = []
1866     keyword_args = []
1867     pos_idx = 0
1868
1869     while s.sy not in end_sy_set:
1870         if s.sy == '*' or s.sy == '**':
1871             s.error('Argument expansion not allowed here.')
1872
1873         parsed_type = False
1874         if s.sy == 'IDENT' and s.peek()[0] == '=':
1875             ident = s.systring
1876             s.next() # s.sy is '='
1877             s.next()
1878             if looking_at_expr(s):
1879                 arg = p_test(s)
1880             else:
1881                 base_type = p_c_base_type(s, templates = templates)
1882                 declarator = p_c_declarator(s, empty = 1)
1883                 arg = Nodes.CComplexBaseTypeNode(base_type.pos,
1884                     base_type = base_type, declarator = declarator)
1885                 parsed_type = True
1886             keyword_node = ExprNodes.IdentifierStringNode(
1887                 arg.pos, value = EncodedString(ident))
1888             keyword_args.append((keyword_node, arg))
1889             was_keyword = True
1890
1891         else:
1892             if looking_at_expr(s):
1893                 arg = p_test(s)
1894             else:
1895                 base_type = p_c_base_type(s, templates = templates)
1896                 declarator = p_c_declarator(s, empty = 1)
1897                 arg = Nodes.CComplexBaseTypeNode(base_type.pos,
1898                     base_type = base_type, declarator = declarator)
1899                 parsed_type = True
1900             positional_args.append(arg)
1901             pos_idx += 1
1902             if len(keyword_args) > 0:
1903                 s.error("Non-keyword arg following keyword arg",
1904                         pos = arg.pos)
1905
1906         if s.sy != ',':
1907             if s.sy not in end_sy_set:
1908                 if parsed_type:
1909                     s.error("Unmatched %s" % " or ".join(end_sy_set))
1910             break
1911         s.next()
1912     return positional_args, keyword_args
1913
1914 def p_c_base_type(s, self_flag = 0, nonempty = 0, templates = None):
1915     # If self_flag is true, this is the base type for the
1916     # self argument of a C method of an extension type.
1917     if s.sy == '(':
1918         return p_c_complex_base_type(s)
1919     else:
1920         return p_c_simple_base_type(s, self_flag, nonempty = nonempty, templates = templates)
1921
1922 def p_calling_convention(s):
1923     if s.sy == 'IDENT' and s.systring in calling_convention_words:
1924         result = s.systring
1925         s.next()
1926         return result
1927     else:
1928         return ""
1929
1930 calling_convention_words = ("__stdcall", "__cdecl", "__fastcall")
1931
1932 def p_c_complex_base_type(s):
1933     # s.sy == '('
1934     pos = s.position()
1935     s.next()
1936     base_type = p_c_base_type(s)
1937     declarator = p_c_declarator(s, empty = 1)
1938     s.expect(')')
1939     return Nodes.CComplexBaseTypeNode(pos,
1940         base_type = base_type, declarator = declarator)
1941
1942 def p_c_simple_base_type(s, self_flag, nonempty, templates = None):
1943     #print "p_c_simple_base_type: self_flag =", self_flag, nonempty
1944     is_basic = 0
1945     signed = 1
1946     longness = 0
1947     complex = 0
1948     module_path = []
1949     pos = s.position()
1950     if not s.sy == 'IDENT':
1951         error(pos, "Expected an identifier, found '%s'" % s.sy)
1952     if looking_at_base_type(s):
1953         #print "p_c_simple_base_type: looking_at_base_type at", s.position()
1954         is_basic = 1
1955         if s.sy == 'IDENT' and s.systring in special_basic_c_types:
1956             signed, longness = special_basic_c_types[s.systring]
1957             name = s.systring
1958             s.next()
1959         else:
1960             signed, longness = p_sign_and_longness(s)
1961             if s.sy == 'IDENT' and s.systring in basic_c_type_names:
1962                 name = s.systring
1963                 s.next()
1964             else:
1965                 name = 'int'  # long [int], short [int], long [int] complex, etc.
1966         if s.sy == 'IDENT' and s.systring == 'complex':
1967             complex = 1
1968             s.next()
1969     elif looking_at_dotted_name(s):
1970         #print "p_c_simple_base_type: looking_at_type_name at", s.position()
1971         name = s.systring
1972         s.next()
1973         while s.sy == '.':
1974             module_path.append(name)
1975             s.next()
1976             name = p_ident(s)
1977     else:
1978         name = s.systring
1979         s.next()
1980         if nonempty and s.sy != 'IDENT':
1981             # Make sure this is not a declaration of a variable or function.
1982             if s.sy == '(':
1983                 s.next()
1984                 if s.sy == '*' or s.sy == '**' or s.sy == '&':
1985                     s.put_back('(', '(')
1986                 else:
1987                     s.put_back('(', '(')
1988                     s.put_back('IDENT', name)
1989                     name = None
1990             elif s.sy not in ('*', '**', '[', '&'):
1991                 s.put_back('IDENT', name)
1992                 name = None
1993
1994     type_node = Nodes.CSimpleBaseTypeNode(pos,
1995         name = name, module_path = module_path,
1996         is_basic_c_type = is_basic, signed = signed,
1997         complex = complex, longness = longness,
1998         is_self_arg = self_flag, templates = templates)
1999
2000     if s.sy == '[':
2001         type_node = p_buffer_or_template(s, type_node, templates)
2002
2003     if s.sy == '.':
2004         s.next()
2005         name = p_ident(s)
2006         type_node = Nodes.CNestedBaseTypeNode(pos, base_type = type_node, name = name)
2007
2008     return type_node
2009
2010 def p_buffer_or_template(s, base_type_node, templates):
2011     # s.sy == '['
2012     pos = s.position()
2013     s.next()
2014     # Note that buffer_positional_options_count=1, so the only positional argument is dtype.
2015     # For templated types, all parameters are types.
2016     positional_args, keyword_args = (
2017         p_positional_and_keyword_args(s, (']',), templates)
2018     )
2019     s.expect(']')
2020
2021     keyword_dict = ExprNodes.DictNode(pos,
2022         key_value_pairs = [
2023             ExprNodes.DictItemNode(pos=key.pos, key=key, value=value)
2024             for key, value in keyword_args
2025         ])
2026     result = Nodes.TemplatedTypeNode(pos,
2027         positional_args = positional_args,
2028         keyword_args = keyword_dict,
2029         base_type_node = base_type_node)
2030     return result
2031
2032
2033 def looking_at_name(s):
2034     return s.sy == 'IDENT' and not s.systring in calling_convention_words
2035
2036 def looking_at_expr(s):
2037     if s.systring in base_type_start_words:
2038         return False
2039     elif s.sy == 'IDENT':
2040         is_type = False
2041         name = s.systring
2042         dotted_path = []
2043         s.next()
2044         while s.sy == '.':
2045             s.next()
2046             dotted_path.append(s.systring)
2047             s.expect('IDENT')
2048         saved = s.sy, s.systring
2049         if s.sy == 'IDENT':
2050             is_type = True
2051         elif s.sy == '*' or s.sy == '**':
2052             s.next()
2053             is_type = s.sy in (')', ']')
2054             s.put_back(*saved)
2055         elif s.sy == '(':
2056             s.next()
2057             is_type = s.sy == '*'
2058             s.put_back(*saved)
2059         elif s.sy == '[':
2060             s.next()
2061             is_type = s.sy == ']'
2062             s.put_back(*saved)
2063         dotted_path.reverse()
2064         for p in dotted_path:
2065             s.put_back('IDENT', p)
2066             s.put_back('.', '.')
2067         s.put_back('IDENT', name)
2068         return not is_type
2069     else:
2070         return True
2071
2072 def looking_at_base_type(s):
2073     #print "looking_at_base_type?", s.sy, s.systring, s.position()
2074     return s.sy == 'IDENT' and s.systring in base_type_start_words
2075
2076 def looking_at_dotted_name(s):
2077     if s.sy == 'IDENT':
2078         name = s.systring
2079         s.next()
2080         result = s.sy == '.'
2081         s.put_back('IDENT', name)
2082         return result
2083     else:
2084         return 0
2085
2086 basic_c_type_names = ("void", "char", "int", "float", "double", "bint")
2087
2088 special_basic_c_types = {
2089     # name : (signed, longness)
2090     "Py_UNICODE" : (0, 0),
2091     "Py_UCS4"    : (0, 0),
2092     "Py_ssize_t" : (2, 0),
2093     "ssize_t"    : (2, 0),
2094     "size_t"     : (0, 0),
2095 }
2096
2097 sign_and_longness_words = ("short", "long", "signed", "unsigned")
2098
2099 base_type_start_words = \
2100     basic_c_type_names + sign_and_longness_words + tuple(special_basic_c_types)
2101
2102 def p_sign_and_longness(s):
2103     signed = 1
2104     longness = 0
2105     while s.sy == 'IDENT' and s.systring in sign_and_longness_words:
2106         if s.systring == 'unsigned':
2107             signed = 0
2108         elif s.systring == 'signed':
2109             signed = 2
2110         elif s.systring == 'short':
2111             longness = -1
2112         elif s.systring == 'long':
2113             longness += 1
2114         s.next()
2115     return signed, longness
2116
2117 def p_opt_cname(s):
2118     literal = p_opt_string_literal(s, 'u')
2119     if literal is not None:
2120         cname = EncodedString(literal)
2121         cname.encoding = s.source_encoding
2122     else:
2123         cname = None
2124     return cname
2125
2126 def p_c_declarator(s, ctx = Ctx(), empty = 0, is_type = 0, cmethod_flag = 0,
2127                    assignable = 0, nonempty = 0,
2128                    calling_convention_allowed = 0):
2129     # If empty is true, the declarator must be empty. If nonempty is true,
2130     # the declarator must be nonempty. Otherwise we don't care.
2131     # If cmethod_flag is true, then if this declarator declares
2132     # a function, it's a C method of an extension type.
2133     pos = s.position()
2134     if s.sy == '(':
2135         s.next()
2136         if s.sy == ')' or looking_at_name(s):
2137             base = Nodes.CNameDeclaratorNode(pos, name = EncodedString(u""), cname = None)
2138             result = p_c_func_declarator(s, pos, ctx, base, cmethod_flag)
2139         else:
2140             result = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2141                                     cmethod_flag = cmethod_flag,
2142                                     nonempty = nonempty,
2143                                     calling_convention_allowed = 1)
2144             s.expect(')')
2145     else:
2146         result = p_c_simple_declarator(s, ctx, empty, is_type, cmethod_flag,
2147                                        assignable, nonempty)
2148     if not calling_convention_allowed and result.calling_convention and s.sy != '(':
2149         error(s.position(), "%s on something that is not a function"
2150             % result.calling_convention)
2151     while s.sy in ('[', '('):
2152         pos = s.position()
2153         if s.sy == '[':
2154             result = p_c_array_declarator(s, result)
2155         else: # sy == '('
2156             s.next()
2157             result = p_c_func_declarator(s, pos, ctx, result, cmethod_flag)
2158         cmethod_flag = 0
2159     return result
2160
2161 def p_c_array_declarator(s, base):
2162     pos = s.position()
2163     s.next() # '['
2164     if s.sy != ']':
2165         dim = p_testlist(s)
2166     else:
2167         dim = None
2168     s.expect(']')
2169     return Nodes.CArrayDeclaratorNode(pos, base = base, dimension = dim)
2170
2171 def p_c_func_declarator(s, pos, ctx, base, cmethod_flag):
2172     #  Opening paren has already been skipped
2173     args = p_c_arg_list(s, ctx, cmethod_flag = cmethod_flag,
2174                         nonempty_declarators = 0)
2175     ellipsis = p_optional_ellipsis(s)
2176     s.expect(')')
2177     nogil = p_nogil(s)
2178     exc_val, exc_check = p_exception_value_clause(s)
2179     with_gil = p_with_gil(s)
2180     return Nodes.CFuncDeclaratorNode(pos,
2181         base = base, args = args, has_varargs = ellipsis,
2182         exception_value = exc_val, exception_check = exc_check,
2183         nogil = nogil or ctx.nogil or with_gil, with_gil = with_gil)
2184
2185 supported_overloaded_operators = cython.set([
2186     '+', '-', '*', '/', '%',
2187     '++', '--', '~', '|', '&', '^', '<<', '>>', ',',
2188     '==', '!=', '>=', '>', '<=', '<',
2189     '[]', '()',
2190 ])
2191
2192 def p_c_simple_declarator(s, ctx, empty, is_type, cmethod_flag,
2193                           assignable, nonempty):
2194     pos = s.position()
2195     calling_convention = p_calling_convention(s)
2196     if s.sy == '*':
2197         s.next()
2198         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2199                               cmethod_flag = cmethod_flag,
2200                               assignable = assignable, nonempty = nonempty)
2201         result = Nodes.CPtrDeclaratorNode(pos,
2202             base = base)
2203     elif s.sy == '**': # scanner returns this as a single token
2204         s.next()
2205         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2206                               cmethod_flag = cmethod_flag,
2207                               assignable = assignable, nonempty = nonempty)
2208         result = Nodes.CPtrDeclaratorNode(pos,
2209             base = Nodes.CPtrDeclaratorNode(pos,
2210                 base = base))
2211     elif s.sy == '&':
2212         s.next()
2213         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2214                               cmethod_flag = cmethod_flag,
2215                               assignable = assignable, nonempty = nonempty)
2216         result = Nodes.CReferenceDeclaratorNode(pos, base = base)
2217     else:
2218         rhs = None
2219         if s.sy == 'IDENT':
2220             name = EncodedString(s.systring)
2221             if empty:
2222                 error(s.position(), "Declarator should be empty")
2223             s.next()
2224             cname = p_opt_cname(s)
2225             if name != 'operator' and s.sy == '=' and assignable:
2226                 s.next()
2227                 rhs = p_test(s)
2228         else:
2229             if nonempty:
2230                 error(s.position(), "Empty declarator")
2231             name = ""
2232             cname = None
2233         if cname is None and ctx.namespace is not None and nonempty:
2234             cname = ctx.namespace + "::" + name
2235         if name == 'operator' and ctx.visibility == 'extern' and nonempty:
2236             op = s.sy
2237             if [1 for c in op if c in '+-*/<=>!%&|([^~,']:
2238                 s.next()
2239                 # Handle diphthong operators.
2240                 if op == '(':
2241                     s.expect(')')
2242                     op = '()'
2243                 elif op == '[':
2244                     s.expect(']')
2245                     op = '[]'
2246                 if op in ['-', '+', '|', '&'] and s.sy == op:
2247                     op = op*2
2248                     s.next()
2249                 if s.sy == '=':
2250                     op += s.sy
2251                     s.next()
2252                 if op not in supported_overloaded_operators:
2253                     s.error("Overloading operator '%s' not yet supported." % op)
2254                 name = name+op
2255         result = Nodes.CNameDeclaratorNode(pos,
2256             name = name, cname = cname, default = rhs)
2257     result.calling_convention = calling_convention
2258     return result
2259
2260 def p_nogil(s):
2261     if s.sy == 'IDENT' and s.systring == 'nogil':
2262         s.next()
2263         return 1
2264     else:
2265         return 0
2266
2267 def p_with_gil(s):
2268     if s.sy == 'with':
2269         s.next()
2270         s.expect_keyword('gil')
2271         return 1
2272     else:
2273         return 0
2274
2275 def p_exception_value_clause(s):
2276     exc_val = None
2277     exc_check = 0
2278     if s.sy == 'except':
2279         s.next()
2280         if s.sy == '*':
2281             exc_check = 1
2282             s.next()
2283         elif s.sy == '+':
2284             exc_check = '+'
2285             s.next()
2286             if s.sy == 'IDENT':
2287                 name = s.systring
2288                 s.next()
2289                 exc_val = p_name(s, name)
2290         else:
2291             if s.sy == '?':
2292                 exc_check = 1
2293                 s.next()
2294             exc_val = p_test(s)
2295     return exc_val, exc_check
2296
2297 c_arg_list_terminators = ('*', '**', '.', ')')
2298
2299 def p_c_arg_list(s, ctx = Ctx(), in_pyfunc = 0, cmethod_flag = 0,
2300                  nonempty_declarators = 0, kw_only = 0, annotated = 1):
2301     #  Comma-separated list of C argument declarations, possibly empty.
2302     #  May have a trailing comma.
2303     args = []
2304     is_self_arg = cmethod_flag
2305     while s.sy not in c_arg_list_terminators:
2306         args.append(p_c_arg_decl(s, ctx, in_pyfunc, is_self_arg,
2307             nonempty = nonempty_declarators, kw_only = kw_only,
2308             annotated = annotated))
2309         if s.sy != ',':
2310             break
2311         s.next()
2312         is_self_arg = 0
2313     return args
2314
2315 def p_optional_ellipsis(s):
2316     if s.sy == '.':
2317         expect_ellipsis(s)
2318         return 1
2319     else:
2320         return 0
2321
2322 def p_c_arg_decl(s, ctx, in_pyfunc, cmethod_flag = 0, nonempty = 0,
2323                  kw_only = 0, annotated = 1):
2324     pos = s.position()
2325     not_none = or_none = 0
2326     default = None
2327     annotation = None
2328     if s.in_python_file:
2329         # empty type declaration
2330         base_type = Nodes.CSimpleBaseTypeNode(pos,
2331             name = None, module_path = [],
2332             is_basic_c_type = 0, signed = 0,
2333             complex = 0, longness = 0,
2334             is_self_arg = cmethod_flag, templates = None)
2335     else:
2336         base_type = p_c_base_type(s, cmethod_flag, nonempty = nonempty)
2337     declarator = p_c_declarator(s, ctx, nonempty = nonempty)
2338     if s.sy in ('not', 'or') and not s.in_python_file:
2339         kind = s.sy
2340         s.next()
2341         if s.sy == 'IDENT' and s.systring == 'None':
2342             s.next()
2343         else:
2344             s.error("Expected 'None'")
2345         if not in_pyfunc:
2346             error(pos, "'%s None' only allowed in Python functions" % kind)
2347         or_none = kind == 'or'
2348         not_none = kind == 'not'
2349     if annotated and s.sy == ':':
2350         s.next()
2351         annotation = p_test(s)
2352     if s.sy == '=':
2353         s.next()
2354         if 'pxd' in s.level:
2355             if s.sy not in ['*', '?']:
2356                 error(pos, "default values cannot be specified in pxd files, use ? or *")
2357             default = ExprNodes.BoolNode(1)
2358             s.next()
2359         else:
2360             default = p_test(s)
2361     return Nodes.CArgDeclNode(pos,
2362         base_type = base_type,
2363         declarator = declarator,
2364         not_none = not_none,
2365         or_none = or_none,
2366         default = default,
2367         annotation = annotation,
2368         kw_only = kw_only)
2369
2370 def p_api(s):
2371     if s.sy == 'IDENT' and s.systring == 'api':
2372         s.next()
2373         return 1
2374     else:
2375         return 0
2376
2377 def p_cdef_statement(s, ctx):
2378     pos = s.position()
2379     ctx.visibility = p_visibility(s, ctx.visibility)
2380     ctx.api = ctx.api or p_api(s)
2381     if ctx.api:
2382         if ctx.visibility not in ('private', 'public'):
2383             error(pos, "Cannot combine 'api' with '%s'" % ctx.visibility)
2384     if (ctx.visibility == 'extern') and s.sy == 'from':
2385         return p_cdef_extern_block(s, pos, ctx)
2386     elif s.sy == 'import':
2387         s.next()
2388         return p_cdef_extern_block(s, pos, ctx)
2389     elif p_nogil(s):
2390         ctx.nogil = 1
2391         if ctx.overridable:
2392             error(pos, "cdef blocks cannot be declared cpdef")
2393         return p_cdef_block(s, ctx)
2394     elif s.sy == ':':
2395         if ctx.overridable:
2396             error(pos, "cdef blocks cannot be declared cpdef")
2397         return p_cdef_block(s, ctx)
2398     elif s.sy == 'class':
2399         if ctx.level not in ('module', 'module_pxd'):
2400             error(pos, "Extension type definition not allowed here")
2401         if ctx.overridable:
2402             error(pos, "Extension types cannot be declared cpdef")
2403         return p_c_class_definition(s, pos, ctx)
2404     elif s.sy == 'IDENT' and s.systring == 'cppclass':
2405         if ctx.visibility != 'extern':
2406             error(pos, "C++ classes need to be declared extern")
2407         return p_cpp_class_definition(s, pos, ctx)
2408     elif s.sy == 'IDENT' and s.systring in ("struct", "union", "enum", "packed"):
2409         if ctx.level not in ('module', 'module_pxd'):
2410             error(pos, "C struct/union/enum definition not allowed here")
2411         if ctx.overridable:
2412             error(pos, "C struct/union/enum cannot be declared cpdef")
2413         if s.systring == "enum":
2414             return p_c_enum_definition(s, pos, ctx)
2415         else:
2416             return p_c_struct_or_union_definition(s, pos, ctx)
2417     else:
2418         return p_c_func_or_var_declaration(s, pos, ctx)
2419
2420 def p_cdef_block(s, ctx):
2421     return p_suite(s, ctx(cdef_flag = 1))
2422
2423 def p_cdef_extern_block(s, pos, ctx):
2424     if ctx.overridable:
2425         error(pos, "cdef extern blocks cannot be declared cpdef")
2426     include_file = None
2427     s.expect('from')
2428     if s.sy == '*':
2429         s.next()
2430     else:
2431         include_file = p_string_literal(s, 'u')[2]
2432     ctx = ctx(cdef_flag = 1, visibility = 'extern')
2433     if s.systring == "namespace":
2434         s.next()
2435         ctx.namespace = p_string_literal(s, 'u')[2]
2436     if p_nogil(s):
2437         ctx.nogil = 1
2438     body = p_suite(s, ctx)
2439     return Nodes.CDefExternNode(pos,
2440         include_file = include_file,
2441         body = body,
2442         namespace = ctx.namespace)
2443
2444 def p_c_enum_definition(s, pos, ctx):
2445     # s.sy == ident 'enum'
2446     s.next()
2447     if s.sy == 'IDENT':
2448         name = s.systring
2449         s.next()
2450         cname = p_opt_cname(s)
2451         if cname is None and ctx.namespace is not None:
2452             cname = ctx.namespace + "::" + name
2453     else:
2454         name = None
2455         cname = None
2456     items = None
2457     s.expect(':')
2458     items = []
2459     if s.sy != 'NEWLINE':
2460         p_c_enum_line(s, ctx, items)
2461     else:
2462         s.next() # 'NEWLINE'
2463         s.expect_indent()
2464         while s.sy not in ('DEDENT', 'EOF'):
2465             p_c_enum_line(s, ctx, items)
2466         s.expect_dedent()
2467     return Nodes.CEnumDefNode(
2468         pos, name = name, cname = cname, items = items,
2469         typedef_flag = ctx.typedef_flag, visibility = ctx.visibility,
2470         api = ctx.api, in_pxd = ctx.level == 'module_pxd')
2471
2472 def p_c_enum_line(s, ctx, items):
2473     if s.sy != 'pass':
2474         p_c_enum_item(s, ctx, items)
2475         while s.sy == ',':
2476             s.next()
2477             if s.sy in ('NEWLINE', 'EOF'):
2478                 break
2479             p_c_enum_item(s, ctx, items)
2480     else:
2481         s.next()
2482     s.expect_newline("Syntax error in enum item list")
2483
2484 def p_c_enum_item(s, ctx, items):
2485     pos = s.position()
2486     name = p_ident(s)
2487     cname = p_opt_cname(s)
2488     if cname is None and ctx.namespace is not None:
2489         cname = ctx.namespace + "::" + name
2490     value = None
2491     if s.sy == '=':
2492         s.next()
2493         value = p_test(s)
2494     items.append(Nodes.CEnumDefItemNode(pos,
2495         name = name, cname = cname, value = value))
2496
2497 def p_c_struct_or_union_definition(s, pos, ctx):
2498     packed = False
2499     if s.systring == 'packed':
2500         packed = True
2501         s.next()
2502         if s.sy != 'IDENT' or s.systring != 'struct':
2503             s.expected('struct')
2504     # s.sy == ident 'struct' or 'union'
2505     kind = s.systring
2506     s.next()
2507     name = p_ident(s)
2508     cname = p_opt_cname(s)
2509     if cname is None and ctx.namespace is not None:
2510         cname = ctx.namespace + "::" + name
2511     attributes = None
2512     if s.sy == ':':
2513         s.next()
2514         s.expect('NEWLINE')
2515         s.expect_indent()
2516         attributes = []
2517         body_ctx = Ctx()
2518         while s.sy != 'DEDENT':
2519             if s.sy != 'pass':
2520                 attributes.append(
2521                     p_c_func_or_var_declaration(s, s.position(), body_ctx))
2522             else:
2523                 s.next()
2524                 s.expect_newline("Expected a newline")
2525         s.expect_dedent()
2526     else:
2527         s.expect_newline("Syntax error in struct or union definition")
2528     return Nodes.CStructOrUnionDefNode(pos,
2529         name = name, cname = cname, kind = kind, attributes = attributes,
2530         typedef_flag = ctx.typedef_flag, visibility = ctx.visibility,
2531         api = ctx.api, in_pxd = ctx.level == 'module_pxd', packed = packed)
2532
2533 def p_visibility(s, prev_visibility):
2534     pos = s.position()
2535     visibility = prev_visibility
2536     if s.sy == 'IDENT' and s.systring in ('extern', 'public', 'readonly'):
2537         visibility = s.systring
2538         if prev_visibility != 'private' and visibility != prev_visibility:
2539             s.error("Conflicting visibility options '%s' and '%s'"
2540                 % (prev_visibility, visibility))
2541         s.next()
2542     return visibility
2543
2544 def p_c_modifiers(s):
2545     if s.sy == 'IDENT' and s.systring in ('inline',):
2546         modifier = s.systring
2547         s.next()
2548         return [modifier] + p_c_modifiers(s)
2549     return []
2550
2551 def p_c_func_or_var_declaration(s, pos, ctx):
2552     cmethod_flag = ctx.level in ('c_class', 'c_class_pxd')
2553     modifiers = p_c_modifiers(s)
2554     base_type = p_c_base_type(s, nonempty = 1, templates = ctx.templates)
2555     declarator = p_c_declarator(s, ctx, cmethod_flag = cmethod_flag,
2556                                 assignable = 1, nonempty = 1)
2557     declarator.overridable = ctx.overridable
2558     if s.sy == ':':
2559         if ctx.level not in ('module', 'c_class', 'module_pxd', 'c_class_pxd') and not ctx.templates:
2560             s.error("C function definition not allowed here")
2561         doc, suite = p_suite(s, Ctx(level = 'function'), with_doc = 1)
2562         result = Nodes.CFuncDefNode(pos,
2563             visibility = ctx.visibility,
2564             base_type = base_type,
2565             declarator = declarator,
2566             body = suite,
2567             doc = doc,
2568             modifiers = modifiers,
2569             api = ctx.api,
2570             overridable = ctx.overridable)
2571     else:
2572         #if api:
2573         #    s.error("'api' not allowed with variable declaration")
2574         declarators = [declarator]
2575         while s.sy == ',':
2576             s.next()
2577             if s.sy == 'NEWLINE':
2578                 break
2579             declarator = p_c_declarator(s, ctx, cmethod_flag = cmethod_flag,
2580                                         assignable = 1, nonempty = 1)
2581             declarators.append(declarator)
2582         s.expect_newline("Syntax error in C variable declaration")
2583         result = Nodes.CVarDefNode(pos,
2584             visibility = ctx.visibility,
2585             base_type = base_type,
2586             declarators = declarators,
2587             in_pxd = ctx.level == 'module_pxd',
2588             api = ctx.api,
2589             overridable = ctx.overridable)
2590     return result
2591
2592 def p_ctypedef_statement(s, ctx):
2593     # s.sy == 'ctypedef'
2594     pos = s.position()
2595     s.next()
2596     visibility = p_visibility(s, ctx.visibility)
2597     api = p_api(s)
2598     ctx = ctx(typedef_flag = 1, visibility = visibility)
2599     if api:
2600         ctx.api = 1
2601     if s.sy == 'class':
2602         return p_c_class_definition(s, pos, ctx)
2603     elif s.sy == 'IDENT' and s.systring in ('packed', 'struct', 'union', 'enum'):
2604         if s.systring == 'enum':
2605             return p_c_enum_definition(s, pos, ctx)
2606         else:
2607             return p_c_struct_or_union_definition(s, pos, ctx)
2608     else:
2609         base_type = p_c_base_type(s, nonempty = 1)
2610         if base_type.name is None:
2611             s.error("Syntax error in ctypedef statement")
2612         declarator = p_c_declarator(s, ctx, is_type = 1, nonempty = 1)
2613         s.expect_newline("Syntax error in ctypedef statement")
2614         return Nodes.CTypeDefNode(
2615             pos, base_type = base_type,
2616             declarator = declarator,
2617             visibility = visibility, api = api,
2618             in_pxd = ctx.level == 'module_pxd')
2619
2620 def p_decorators(s):
2621     decorators = []
2622     while s.sy == 'DECORATOR':
2623         pos = s.position()
2624         s.next()
2625         decstring = p_dotted_name(s, as_allowed=0)[2]
2626         names = decstring.split('.')
2627         decorator = ExprNodes.NameNode(pos, name=EncodedString(names[0]))
2628         for name in names[1:]:
2629             decorator = ExprNodes.AttributeNode(pos,
2630                                            attribute=EncodedString(name),
2631                                            obj=decorator)
2632         if s.sy == '(':
2633             decorator = p_call(s, decorator)
2634         decorators.append(Nodes.DecoratorNode(pos, decorator=decorator))
2635         s.expect_newline("Expected a newline after decorator")
2636     return decorators
2637
2638 def p_def_statement(s, decorators=None):
2639     # s.sy == 'def'
2640     pos = s.position()
2641     s.next()
2642     name = EncodedString( p_ident(s) )
2643     s.expect('(');
2644     args, star_arg, starstar_arg = p_varargslist(s, terminator=')')
2645     s.expect(')')
2646     if p_nogil(s):
2647         error(pos, "Python function cannot be declared nogil")
2648     return_type_annotation = None
2649     if s.sy == '->':
2650         s.next()
2651         return_type_annotation = p_test(s)
2652     doc, body = p_suite(s, Ctx(level = 'function'), with_doc = 1)
2653     return Nodes.DefNode(pos, name = name, args = args,
2654         star_arg = star_arg, starstar_arg = starstar_arg,
2655         doc = doc, body = body, decorators = decorators,
2656         return_type_annotation = return_type_annotation)
2657
2658 def p_varargslist(s, terminator=')', annotated=1):
2659     args = p_c_arg_list(s, in_pyfunc = 1, nonempty_declarators = 1,
2660                         annotated = annotated)
2661     star_arg = None
2662     starstar_arg = None
2663     if s.sy == '*':
2664         s.next()
2665         if s.sy == 'IDENT':
2666             star_arg = p_py_arg_decl(s, annotated=annotated)
2667         if s.sy == ',':
2668             s.next()
2669             args.extend(p_c_arg_list(s, in_pyfunc = 1,
2670                 nonempty_declarators = 1, kw_only = 1, annotated = annotated))
2671         elif s.sy != terminator:
2672             s.error("Syntax error in Python function argument list")
2673     if s.sy == '**':
2674         s.next()
2675         starstar_arg = p_py_arg_decl(s, annotated=annotated)
2676     return (args, star_arg, starstar_arg)
2677
2678 def p_py_arg_decl(s, annotated = 1):
2679     pos = s.position()
2680     name = p_ident(s)
2681     annotation = None
2682     if annotated and s.sy == ':':
2683         s.next()
2684         annotation = p_test(s)
2685     return Nodes.PyArgDeclNode(pos, name = name, annotation = annotation)
2686
2687 def p_class_statement(s, decorators):
2688     # s.sy == 'class'
2689     pos = s.position()
2690     s.next()
2691     class_name = EncodedString( p_ident(s) )
2692     class_name.encoding = s.source_encoding
2693     arg_tuple = None
2694     keyword_dict = None
2695     starstar_arg = None
2696     if s.sy == '(':
2697         positional_args, keyword_args, star_arg, starstar_arg = \
2698                             p_call_parse_args(s, allow_genexp = False)
2699         arg_tuple, keyword_dict = p_call_build_packed_args(
2700             pos, positional_args, keyword_args, star_arg)
2701     if arg_tuple is None:
2702         # XXX: empty arg_tuple
2703         arg_tuple = ExprNodes.TupleNode(pos, args = [])
2704     doc, body = p_suite(s, Ctx(level = 'class'), with_doc = 1)
2705     return Nodes.PyClassDefNode(pos,
2706         name = class_name,
2707         bases = arg_tuple,
2708         keyword_args = keyword_dict,
2709         starstar_arg = starstar_arg,
2710         doc = doc, body = body, decorators = decorators)
2711
2712 def p_c_class_definition(s, pos,  ctx):
2713     # s.sy == 'class'
2714     s.next()
2715     module_path = []
2716     class_name = p_ident(s)
2717     while s.sy == '.':
2718         s.next()
2719         module_path.append(class_name)
2720         class_name = p_ident(s)
2721     if module_path and ctx.visibility != 'extern':
2722         error(pos, "Qualified class name only allowed for 'extern' C class")
2723     if module_path and s.sy == 'IDENT' and s.systring == 'as':
2724         s.next()
2725         as_name = p_ident(s)
2726     else:
2727         as_name = class_name
2728     objstruct_name = None
2729     typeobj_name = None
2730     base_class_module = None
2731     base_class_name = None
2732     if s.sy == '(':
2733         s.next()
2734         base_class_path = [p_ident(s)]
2735         while s.sy == '.':
2736             s.next()
2737             base_class_path.append(p_ident(s))
2738         if s.sy == ',':
2739             s.error("C class may only have one base class")
2740         s.expect(')')
2741         base_class_module = ".".join(base_class_path[:-1])
2742         base_class_name = base_class_path[-1]
2743     if s.sy == '[':
2744         if ctx.visibility not in ('public', 'extern') and not ctx.api:
2745             error(s.position(), "Name options only allowed for 'public', 'api', or 'extern' C class")
2746         objstruct_name, typeobj_name = p_c_class_options(s)
2747     if s.sy == ':':
2748         if ctx.level == 'module_pxd':
2749             body_level = 'c_class_pxd'
2750         else:
2751             body_level = 'c_class'
2752         doc, body = p_suite(s, Ctx(level = body_level), with_doc = 1)
2753     else:
2754         s.expect_newline("Syntax error in C class definition")
2755         doc = None
2756         body = None
2757     if ctx.visibility == 'extern':
2758         if not module_path:
2759             error(pos, "Module name required for 'extern' C class")
2760         if typeobj_name:
2761             error(pos, "Type object name specification not allowed for 'extern' C class")
2762     elif ctx.visibility == 'public':
2763         if not objstruct_name:
2764             error(pos, "Object struct name specification required for 'public' C class")
2765         if not typeobj_name:
2766             error(pos, "Type object name specification required for 'public' C class")
2767     elif ctx.visibility == 'private':
2768         if ctx.api:
2769             if not objstruct_name:
2770                 error(pos, "Object struct name specification required for 'api' C class")
2771             if not typeobj_name:
2772                 error(pos, "Type object name specification required for 'api' C class")
2773     else:
2774         error(pos, "Invalid class visibility '%s'" % ctx.visibility)
2775     return Nodes.CClassDefNode(pos,
2776         visibility = ctx.visibility,
2777         typedef_flag = ctx.typedef_flag,
2778         api = ctx.api,
2779         module_name = ".".join(module_path),
2780         class_name = class_name,
2781         as_name = as_name,
2782         base_class_module = base_class_module,
2783         base_class_name = base_class_name,
2784         objstruct_name = objstruct_name,
2785         typeobj_name = typeobj_name,
2786         in_pxd = ctx.level == 'module_pxd',
2787         doc = doc,
2788         body = body)
2789
2790 def p_c_class_options(s):
2791     objstruct_name = None
2792     typeobj_name = None
2793     s.expect('[')
2794     while 1:
2795         if s.sy != 'IDENT':
2796             break
2797         if s.systring == 'object':
2798             s.next()
2799             objstruct_name = p_ident(s)
2800         elif s.systring == 'type':
2801             s.next()
2802             typeobj_name = p_ident(s)
2803         if s.sy != ',':
2804             break
2805         s.next()
2806     s.expect(']', "Expected 'object' or 'type'")
2807     return objstruct_name, typeobj_name
2808
2809 def p_property_decl(s):
2810     pos = s.position()
2811     s.next() # 'property'
2812     name = p_ident(s)
2813     doc, body = p_suite(s, Ctx(level = 'property'), with_doc = 1)
2814     return Nodes.PropertyNode(pos, name = name, doc = doc, body = body)
2815
2816 def p_doc_string(s):
2817     if s.sy == 'BEGIN_STRING':
2818         pos = s.position()
2819         kind, bytes_result, unicode_result = p_cat_string_literal(s)
2820         if s.sy != 'EOF':
2821             s.expect_newline("Syntax error in doc string")
2822         if kind in ('u', ''):
2823             return unicode_result
2824         warning(pos, "Python 3 requires docstrings to be unicode strings")
2825         return bytes_result
2826     else:
2827         return None
2828
2829 def p_code(s, level=None):
2830     body = p_statement_list(s, Ctx(level = level), first_statement = 1)
2831     if s.sy != 'EOF':
2832         s.error("Syntax error in statement [%s,%s]" % (
2833             repr(s.sy), repr(s.systring)))
2834     return body
2835
2836 COMPILER_DIRECTIVE_COMMENT_RE = re.compile(r"^#\s*cython\s*:\s*((\w|[.])+\s*=.*)$")
2837
2838 def p_compiler_directive_comments(s):
2839     result = {}
2840     while s.sy == 'commentline':
2841         m = COMPILER_DIRECTIVE_COMMENT_RE.match(s.systring)
2842         if m:
2843             directives = m.group(1).strip()
2844             try:
2845                 result.update( Options.parse_directive_list(
2846                     directives, ignore_unknown=True) )
2847             except ValueError, e:
2848                 s.error(e.args[0], fatal=False)
2849         s.next()
2850     return result
2851
2852 def p_module(s, pxd, full_module_name):
2853     pos = s.position()
2854
2855     directive_comments = p_compiler_directive_comments(s)
2856     s.parse_comments = False
2857
2858     if 'language_level' in directive_comments:
2859         s.context.set_language_level(directive_comments['language_level'])
2860
2861     doc = p_doc_string(s)
2862     if pxd:
2863         level = 'module_pxd'
2864     else:
2865         level = 'module'
2866
2867     body = p_statement_list(s, Ctx(level = level), first_statement = 1)
2868     if s.sy != 'EOF':
2869         s.error("Syntax error in statement [%s,%s]" % (
2870             repr(s.sy), repr(s.systring)))
2871     return ModuleNode(pos, doc = doc, body = body,
2872                       full_module_name = full_module_name,
2873                       directive_comments = directive_comments)
2874
2875 def p_cpp_class_definition(s, pos,  ctx):
2876     # s.sy == 'cppclass'
2877     s.next()
2878     module_path = []
2879     class_name = p_ident(s)
2880     cname = p_opt_cname(s)
2881     if cname is None and ctx.namespace is not None:
2882         cname = ctx.namespace + "::" + class_name
2883     if s.sy == '.':
2884         error(pos, "Qualified class name not allowed C++ class")
2885     if s.sy == '[':
2886         s.next()
2887         templates = [p_ident(s)]
2888         while s.sy == ',':
2889             s.next()
2890             templates.append(p_ident(s))
2891         s.expect(']')
2892     else:
2893         templates = None
2894     if s.sy == '(':
2895         s.next()
2896         base_classes = [p_dotted_name(s, False)[2]]
2897         while s.sy == ',':
2898             s.next()
2899             base_classes.append(p_dotted_name(s, False)[2])
2900         s.expect(')')
2901     else:
2902         base_classes = []
2903     if s.sy == '[':
2904         error(s.position(), "Name options not allowed for C++ class")
2905     if s.sy == ':':
2906         s.next()
2907         s.expect('NEWLINE')
2908         s.expect_indent()
2909         attributes = []
2910         body_ctx = Ctx(visibility = ctx.visibility)
2911         body_ctx.templates = templates
2912         while s.sy != 'DEDENT':
2913             if s.systring == 'cppclass':
2914                 attributes.append(
2915                     p_cpp_class_definition(s, s.position(), body_ctx))
2916             elif s.sy != 'pass':
2917                 attributes.append(
2918                     p_c_func_or_var_declaration(s, s.position(), body_ctx))
2919             else:
2920                 s.next()
2921                 s.expect_newline("Expected a newline")
2922         s.expect_dedent()
2923     else:
2924         attributes = None
2925         s.expect_newline("Syntax error in C++ class definition")
2926     return Nodes.CppClassNode(pos,
2927         name = class_name,
2928         cname = cname,
2929         base_classes = base_classes,
2930         visibility = ctx.visibility,
2931         in_pxd = ctx.level == 'module_pxd',
2932         attributes = attributes,
2933         templates = templates)
2934
2935
2936
2937 #----------------------------------------------
2938 #
2939 #   Debugging
2940 #
2941 #----------------------------------------------
2942
2943 def print_parse_tree(f, node, level, key = None):
2944     from types import ListType, TupleType
2945     from Nodes import Node
2946     ind = "  " * level
2947     if node:
2948         f.write(ind)
2949         if key:
2950             f.write("%s: " % key)
2951         t = type(node)
2952         if t is tuple:
2953             f.write("(%s @ %s\n" % (node[0], node[1]))
2954             for i in xrange(2, len(node)):
2955                 print_parse_tree(f, node[i], level+1)
2956             f.write("%s)\n" % ind)
2957             return
2958         elif isinstance(node, Node):
2959             try:
2960                 tag = node.tag
2961             except AttributeError:
2962                 tag = node.__class__.__name__
2963             f.write("%s @ %s\n" % (tag, node.pos))
2964             for name, value in node.__dict__.items():
2965                 if name != 'tag' and name != 'pos':
2966                     print_parse_tree(f, value, level+1, name)
2967             return
2968         elif t is list:
2969             f.write("[\n")
2970             for i in xrange(len(node)):
2971                 print_parse_tree(f, node[i], level+1)
2972             f.write("%s]\n" % ind)
2973             return
2974     f.write("%s%s\n" % (ind, node))
2975