9caaa39920b6bdc6952890aad35c41b8b16680db
[cython.git] / Cython / Compiler / Parsing.py
1 # cython: auto_cpdef=True, infer_types=True, language_level=3
2 #
3 #   Pyrex Parser
4 #
5
6 # This should be done automatically
7 import cython
8 cython.declare(Nodes=object, ExprNodes=object, EncodedString=object)
9
10 import os
11 import re
12 import sys
13
14 from Cython.Compiler.Scanning import PyrexScanner, FileSourceDescriptor
15 import Nodes
16 import ExprNodes
17 import StringEncoding
18 from StringEncoding import EncodedString, BytesLiteral, _unicode, _bytes
19 from ModuleNode import ModuleNode
20 from Errors import error, warning, InternalError
21 from Cython import Utils
22 import Future
23 import Options
24
25 class Ctx(object):
26     #  Parsing context
27     level = 'other'
28     visibility = 'private'
29     cdef_flag = 0
30     typedef_flag = 0
31     api = 0
32     overridable = 0
33     nogil = 0
34     namespace = None
35     templates = None
36
37     def __init__(self, **kwds):
38         self.__dict__.update(kwds)
39
40     def __call__(self, **kwds):
41         ctx = Ctx()
42         d = ctx.__dict__
43         d.update(self.__dict__)
44         d.update(kwds)
45         return ctx
46
47 def p_ident(s, message = "Expected an identifier"):
48     if s.sy == 'IDENT':
49         name = s.systring
50         s.next()
51         return name
52     else:
53         s.error(message)
54
55 def p_ident_list(s):
56     names = []
57     while s.sy == 'IDENT':
58         names.append(s.systring)
59         s.next()
60         if s.sy != ',':
61             break
62         s.next()
63     return names
64
65 #------------------------------------------
66 #
67 #   Expressions
68 #
69 #------------------------------------------
70
71 def p_binop_operator(s):
72     pos = s.position()
73     op = s.sy
74     s.next()
75     return op, pos
76
77 def p_binop_expr(s, ops, p_sub_expr):
78     n1 = p_sub_expr(s)
79     while s.sy in ops:
80         op, pos = p_binop_operator(s)
81         n2 = p_sub_expr(s)
82         n1 = ExprNodes.binop_node(pos, op, n1, n2)
83         if op == '/':
84             if Future.division in s.context.future_directives:
85                 n1.truedivision = True
86             else:
87                 n1.truedivision = None # unknown
88     return n1
89
90 #lambdef: 'lambda' [varargslist] ':' test
91
92 def p_lambdef(s, allow_conditional=True):
93     # s.sy == 'lambda'
94     pos = s.position()
95     s.next()
96     if s.sy == ':':
97         args = []
98         star_arg = starstar_arg = None
99     else:
100         args, star_arg, starstar_arg = p_varargslist(
101             s, terminator=':', annotated=False)
102     s.expect(':')
103     if allow_conditional:
104         expr = p_test(s)
105     else:
106         expr = p_test_nocond(s)
107     return ExprNodes.LambdaNode(
108         pos, args = args,
109         star_arg = star_arg, starstar_arg = starstar_arg,
110         result_expr = expr)
111
112 #lambdef_nocond: 'lambda' [varargslist] ':' test_nocond
113
114 def p_lambdef_nocond(s):
115     return p_lambdef(s, allow_conditional=False)
116
117 #test: or_test ['if' or_test 'else' test] | lambdef
118
119 def p_test(s):
120     if s.sy == 'lambda':
121         return p_lambdef(s)
122     pos = s.position()
123     expr = p_or_test(s)
124     if s.sy == 'if':
125         s.next()
126         test = p_or_test(s)
127         s.expect('else')
128         other = p_test(s)
129         return ExprNodes.CondExprNode(pos, test=test, true_val=expr, false_val=other)
130     else:
131         return expr
132
133 #test_nocond: or_test | lambdef_nocond
134
135 def p_test_nocond(s):
136     if s.sy == 'lambda':
137         return p_lambdef_nocond(s)
138     else:
139         return p_or_test(s)
140
141 #or_test: and_test ('or' and_test)*
142
143 def p_or_test(s):
144     return p_rassoc_binop_expr(s, ('or',), p_and_test)
145
146 def p_rassoc_binop_expr(s, ops, p_subexpr):
147     n1 = p_subexpr(s)
148     if s.sy in ops:
149         pos = s.position()
150         op = s.sy
151         s.next()
152         n2 = p_rassoc_binop_expr(s, ops, p_subexpr)
153         n1 = ExprNodes.binop_node(pos, op, n1, n2)
154     return n1
155
156 #and_test: not_test ('and' not_test)*
157
158 def p_and_test(s):
159     #return p_binop_expr(s, ('and',), p_not_test)
160     return p_rassoc_binop_expr(s, ('and',), p_not_test)
161
162 #not_test: 'not' not_test | comparison
163
164 def p_not_test(s):
165     if s.sy == 'not':
166         pos = s.position()
167         s.next()
168         return ExprNodes.NotNode(pos, operand = p_not_test(s))
169     else:
170         return p_comparison(s)
171
172 #comparison: expr (comp_op expr)*
173 #comp_op: '<'|'>'|'=='|'>='|'<='|'<>'|'!='|'in'|'not' 'in'|'is'|'is' 'not'
174
175 def p_comparison(s):
176     n1 = p_starred_expr(s)
177     if s.sy in comparison_ops:
178         pos = s.position()
179         op = p_cmp_op(s)
180         n2 = p_starred_expr(s)
181         n1 = ExprNodes.PrimaryCmpNode(pos,
182             operator = op, operand1 = n1, operand2 = n2)
183         if s.sy in comparison_ops:
184             n1.cascade = p_cascaded_cmp(s)
185     return n1
186
187 def p_test_or_starred_expr(s):
188     if s.sy == '*':
189         return p_starred_expr(s)
190     else:
191         return p_test(s)
192
193 def p_starred_expr(s):
194     pos = s.position()
195     if s.sy == '*':
196         starred = True
197         s.next()
198     else:
199         starred = False
200     expr = p_bit_expr(s)
201     if starred:
202         expr = ExprNodes.StarredTargetNode(pos, expr)
203     return expr
204
205 def p_cascaded_cmp(s):
206     pos = s.position()
207     op = p_cmp_op(s)
208     n2 = p_starred_expr(s)
209     result = ExprNodes.CascadedCmpNode(pos,
210         operator = op, operand2 = n2)
211     if s.sy in comparison_ops:
212         result.cascade = p_cascaded_cmp(s)
213     return result
214
215 def p_cmp_op(s):
216     if s.sy == 'not':
217         s.next()
218         s.expect('in')
219         op = 'not_in'
220     elif s.sy == 'is':
221         s.next()
222         if s.sy == 'not':
223             s.next()
224             op = 'is_not'
225         else:
226             op = 'is'
227     else:
228         op = s.sy
229         s.next()
230     if op == '<>':
231         op = '!='
232     return op
233
234 comparison_ops = (
235     '<', '>', '==', '>=', '<=', '<>', '!=',
236     'in', 'is', 'not'
237 )
238
239 #expr: xor_expr ('|' xor_expr)*
240
241 def p_bit_expr(s):
242     return p_binop_expr(s, ('|',), p_xor_expr)
243
244 #xor_expr: and_expr ('^' and_expr)*
245
246 def p_xor_expr(s):
247     return p_binop_expr(s, ('^',), p_and_expr)
248
249 #and_expr: shift_expr ('&' shift_expr)*
250
251 def p_and_expr(s):
252     return p_binop_expr(s, ('&',), p_shift_expr)
253
254 #shift_expr: arith_expr (('<<'|'>>') arith_expr)*
255
256 def p_shift_expr(s):
257     return p_binop_expr(s, ('<<', '>>'), p_arith_expr)
258
259 #arith_expr: term (('+'|'-') term)*
260
261 def p_arith_expr(s):
262     return p_binop_expr(s, ('+', '-'), p_term)
263
264 #term: factor (('*'|'/'|'%') factor)*
265
266 def p_term(s):
267     return p_binop_expr(s, ('*', '/', '%', '//'), p_factor)
268
269 #factor: ('+'|'-'|'~'|'&'|typecast|sizeof) factor | power
270
271 def p_factor(s):
272     # little indirection for C-ification purposes
273     return _p_factor(s)
274
275 def _p_factor(s):
276     sy = s.sy
277     if sy in ('+', '-', '~'):
278         op = s.sy
279         pos = s.position()
280         s.next()
281         return ExprNodes.unop_node(pos, op, p_factor(s))
282     elif sy == '&':
283         pos = s.position()
284         s.next()
285         arg = p_factor(s)
286         return ExprNodes.AmpersandNode(pos, operand = arg)
287     elif sy == "<":
288         return p_typecast(s)
289     elif sy == 'IDENT' and s.systring == "sizeof":
290         return p_sizeof(s)
291     else:
292         return p_power(s)
293
294 def p_typecast(s):
295     # s.sy == "<"
296     pos = s.position()
297     s.next()
298     base_type = p_c_base_type(s)
299     if base_type.name is None:
300         s.error("Unknown type")
301     declarator = p_c_declarator(s, empty = 1)
302     if s.sy == '?':
303         s.next()
304         typecheck = 1
305     else:
306         typecheck = 0
307     s.expect(">")
308     operand = p_factor(s)
309     return ExprNodes.TypecastNode(pos,
310         base_type = base_type,
311         declarator = declarator,
312         operand = operand,
313         typecheck = typecheck)
314
315 def p_sizeof(s):
316     # s.sy == ident "sizeof"
317     pos = s.position()
318     s.next()
319     s.expect('(')
320     # Here we decide if we are looking at an expression or type
321     # If it is actually a type, but parsable as an expression,
322     # we treat it as an expression here.
323     if looking_at_expr(s):
324         operand = p_test(s)
325         node = ExprNodes.SizeofVarNode(pos, operand = operand)
326     else:
327         base_type = p_c_base_type(s)
328         declarator = p_c_declarator(s, empty = 1)
329         node = ExprNodes.SizeofTypeNode(pos,
330             base_type = base_type, declarator = declarator)
331     s.expect(')')
332     return node
333
334 def p_yield_expression(s):
335     # s.sy == "yield"
336     pos = s.position()
337     s.next()
338     if s.sy != ')' and s.sy not in statement_terminators:
339         arg = p_testlist(s)
340     else:
341         arg = None
342     return ExprNodes.YieldExprNode(pos, arg=arg)
343
344 def p_yield_statement(s):
345     # s.sy == "yield"
346     yield_expr = p_yield_expression(s)
347     return Nodes.ExprStatNode(yield_expr.pos, expr=yield_expr)
348
349 #power: atom trailer* ('**' factor)*
350
351 def p_power(s):
352     if s.systring == 'new' and s.peek()[0] == 'IDENT':
353         return p_new_expr(s)
354     n1 = p_atom(s)
355     while s.sy in ('(', '[', '.'):
356         n1 = p_trailer(s, n1)
357     if s.sy == '**':
358         pos = s.position()
359         s.next()
360         n2 = p_factor(s)
361         n1 = ExprNodes.binop_node(pos, '**', n1, n2)
362     return n1
363
364 def p_new_expr(s):
365     # s.systring == 'new'.
366     pos = s.position()
367     s.next()
368     cppclass = p_c_base_type(s)
369     return p_call(s, ExprNodes.NewExprNode(pos, cppclass = cppclass))
370
371 #trailer: '(' [arglist] ')' | '[' subscriptlist ']' | '.' NAME
372
373 def p_trailer(s, node1):
374     pos = s.position()
375     if s.sy == '(':
376         return p_call(s, node1)
377     elif s.sy == '[':
378         return p_index(s, node1)
379     else: # s.sy == '.'
380         s.next()
381         name = EncodedString( p_ident(s) )
382         return ExprNodes.AttributeNode(pos,
383             obj = node1, attribute = name)
384
385 # arglist:  argument (',' argument)* [',']
386 # argument: [test '='] test       # Really [keyword '='] test
387
388 def p_call_parse_args(s, allow_genexp = True):
389     # s.sy == '('
390     pos = s.position()
391     s.next()
392     positional_args = []
393     keyword_args = []
394     star_arg = None
395     starstar_arg = None
396     while s.sy not in ('**', ')'):
397         if s.sy == '*':
398             if star_arg:
399                 s.error("only one star-arg parameter allowed",
400                     pos = s.position())
401             s.next()
402             star_arg = p_test(s)
403         else:
404             arg = p_test(s)
405             if s.sy == '=':
406                 s.next()
407                 if not arg.is_name:
408                     s.error("Expected an identifier before '='",
409                         pos = arg.pos)
410                 encoded_name = EncodedString(arg.name)
411                 keyword = ExprNodes.IdentifierStringNode(arg.pos, value = encoded_name)
412                 arg = p_test(s)
413                 keyword_args.append((keyword, arg))
414             else:
415                 if keyword_args:
416                     s.error("Non-keyword arg following keyword arg",
417                         pos = arg.pos)
418                 if star_arg:
419                     s.error("Non-keyword arg following star-arg",
420                         pos = arg.pos)
421                 positional_args.append(arg)
422         if s.sy != ',':
423             break
424         s.next()
425
426     if s.sy == 'for':
427         if len(positional_args) == 1 and not star_arg:
428             positional_args = [ p_genexp(s, positional_args[0]) ]
429     elif s.sy == '**':
430         s.next()
431         starstar_arg = p_test(s)
432         if s.sy == ',':
433             s.next()
434     s.expect(')')
435     return positional_args, keyword_args, star_arg, starstar_arg
436
437 def p_call_build_packed_args(pos, positional_args, keyword_args, star_arg):
438     arg_tuple = None
439     keyword_dict = None
440     if positional_args or not star_arg:
441         arg_tuple = ExprNodes.TupleNode(pos,
442             args = positional_args)
443     if star_arg:
444         star_arg_tuple = ExprNodes.AsTupleNode(pos, arg = star_arg)
445         if arg_tuple:
446             arg_tuple = ExprNodes.binop_node(pos,
447                 operator = '+', operand1 = arg_tuple,
448                 operand2 = star_arg_tuple)
449         else:
450             arg_tuple = star_arg_tuple
451     if keyword_args:
452         keyword_args = [ExprNodes.DictItemNode(pos=key.pos, key=key, value=value)
453                           for key, value in keyword_args]
454         keyword_dict = ExprNodes.DictNode(pos,
455             key_value_pairs = keyword_args)
456     return arg_tuple, keyword_dict
457
458 def p_call(s, function):
459     # s.sy == '('
460     pos = s.position()
461
462     positional_args, keyword_args, star_arg, starstar_arg = \
463                      p_call_parse_args(s)
464
465     if not (keyword_args or star_arg or starstar_arg):
466         return ExprNodes.SimpleCallNode(pos,
467             function = function,
468             args = positional_args)
469     else:
470         arg_tuple, keyword_dict = p_call_build_packed_args(
471             pos, positional_args, keyword_args, star_arg)
472         return ExprNodes.GeneralCallNode(pos,
473             function = function,
474             positional_args = arg_tuple,
475             keyword_args = keyword_dict,
476             starstar_arg = starstar_arg)
477
478 #lambdef: 'lambda' [varargslist] ':' test
479
480 #subscriptlist: subscript (',' subscript)* [',']
481
482 def p_index(s, base):
483     # s.sy == '['
484     pos = s.position()
485     s.next()
486     subscripts = p_subscript_list(s)
487     if len(subscripts) == 1 and len(subscripts[0]) == 2:
488         start, stop = subscripts[0]
489         result = ExprNodes.SliceIndexNode(pos,
490             base = base, start = start, stop = stop)
491     else:
492         indexes = make_slice_nodes(pos, subscripts)
493         if len(indexes) == 1:
494             index = indexes[0]
495         else:
496             index = ExprNodes.TupleNode(pos, args = indexes)
497         result = ExprNodes.IndexNode(pos,
498             base = base, index = index)
499     s.expect(']')
500     return result
501
502 def p_subscript_list(s):
503     items = [p_subscript(s)]
504     while s.sy == ',':
505         s.next()
506         if s.sy == ']':
507             break
508         items.append(p_subscript(s))
509     return items
510
511 #subscript: '.' '.' '.' | test | [test] ':' [test] [':' [test]]
512
513 def p_subscript(s):
514     # Parse a subscript and return a list of
515     # 1, 2 or 3 ExprNodes, depending on how
516     # many slice elements were encountered.
517     pos = s.position()
518     start = p_slice_element(s, (':',))
519     if s.sy != ':':
520         return [start]
521     s.next()
522     stop = p_slice_element(s, (':', ',', ']'))
523     if s.sy != ':':
524         return [start, stop]
525     s.next()
526     step = p_slice_element(s, (':', ',', ']'))
527     return [start, stop, step]
528
529 def p_slice_element(s, follow_set):
530     # Simple expression which may be missing iff
531     # it is followed by something in follow_set.
532     if s.sy not in follow_set:
533         return p_test(s)
534     else:
535         return None
536
537 def expect_ellipsis(s):
538     s.expect('.')
539     s.expect('.')
540     s.expect('.')
541
542 def make_slice_nodes(pos, subscripts):
543     # Convert a list of subscripts as returned
544     # by p_subscript_list into a list of ExprNodes,
545     # creating SliceNodes for elements with 2 or
546     # more components.
547     result = []
548     for subscript in subscripts:
549         if len(subscript) == 1:
550             result.append(subscript[0])
551         else:
552             result.append(make_slice_node(pos, *subscript))
553     return result
554
555 def make_slice_node(pos, start, stop = None, step = None):
556     if not start:
557         start = ExprNodes.NoneNode(pos)
558     if not stop:
559         stop = ExprNodes.NoneNode(pos)
560     if not step:
561         step = ExprNodes.NoneNode(pos)
562     return ExprNodes.SliceNode(pos,
563         start = start, stop = stop, step = step)
564
565 #atom: '(' [yield_expr|testlist_comp] ')' | '[' [listmaker] ']' | '{' [dict_or_set_maker] '}' | '`' testlist '`' | NAME | NUMBER | STRING+
566
567 def p_atom(s):
568     pos = s.position()
569     sy = s.sy
570     if sy == '(':
571         s.next()
572         if s.sy == ')':
573             result = ExprNodes.TupleNode(pos, args = [])
574         elif s.sy == 'yield':
575             result = p_yield_expression(s)
576         else:
577             result = p_testlist_comp(s)
578         s.expect(')')
579         return result
580     elif sy == '[':
581         return p_list_maker(s)
582     elif sy == '{':
583         return p_dict_or_set_maker(s)
584     elif sy == '`':
585         return p_backquote_expr(s)
586     elif sy == '.':
587         expect_ellipsis(s)
588         return ExprNodes.EllipsisNode(pos)
589     elif sy == 'INT':
590         return p_int_literal(s)
591     elif sy == 'FLOAT':
592         value = s.systring
593         s.next()
594         return ExprNodes.FloatNode(pos, value = value)
595     elif sy == 'IMAG':
596         value = s.systring[:-1]
597         s.next()
598         return ExprNodes.ImagNode(pos, value = value)
599     elif sy == 'BEGIN_STRING':
600         kind, bytes_value, unicode_value = p_cat_string_literal(s)
601         if kind == 'c':
602             return ExprNodes.CharNode(pos, value = bytes_value)
603         elif kind == 'u':
604             return ExprNodes.UnicodeNode(pos, value = unicode_value, bytes_value = bytes_value)
605         elif kind == 'b':
606             return ExprNodes.BytesNode(pos, value = bytes_value)
607         else:
608             return ExprNodes.StringNode(pos, value = bytes_value, unicode_value = unicode_value)
609     elif sy == 'IDENT':
610         name = EncodedString( s.systring )
611         s.next()
612         if name == "None":
613             return ExprNodes.NoneNode(pos)
614         elif name == "True":
615             return ExprNodes.BoolNode(pos, value=True)
616         elif name == "False":
617             return ExprNodes.BoolNode(pos, value=False)
618         elif name == "NULL":
619             return ExprNodes.NullNode(pos)
620         else:
621             return p_name(s, name)
622     else:
623         s.error("Expected an identifier or literal")
624
625 def p_int_literal(s):
626     pos = s.position()
627     value = s.systring
628     s.next()
629     unsigned = ""
630     longness = ""
631     while value[-1] in u"UuLl":
632         if value[-1] in u"Ll":
633             longness += "L"
634         else:
635             unsigned += "U"
636         value = value[:-1]
637     # '3L' is ambiguous in Py2 but not in Py3.  '3U' and '3LL' are
638     # illegal in Py2 Python files.  All suffixes are illegal in Py3
639     # Python files.
640     is_c_literal = None
641     if unsigned:
642         is_c_literal = True
643     elif longness:
644         if longness == 'LL' or s.context.language_level >= 3:
645             is_c_literal = True
646     if s.in_python_file:
647         if is_c_literal:
648             error(pos, "illegal integer literal syntax in Python source file")
649         is_c_literal = False
650     return ExprNodes.IntNode(pos,
651                              is_c_literal = is_c_literal,
652                              value = value,
653                              unsigned = unsigned,
654                              longness = longness)
655
656 def p_name(s, name):
657     pos = s.position()
658     if not s.compile_time_expr and name in s.compile_time_env:
659         value = s.compile_time_env.lookup_here(name)
660         rep = repr(value)
661         if isinstance(value, bool):
662             return ExprNodes.BoolNode(pos, value = value)
663         elif isinstance(value, int):
664             return ExprNodes.IntNode(pos, value = rep)
665         elif isinstance(value, long):
666             return ExprNodes.IntNode(pos, value = rep, longness = "L")
667         elif isinstance(value, float):
668             return ExprNodes.FloatNode(pos, value = rep)
669         elif isinstance(value, _unicode):
670             return ExprNodes.UnicodeNode(pos, value = value)
671         elif isinstance(value, _bytes):
672             return ExprNodes.BytesNode(pos, value = value)
673         else:
674             error(pos, "Invalid type for compile-time constant: %s"
675                 % value.__class__.__name__)
676     return ExprNodes.NameNode(pos, name = name)
677
678 def p_cat_string_literal(s):
679     # A sequence of one or more adjacent string literals.
680     # Returns (kind, bytes_value, unicode_value)
681     # where kind in ('b', 'c', 'u', '')
682     kind, bytes_value, unicode_value = p_string_literal(s)
683     if kind == 'c' or s.sy != 'BEGIN_STRING':
684         return kind, bytes_value, unicode_value
685     bstrings, ustrings = [bytes_value], [unicode_value]
686     bytes_value = unicode_value = None
687     while s.sy == 'BEGIN_STRING':
688         pos = s.position()
689         next_kind, next_bytes_value, next_unicode_value = p_string_literal(s)
690         if next_kind == 'c':
691             error(pos, "Cannot concatenate char literal with another string or char literal")
692         elif next_kind != kind:
693             error(pos, "Cannot mix string literals of different types, expected %s'', got %s''" %
694                   (kind, next_kind))
695         else:
696             bstrings.append(next_bytes_value)
697             ustrings.append(next_unicode_value)
698     # join and rewrap the partial literals
699     if kind in ('b', 'c', '') or kind == 'u' and None not in bstrings:
700         # Py3 enforced unicode literals are parsed as bytes/unicode combination
701         bytes_value = BytesLiteral( StringEncoding.join_bytes(bstrings) )
702         bytes_value.encoding = s.source_encoding
703     if kind in ('u', ''):
704         unicode_value = EncodedString( u''.join([ u for u in ustrings if u is not None ]) )
705     return kind, bytes_value, unicode_value
706
707 def p_opt_string_literal(s, required_type='u'):
708     if s.sy == 'BEGIN_STRING':
709         kind, bytes_value, unicode_value = p_string_literal(s, required_type)
710         if required_type == 'u':
711             return unicode_value
712         elif required_type == 'b':
713             return bytes_value
714         else:
715             s.error("internal parser configuration error")
716     else:
717         return None
718
719 def check_for_non_ascii_characters(string):
720     for c in string:
721         if c >= u'\x80':
722             return True
723     return False
724
725 def p_string_literal(s, kind_override=None):
726     # A single string or char literal.  Returns (kind, bvalue, uvalue)
727     # where kind in ('b', 'c', 'u', '').  The 'bvalue' is the source
728     # code byte sequence of the string literal, 'uvalue' is the
729     # decoded Unicode string.  Either of the two may be None depending
730     # on the 'kind' of string, only unprefixed strings have both
731     # representations.
732
733     # s.sy == 'BEGIN_STRING'
734     pos = s.position()
735     is_raw = 0
736     is_python3_source = s.context.language_level >= 3
737     has_non_ASCII_literal_characters = False
738     kind = s.systring[:1].lower()
739     if kind == 'r':
740         kind = ''
741         is_raw = 1
742     elif kind in 'ub':
743         is_raw = s.systring[1:2].lower() == 'r'
744     elif kind != 'c':
745         kind = ''
746     if kind == '' and kind_override is None and Future.unicode_literals in s.context.future_directives:
747         chars = StringEncoding.StrLiteralBuilder(s.source_encoding)
748         kind = 'u'
749     else:
750         if kind_override is not None and kind_override in 'ub':
751             kind = kind_override
752         if kind == 'u':
753             chars = StringEncoding.UnicodeLiteralBuilder()
754         elif kind == '':
755             chars = StringEncoding.StrLiteralBuilder(s.source_encoding)
756         else:
757             chars = StringEncoding.BytesLiteralBuilder(s.source_encoding)
758     while 1:
759         s.next()
760         sy = s.sy
761         systr = s.systring
762         #print "p_string_literal: sy =", sy, repr(s.systring) ###
763         if sy == 'CHARS':
764             chars.append(systr)
765             if is_python3_source and not has_non_ASCII_literal_characters and check_for_non_ascii_characters(systr):
766                 has_non_ASCII_literal_characters = True
767         elif sy == 'ESCAPE':
768             if is_raw:
769                 chars.append(systr)
770                 if is_python3_source and not has_non_ASCII_literal_characters \
771                        and check_for_non_ascii_characters(systr):
772                     has_non_ASCII_literal_characters = True
773             else:
774                 c = systr[1]
775                 if c in u"01234567":
776                     chars.append_charval( int(systr[1:], 8) )
777                 elif c in u"'\"\\":
778                     chars.append(c)
779                 elif c in u"abfnrtv":
780                     chars.append(
781                         StringEncoding.char_from_escape_sequence(systr))
782                 elif c == u'\n':
783                     pass
784                 elif c == u'x':
785                     if len(systr) == 4:
786                         chars.append_charval( int(systr[2:], 16) )
787                     else:
788                         s.error("Invalid hex escape '%s'" % systr)
789                 elif c in u'Uu':
790                     if kind in ('u', ''):
791                         if len(systr) in (6,10):
792                             chrval = int(systr[2:], 16)
793                             if chrval > 1114111: # sys.maxunicode:
794                                 s.error("Invalid unicode escape '%s'" % systr)
795                         else:
796                             s.error("Invalid unicode escape '%s'" % systr)
797                     else:
798                         # unicode escapes in byte strings are not unescaped
799                         chrval = None
800                     chars.append_uescape(chrval, systr)
801                 else:
802                     chars.append(u'\\' + systr[1:])
803                     if is_python3_source and not has_non_ASCII_literal_characters \
804                            and check_for_non_ascii_characters(systr):
805                         has_non_ASCII_literal_characters = True
806         elif sy == 'NEWLINE':
807             chars.append(u'\n')
808         elif sy == 'END_STRING':
809             break
810         elif sy == 'EOF':
811             s.error("Unclosed string literal", pos = pos)
812         else:
813             s.error(
814                 "Unexpected token %r:%r in string literal" %
815                     (sy, s.systring))
816     if kind == 'c':
817         unicode_value = None
818         bytes_value = chars.getchar()
819         if len(bytes_value) != 1:
820             error(pos, u"invalid character literal: %r" % bytes_value)
821     else:
822         bytes_value, unicode_value = chars.getstrings()
823         if is_python3_source and has_non_ASCII_literal_characters:
824             # Python 3 forbids literal non-ASCII characters in byte strings
825             if kind != 'u':
826                 s.error("bytes can only contain ASCII literal characters.", pos = pos)
827             bytes_value = None
828     s.next()
829     return (kind, bytes_value, unicode_value)
830
831 # list_display      ::=      "[" [listmaker] "]"
832 # listmaker     ::=     expression ( comp_for | ( "," expression )* [","] )
833 # comp_iter     ::=     comp_for | comp_if
834 # comp_for     ::=     "for" expression_list "in" testlist [comp_iter]
835 # comp_if     ::=     "if" test [comp_iter]
836
837 def p_list_maker(s):
838     # s.sy == '['
839     pos = s.position()
840     s.next()
841     if s.sy == ']':
842         s.expect(']')
843         return ExprNodes.ListNode(pos, args = [])
844     expr = p_test(s)
845     if s.sy == 'for':
846         target = ExprNodes.ListNode(pos, args = [])
847         append = ExprNodes.ComprehensionAppendNode(
848             pos, expr=expr, target=ExprNodes.CloneNode(target))
849         loop = p_comp_for(s, append)
850         s.expect(']')
851         return ExprNodes.ComprehensionNode(
852             pos, loop=loop, append=append, target=target,
853             # list comprehensions leak their loop variable in Py2
854             has_local_scope = s.context.language_level >= 3)
855     else:
856         if s.sy == ',':
857             s.next()
858             exprs = p_simple_expr_list(s, expr)
859         else:
860             exprs = [expr]
861         s.expect(']')
862         return ExprNodes.ListNode(pos, args = exprs)
863
864 def p_comp_iter(s, body):
865     if s.sy == 'for':
866         return p_comp_for(s, body)
867     elif s.sy == 'if':
868         return p_comp_if(s, body)
869     else:
870         # insert the 'append' operation into the loop
871         return body
872
873 def p_comp_for(s, body):
874     # s.sy == 'for'
875     pos = s.position()
876     s.next()
877     kw = p_for_bounds(s, allow_testlist=False)
878     kw.update(dict(else_clause = None, body = p_comp_iter(s, body)))
879     return Nodes.ForStatNode(pos, **kw)
880
881 def p_comp_if(s, body):
882     # s.sy == 'if'
883     pos = s.position()
884     s.next()
885     test = p_test_nocond(s)
886     return Nodes.IfStatNode(pos,
887         if_clauses = [Nodes.IfClauseNode(pos, condition = test,
888                                          body = p_comp_iter(s, body))],
889         else_clause = None )
890
891 #dictmaker: test ':' test (',' test ':' test)* [',']
892
893 def p_dict_or_set_maker(s):
894     # s.sy == '{'
895     pos = s.position()
896     s.next()
897     if s.sy == '}':
898         s.next()
899         return ExprNodes.DictNode(pos, key_value_pairs = [])
900     item = p_test(s)
901     if s.sy == ',' or s.sy == '}':
902         # set literal
903         values = [item]
904         while s.sy == ',':
905             s.next()
906             if s.sy == '}':
907                 break
908             values.append( p_test(s) )
909         s.expect('}')
910         return ExprNodes.SetNode(pos, args=values)
911     elif s.sy == 'for':
912         # set comprehension
913         target = ExprNodes.SetNode(pos, args=[])
914         append = ExprNodes.ComprehensionAppendNode(
915             item.pos, expr=item, target=ExprNodes.CloneNode(target))
916         loop = p_comp_for(s, append)
917         s.expect('}')
918         return ExprNodes.ComprehensionNode(
919             pos, loop=loop, append=append, target=target)
920     elif s.sy == ':':
921         # dict literal or comprehension
922         key = item
923         s.next()
924         value = p_test(s)
925         if s.sy == 'for':
926             # dict comprehension
927             target = ExprNodes.DictNode(pos, key_value_pairs = [])
928             append = ExprNodes.DictComprehensionAppendNode(
929                 item.pos, key_expr=key, value_expr=value,
930                 target=ExprNodes.CloneNode(target))
931             loop = p_comp_for(s, append)
932             s.expect('}')
933             return ExprNodes.ComprehensionNode(
934                 pos, loop=loop, append=append, target=target)
935         else:
936             # dict literal
937             items = [ExprNodes.DictItemNode(key.pos, key=key, value=value)]
938             while s.sy == ',':
939                 s.next()
940                 if s.sy == '}':
941                     break
942                 key = p_test(s)
943                 s.expect(':')
944                 value = p_test(s)
945                 items.append(
946                     ExprNodes.DictItemNode(key.pos, key=key, value=value))
947             s.expect('}')
948             return ExprNodes.DictNode(pos, key_value_pairs=items)
949     else:
950         # raise an error
951         s.expect('}')
952     return ExprNodes.DictNode(pos, key_value_pairs = [])
953
954 # NOTE: no longer in Py3 :)
955 def p_backquote_expr(s):
956     # s.sy == '`'
957     pos = s.position()
958     s.next()
959     args = [p_test(s)]
960     while s.sy == ',':
961         s.next()
962         args.append(p_test(s))
963     s.expect('`')
964     if len(args) == 1:
965         arg = args[0]
966     else:
967         arg = ExprNodes.TupleNode(pos, args = args)
968     return ExprNodes.BackquoteNode(pos, arg = arg)
969
970 def p_simple_expr_list(s, expr=None):
971     exprs = expr is not None and [expr] or []
972     while s.sy not in expr_terminators:
973         exprs.append( p_test(s) )
974         if s.sy != ',':
975             break
976         s.next()
977     return exprs
978
979 def p_test_or_starred_expr_list(s, expr=None):
980     exprs = expr is not None and [expr] or []
981     while s.sy not in expr_terminators:
982         exprs.append( p_test_or_starred_expr(s) )
983         if s.sy != ',':
984             break
985         s.next()
986     return exprs
987
988
989 #testlist: test (',' test)* [',']
990
991 def p_testlist(s):
992     pos = s.position()
993     expr = p_test(s)
994     if s.sy == ',':
995         s.next()
996         exprs = p_simple_expr_list(s, expr)
997         return ExprNodes.TupleNode(pos, args = exprs)
998     else:
999         return expr
1000
1001 # testlist_star_expr: (test|star_expr) ( comp_for | (',' (test|star_expr))* [','] )
1002
1003 def p_testlist_star_expr(s):
1004     pos = s.position()
1005     expr = p_test_or_starred_expr(s)
1006     if s.sy == ',':
1007         s.next()
1008         exprs = p_test_or_starred_expr_list(s, expr)
1009         return ExprNodes.TupleNode(pos, args = exprs)
1010     else:
1011         return expr
1012
1013 # testlist_comp: (test|star_expr) ( comp_for | (',' (test|star_expr))* [','] )
1014
1015 def p_testlist_comp(s):
1016     pos = s.position()
1017     expr = p_test_or_starred_expr(s)
1018     if s.sy == ',':
1019         s.next()
1020         exprs = p_test_or_starred_expr_list(s, expr)
1021         return ExprNodes.TupleNode(pos, args = exprs)
1022     elif s.sy == 'for':
1023         return p_genexp(s, expr)
1024     else:
1025         return expr
1026
1027 def p_genexp(s, expr):
1028     # s.sy == 'for'
1029     loop = p_comp_for(s, Nodes.ExprStatNode(
1030         expr.pos, expr = ExprNodes.YieldExprNode(expr.pos, arg=expr)))
1031     return ExprNodes.GeneratorExpressionNode(expr.pos, loop=loop)
1032
1033 expr_terminators = (')', ']', '}', ':', '=', 'NEWLINE')
1034
1035 #-------------------------------------------------------
1036 #
1037 #   Statements
1038 #
1039 #-------------------------------------------------------
1040
1041 def p_global_statement(s):
1042     # assume s.sy == 'global'
1043     pos = s.position()
1044     s.next()
1045     names = p_ident_list(s)
1046     return Nodes.GlobalNode(pos, names = names)
1047
1048 def p_expression_or_assignment(s):
1049     expr_list = [p_testlist_star_expr(s)]
1050     while s.sy == '=':
1051         s.next()
1052         if s.sy == 'yield':
1053             expr = p_yield_expression(s)
1054         else:
1055             expr = p_testlist_star_expr(s)
1056         expr_list.append(expr)
1057     if len(expr_list) == 1:
1058         if re.match(r"([+*/\%^\&|-]|<<|>>|\*\*|//)=", s.sy):
1059             lhs = expr_list[0]
1060             if not isinstance(lhs, (ExprNodes.AttributeNode, ExprNodes.IndexNode, ExprNodes.NameNode) ):
1061                 error(lhs.pos, "Illegal operand for inplace operation.")
1062             operator = s.sy[:-1]
1063             s.next()
1064             if s.sy == 'yield':
1065                 rhs = p_yield_expression(s)
1066             else:
1067                 rhs = p_testlist(s)
1068             return Nodes.InPlaceAssignmentNode(lhs.pos, operator = operator, lhs = lhs, rhs = rhs)
1069         expr = expr_list[0]
1070         if isinstance(expr, (ExprNodes.UnicodeNode, ExprNodes.StringNode, ExprNodes.BytesNode)):
1071             return Nodes.PassStatNode(expr.pos)
1072         else:
1073             return Nodes.ExprStatNode(expr.pos, expr = expr)
1074
1075     rhs = expr_list[-1]
1076     if len(expr_list) == 2:
1077         return Nodes.SingleAssignmentNode(rhs.pos,
1078             lhs = expr_list[0], rhs = rhs)
1079     else:
1080         return Nodes.CascadedAssignmentNode(rhs.pos,
1081             lhs_list = expr_list[:-1], rhs = rhs)
1082
1083 def p_print_statement(s):
1084     # s.sy == 'print'
1085     pos = s.position()
1086     ends_with_comma = 0
1087     s.next()
1088     if s.sy == '>>':
1089         s.next()
1090         stream = p_test(s)
1091         if s.sy == ',':
1092             s.next()
1093             ends_with_comma = s.sy in ('NEWLINE', 'EOF')
1094     else:
1095         stream = None
1096     args = []
1097     if s.sy not in ('NEWLINE', 'EOF'):
1098         args.append(p_test(s))
1099         while s.sy == ',':
1100             s.next()
1101             if s.sy in ('NEWLINE', 'EOF'):
1102                 ends_with_comma = 1
1103                 break
1104             args.append(p_test(s))
1105     arg_tuple = ExprNodes.TupleNode(pos, args = args)
1106     return Nodes.PrintStatNode(pos,
1107         arg_tuple = arg_tuple, stream = stream,
1108         append_newline = not ends_with_comma)
1109
1110 def p_exec_statement(s):
1111     # s.sy == 'exec'
1112     pos = s.position()
1113     s.next()
1114     args = [ p_bit_expr(s) ]
1115     if s.sy == 'in':
1116         s.next()
1117         args.append(p_test(s))
1118         if s.sy == ',':
1119             s.next()
1120             args.append(p_test(s))
1121     else:
1122         error(pos, "'exec' currently requires a target mapping (globals/locals)")
1123     return Nodes.ExecStatNode(pos, args = args)
1124
1125 def p_del_statement(s):
1126     # s.sy == 'del'
1127     pos = s.position()
1128     s.next()
1129     # FIXME: 'exprlist' in Python
1130     args = p_simple_expr_list(s)
1131     return Nodes.DelStatNode(pos, args = args)
1132
1133 def p_pass_statement(s, with_newline = 0):
1134     pos = s.position()
1135     s.expect('pass')
1136     if with_newline:
1137         s.expect_newline("Expected a newline")
1138     return Nodes.PassStatNode(pos)
1139
1140 def p_break_statement(s):
1141     # s.sy == 'break'
1142     pos = s.position()
1143     s.next()
1144     return Nodes.BreakStatNode(pos)
1145
1146 def p_continue_statement(s):
1147     # s.sy == 'continue'
1148     pos = s.position()
1149     s.next()
1150     return Nodes.ContinueStatNode(pos)
1151
1152 def p_return_statement(s):
1153     # s.sy == 'return'
1154     pos = s.position()
1155     s.next()
1156     if s.sy not in statement_terminators:
1157         value = p_testlist(s)
1158     else:
1159         value = None
1160     return Nodes.ReturnStatNode(pos, value = value)
1161
1162 def p_raise_statement(s):
1163     # s.sy == 'raise'
1164     pos = s.position()
1165     s.next()
1166     exc_type = None
1167     exc_value = None
1168     exc_tb = None
1169     cause = None
1170     if s.sy not in statement_terminators:
1171         exc_type = p_test(s)
1172         if s.sy == ',':
1173             s.next()
1174             exc_value = p_test(s)
1175             if s.sy == ',':
1176                 s.next()
1177                 exc_tb = p_test(s)
1178         elif s.sy == 'from':
1179             s.next()
1180             cause = p_test(s)
1181     if exc_type or exc_value or exc_tb:
1182         return Nodes.RaiseStatNode(pos,
1183             exc_type = exc_type,
1184             exc_value = exc_value,
1185             exc_tb = exc_tb,
1186             cause = cause)
1187     else:
1188         return Nodes.ReraiseStatNode(pos)
1189
1190 def p_import_statement(s):
1191     # s.sy in ('import', 'cimport')
1192     pos = s.position()
1193     kind = s.sy
1194     s.next()
1195     items = [p_dotted_name(s, as_allowed = 1)]
1196     while s.sy == ',':
1197         s.next()
1198         items.append(p_dotted_name(s, as_allowed = 1))
1199     stats = []
1200     for pos, target_name, dotted_name, as_name in items:
1201         dotted_name = EncodedString(dotted_name)
1202         if kind == 'cimport':
1203             stat = Nodes.CImportStatNode(pos,
1204                 module_name = dotted_name,
1205                 as_name = as_name)
1206         else:
1207             if as_name and "." in dotted_name:
1208                 name_list = ExprNodes.ListNode(pos, args = [
1209                         ExprNodes.IdentifierStringNode(pos, value = EncodedString("*"))])
1210             else:
1211                 name_list = None
1212             stat = Nodes.SingleAssignmentNode(pos,
1213                 lhs = ExprNodes.NameNode(pos,
1214                     name = as_name or target_name),
1215                 rhs = ExprNodes.ImportNode(pos,
1216                     module_name = ExprNodes.IdentifierStringNode(
1217                         pos, value = dotted_name),
1218                     name_list = name_list))
1219         stats.append(stat)
1220     return Nodes.StatListNode(pos, stats = stats)
1221
1222 def p_from_import_statement(s, first_statement = 0):
1223     # s.sy == 'from'
1224     pos = s.position()
1225     s.next()
1226     (dotted_name_pos, _, dotted_name, _) = \
1227         p_dotted_name(s, as_allowed = 0)
1228     if s.sy in ('import', 'cimport'):
1229         kind = s.sy
1230         s.next()
1231     else:
1232         s.error("Expected 'import' or 'cimport'")
1233     is_cimport = kind == 'cimport'
1234     is_parenthesized = False
1235     if s.sy == '*':
1236         imported_names = [(s.position(), "*", None, None)]
1237         s.next()
1238     else:
1239         if s.sy == '(':
1240             is_parenthesized = True
1241             s.next()
1242         imported_names = [p_imported_name(s, is_cimport)]
1243     while s.sy == ',':
1244         s.next()
1245         if is_parenthesized and s.sy == ')':
1246             break
1247         imported_names.append(p_imported_name(s, is_cimport))
1248     if is_parenthesized:
1249         s.expect(')')
1250     dotted_name = EncodedString(dotted_name)
1251     if dotted_name == '__future__':
1252         if not first_statement:
1253             s.error("from __future__ imports must occur at the beginning of the file")
1254         else:
1255             for (name_pos, name, as_name, kind) in imported_names:
1256                 if name == "braces":
1257                     s.error("not a chance", name_pos)
1258                     break
1259                 try:
1260                     directive = getattr(Future, name)
1261                 except AttributeError:
1262                     s.error("future feature %s is not defined" % name, name_pos)
1263                     break
1264                 s.context.future_directives.add(directive)
1265         return Nodes.PassStatNode(pos)
1266     elif kind == 'cimport':
1267         return Nodes.FromCImportStatNode(pos,
1268             module_name = dotted_name,
1269             imported_names = imported_names)
1270     else:
1271         imported_name_strings = []
1272         items = []
1273         for (name_pos, name, as_name, kind) in imported_names:
1274             encoded_name = EncodedString(name)
1275             imported_name_strings.append(
1276                 ExprNodes.IdentifierStringNode(name_pos, value = encoded_name))
1277             items.append(
1278                 (name,
1279                  ExprNodes.NameNode(name_pos,
1280                                     name = as_name or name)))
1281         import_list = ExprNodes.ListNode(
1282             imported_names[0][0], args = imported_name_strings)
1283         dotted_name = EncodedString(dotted_name)
1284         return Nodes.FromImportStatNode(pos,
1285             module = ExprNodes.ImportNode(dotted_name_pos,
1286                 module_name = ExprNodes.IdentifierStringNode(pos, value = dotted_name),
1287                 name_list = import_list),
1288             items = items)
1289
1290 imported_name_kinds = ('class', 'struct', 'union')
1291
1292 def p_imported_name(s, is_cimport):
1293     pos = s.position()
1294     kind = None
1295     if is_cimport and s.systring in imported_name_kinds:
1296         kind = s.systring
1297         s.next()
1298     name = p_ident(s)
1299     as_name = p_as_name(s)
1300     return (pos, name, as_name, kind)
1301
1302 def p_dotted_name(s, as_allowed):
1303     pos = s.position()
1304     target_name = p_ident(s)
1305     as_name = None
1306     names = [target_name]
1307     while s.sy == '.':
1308         s.next()
1309         names.append(p_ident(s))
1310     if as_allowed:
1311         as_name = p_as_name(s)
1312     return (pos, target_name, u'.'.join(names), as_name)
1313
1314 def p_as_name(s):
1315     if s.sy == 'IDENT' and s.systring == 'as':
1316         s.next()
1317         return p_ident(s)
1318     else:
1319         return None
1320
1321 def p_assert_statement(s):
1322     # s.sy == 'assert'
1323     pos = s.position()
1324     s.next()
1325     cond = p_test(s)
1326     if s.sy == ',':
1327         s.next()
1328         value = p_test(s)
1329     else:
1330         value = None
1331     return Nodes.AssertStatNode(pos, cond = cond, value = value)
1332
1333 statement_terminators = (';', 'NEWLINE', 'EOF')
1334
1335 def p_if_statement(s):
1336     # s.sy == 'if'
1337     pos = s.position()
1338     s.next()
1339     if_clauses = [p_if_clause(s)]
1340     while s.sy == 'elif':
1341         s.next()
1342         if_clauses.append(p_if_clause(s))
1343     else_clause = p_else_clause(s)
1344     return Nodes.IfStatNode(pos,
1345         if_clauses = if_clauses, else_clause = else_clause)
1346
1347 def p_if_clause(s):
1348     pos = s.position()
1349     test = p_test(s)
1350     body = p_suite(s)
1351     return Nodes.IfClauseNode(pos,
1352         condition = test, body = body)
1353
1354 def p_else_clause(s):
1355     if s.sy == 'else':
1356         s.next()
1357         return p_suite(s)
1358     else:
1359         return None
1360
1361 def p_while_statement(s):
1362     # s.sy == 'while'
1363     pos = s.position()
1364     s.next()
1365     test = p_test(s)
1366     body = p_suite(s)
1367     else_clause = p_else_clause(s)
1368     return Nodes.WhileStatNode(pos,
1369         condition = test, body = body,
1370         else_clause = else_clause)
1371
1372 def p_for_statement(s):
1373     # s.sy == 'for'
1374     pos = s.position()
1375     s.next()
1376     kw = p_for_bounds(s, allow_testlist=True)
1377     body = p_suite(s)
1378     else_clause = p_else_clause(s)
1379     kw.update(dict(body = body, else_clause = else_clause))
1380     return Nodes.ForStatNode(pos, **kw)
1381
1382 def p_for_bounds(s, allow_testlist=True):
1383     target = p_for_target(s)
1384     if s.sy == 'in':
1385         s.next()
1386         iterator = p_for_iterator(s, allow_testlist)
1387         return dict( target = target, iterator = iterator )
1388     elif not s.in_python_file:
1389         if s.sy == 'from':
1390             s.next()
1391             bound1 = p_bit_expr(s)
1392         else:
1393             # Support shorter "for a <= x < b" syntax
1394             bound1, target = target, None
1395         rel1 = p_for_from_relation(s)
1396         name2_pos = s.position()
1397         name2 = p_ident(s)
1398         rel2_pos = s.position()
1399         rel2 = p_for_from_relation(s)
1400         bound2 = p_bit_expr(s)
1401         step = p_for_from_step(s)
1402         if target is None:
1403             target = ExprNodes.NameNode(name2_pos, name = name2)
1404         else:
1405             if not target.is_name:
1406                 error(target.pos,
1407                     "Target of for-from statement must be a variable name")
1408             elif name2 != target.name:
1409                 error(name2_pos,
1410                     "Variable name in for-from range does not match target")
1411         if rel1[0] != rel2[0]:
1412             error(rel2_pos,
1413                 "Relation directions in for-from do not match")
1414         return dict(target = target,
1415                     bound1 = bound1,
1416                     relation1 = rel1,
1417                     relation2 = rel2,
1418                     bound2 = bound2,
1419                     step = step,
1420                     )
1421     else:
1422         s.expect('in')
1423         return {}
1424
1425 def p_for_from_relation(s):
1426     if s.sy in inequality_relations:
1427         op = s.sy
1428         s.next()
1429         return op
1430     else:
1431         s.error("Expected one of '<', '<=', '>' '>='")
1432
1433 def p_for_from_step(s):
1434     if s.sy == 'by':
1435         s.next()
1436         step = p_bit_expr(s)
1437         return step
1438     else:
1439         return None
1440
1441 inequality_relations = ('<', '<=', '>', '>=')
1442
1443 def p_target(s, terminator):
1444     pos = s.position()
1445     expr = p_starred_expr(s)
1446     if s.sy == ',':
1447         s.next()
1448         exprs = [expr]
1449         while s.sy != terminator:
1450             exprs.append(p_starred_expr(s))
1451             if s.sy != ',':
1452                 break
1453             s.next()
1454         return ExprNodes.TupleNode(pos, args = exprs)
1455     else:
1456         return expr
1457
1458 def p_for_target(s):
1459     return p_target(s, 'in')
1460
1461 def p_for_iterator(s, allow_testlist=True):
1462     pos = s.position()
1463     if allow_testlist:
1464         expr = p_testlist(s)
1465     else:
1466         expr = p_or_test(s)
1467     return ExprNodes.IteratorNode(pos, sequence = expr)
1468
1469 def p_try_statement(s):
1470     # s.sy == 'try'
1471     pos = s.position()
1472     s.next()
1473     body = p_suite(s)
1474     except_clauses = []
1475     else_clause = None
1476     if s.sy in ('except', 'else'):
1477         while s.sy == 'except':
1478             except_clauses.append(p_except_clause(s))
1479         if s.sy == 'else':
1480             s.next()
1481             else_clause = p_suite(s)
1482         body = Nodes.TryExceptStatNode(pos,
1483             body = body, except_clauses = except_clauses,
1484             else_clause = else_clause)
1485         if s.sy != 'finally':
1486             return body
1487         # try-except-finally is equivalent to nested try-except/try-finally
1488     if s.sy == 'finally':
1489         s.next()
1490         finally_clause = p_suite(s)
1491         return Nodes.TryFinallyStatNode(pos,
1492             body = body, finally_clause = finally_clause)
1493     else:
1494         s.error("Expected 'except' or 'finally'")
1495
1496 def p_except_clause(s):
1497     # s.sy == 'except'
1498     pos = s.position()
1499     s.next()
1500     exc_type = None
1501     exc_value = None
1502     if s.sy != ':':
1503         exc_type = p_test(s)
1504         # normalise into list of single exception tests
1505         if isinstance(exc_type, ExprNodes.TupleNode):
1506             exc_type = exc_type.args
1507         else:
1508             exc_type = [exc_type]
1509         if s.sy == ',' or (s.sy == 'IDENT' and s.systring == 'as'):
1510             s.next()
1511             exc_value = p_test(s)
1512         elif s.sy == 'IDENT' and s.systring == 'as':
1513             # Py3 syntax requires a name here
1514             s.next()
1515             pos2 = s.position()
1516             name = p_ident(s)
1517             exc_value = ExprNodes.NameNode(pos2, name = name)
1518     body = p_suite(s)
1519     return Nodes.ExceptClauseNode(pos,
1520         pattern = exc_type, target = exc_value, body = body)
1521
1522 def p_include_statement(s, ctx):
1523     pos = s.position()
1524     s.next() # 'include'
1525     unicode_include_file_name = p_string_literal(s, 'u')[2]
1526     s.expect_newline("Syntax error in include statement")
1527     if s.compile_time_eval:
1528         include_file_name = unicode_include_file_name
1529         include_file_path = s.context.find_include_file(include_file_name, pos)
1530         if include_file_path:
1531             s.included_files.append(include_file_name)
1532             f = Utils.open_source_file(include_file_path, mode="rU")
1533             source_desc = FileSourceDescriptor(include_file_path)
1534             s2 = PyrexScanner(f, source_desc, s, source_encoding=f.encoding, parse_comments=s.parse_comments)
1535             try:
1536                 tree = p_statement_list(s2, ctx)
1537             finally:
1538                 f.close()
1539             return tree
1540         else:
1541             return None
1542     else:
1543         return Nodes.PassStatNode(pos)
1544
1545 def p_with_statement(s):
1546     s.next() # 'with'
1547     if s.systring == 'template' and not s.in_python_file:
1548         node = p_with_template(s)
1549     else:
1550         node = p_with_items(s)
1551     return node
1552
1553 def p_with_items(s):
1554     pos = s.position()
1555     if not s.in_python_file and s.sy == 'IDENT' and s.systring == 'nogil':
1556         state = s.systring
1557         s.next()
1558         if s.sy == ',':
1559             s.next()
1560             body = p_with_items(s)
1561         else:
1562             body = p_suite(s)
1563         return Nodes.GILStatNode(pos, state = state, body = body)
1564     else:
1565         manager = p_test(s)
1566         target = None
1567         if s.sy == 'IDENT' and s.systring == 'as':
1568             s.next()
1569             target = p_starred_expr(s)
1570         if s.sy == ',':
1571             s.next()
1572             body = p_with_items(s)
1573         else:
1574             body = p_suite(s)
1575     return Nodes.WithStatNode(pos, manager = manager,
1576                               target = target, body = body)
1577
1578 def p_with_template(s):
1579     pos = s.position()
1580     templates = []
1581     s.next()
1582     s.expect('[')
1583     templates.append(s.systring)
1584     s.next()
1585     while s.systring == ',':
1586         s.next()
1587         templates.append(s.systring)
1588         s.next()
1589     s.expect(']')
1590     if s.sy == ':':
1591         s.next()
1592         s.expect_newline("Syntax error in template function declaration")
1593         s.expect_indent()
1594         body_ctx = Ctx()
1595         body_ctx.templates = templates
1596         func_or_var = p_c_func_or_var_declaration(s, pos, body_ctx)
1597         s.expect_dedent()
1598         return func_or_var
1599     else:
1600         error(pos, "Syntax error in template function declaration")
1601
1602 def p_simple_statement(s, first_statement = 0):
1603     #print "p_simple_statement:", s.sy, s.systring ###
1604     if s.sy == 'global':
1605         node = p_global_statement(s)
1606     elif s.sy == 'print':
1607         node = p_print_statement(s)
1608     elif s.sy == 'exec':
1609         node = p_exec_statement(s)
1610     elif s.sy == 'del':
1611         node = p_del_statement(s)
1612     elif s.sy == 'break':
1613         node = p_break_statement(s)
1614     elif s.sy == 'continue':
1615         node = p_continue_statement(s)
1616     elif s.sy == 'return':
1617         node = p_return_statement(s)
1618     elif s.sy == 'raise':
1619         node = p_raise_statement(s)
1620     elif s.sy in ('import', 'cimport'):
1621         node = p_import_statement(s)
1622     elif s.sy == 'from':
1623         node = p_from_import_statement(s, first_statement = first_statement)
1624     elif s.sy == 'yield':
1625         node = p_yield_statement(s)
1626     elif s.sy == 'assert':
1627         node = p_assert_statement(s)
1628     elif s.sy == 'pass':
1629         node = p_pass_statement(s)
1630     else:
1631         node = p_expression_or_assignment(s)
1632     return node
1633
1634 def p_simple_statement_list(s, ctx, first_statement = 0):
1635     # Parse a series of simple statements on one line
1636     # separated by semicolons.
1637     stat = p_simple_statement(s, first_statement = first_statement)
1638     if s.sy == ';':
1639         stats = [stat]
1640         while s.sy == ';':
1641             #print "p_simple_statement_list: maybe more to follow" ###
1642             s.next()
1643             if s.sy in ('NEWLINE', 'EOF'):
1644                 break
1645             stats.append(p_simple_statement(s))
1646         stat = Nodes.StatListNode(stats[0].pos, stats = stats)
1647     s.expect_newline("Syntax error in simple statement list")
1648     return stat
1649
1650 def p_compile_time_expr(s):
1651     old = s.compile_time_expr
1652     s.compile_time_expr = 1
1653     expr = p_testlist(s)
1654     s.compile_time_expr = old
1655     return expr
1656
1657 def p_DEF_statement(s):
1658     pos = s.position()
1659     denv = s.compile_time_env
1660     s.next() # 'DEF'
1661     name = p_ident(s)
1662     s.expect('=')
1663     expr = p_compile_time_expr(s)
1664     value = expr.compile_time_value(denv)
1665     #print "p_DEF_statement: %s = %r" % (name, value) ###
1666     denv.declare(name, value)
1667     s.expect_newline()
1668     return Nodes.PassStatNode(pos)
1669
1670 def p_IF_statement(s, ctx):
1671     pos = s.position()
1672     saved_eval = s.compile_time_eval
1673     current_eval = saved_eval
1674     denv = s.compile_time_env
1675     result = None
1676     while 1:
1677         s.next() # 'IF' or 'ELIF'
1678         expr = p_compile_time_expr(s)
1679         s.compile_time_eval = current_eval and bool(expr.compile_time_value(denv))
1680         body = p_suite(s, ctx)
1681         if s.compile_time_eval:
1682             result = body
1683             current_eval = 0
1684         if s.sy != 'ELIF':
1685             break
1686     if s.sy == 'ELSE':
1687         s.next()
1688         s.compile_time_eval = current_eval
1689         body = p_suite(s, ctx)
1690         if current_eval:
1691             result = body
1692     if not result:
1693         result = Nodes.PassStatNode(pos)
1694     s.compile_time_eval = saved_eval
1695     return result
1696
1697 def p_statement(s, ctx, first_statement = 0):
1698     cdef_flag = ctx.cdef_flag
1699     decorators = None
1700     if s.sy == 'ctypedef':
1701         if ctx.level not in ('module', 'module_pxd'):
1702             s.error("ctypedef statement not allowed here")
1703         #if ctx.api:
1704         #    error(s.position(), "'api' not allowed with 'ctypedef'")
1705         return p_ctypedef_statement(s, ctx)
1706     elif s.sy == 'DEF':
1707         return p_DEF_statement(s)
1708     elif s.sy == 'IF':
1709         return p_IF_statement(s, ctx)
1710     elif s.sy == 'DECORATOR':
1711         if ctx.level not in ('module', 'class', 'c_class', 'function', 'property', 'module_pxd', 'c_class_pxd'):
1712             s.error('decorator not allowed here')
1713         s.level = ctx.level
1714         decorators = p_decorators(s)
1715         if s.sy not in ('def', 'cdef', 'cpdef', 'class'):
1716             s.error("Decorators can only be followed by functions or classes")
1717     elif s.sy == 'pass' and cdef_flag:
1718         # empty cdef block
1719         return p_pass_statement(s, with_newline = 1)
1720
1721     overridable = 0
1722     if s.sy == 'cdef':
1723         cdef_flag = 1
1724         s.next()
1725     elif s.sy == 'cpdef':
1726         cdef_flag = 1
1727         overridable = 1
1728         s.next()
1729     if cdef_flag:
1730         if ctx.level not in ('module', 'module_pxd', 'function', 'c_class', 'c_class_pxd'):
1731             s.error('cdef statement not allowed here')
1732         s.level = ctx.level
1733         node = p_cdef_statement(s, ctx(overridable = overridable))
1734         if decorators is not None:
1735             if not isinstance(node, (Nodes.CFuncDefNode, Nodes.CVarDefNode, Nodes.CClassDefNode)):
1736                 s.error("Decorators can only be followed by functions or classes")
1737             node.decorators = decorators
1738         return node
1739     else:
1740         if ctx.api:
1741             s.error("'api' not allowed with this statement")
1742         elif s.sy == 'def':
1743             # def statements aren't allowed in pxd files, except
1744             # as part of a cdef class
1745             if ('pxd' in ctx.level) and (ctx.level != 'c_class_pxd'):
1746                 s.error('def statement not allowed here')
1747             s.level = ctx.level
1748             return p_def_statement(s, decorators)
1749         elif s.sy == 'class':
1750             if ctx.level not in ('module', 'function', 'class', 'other'):
1751                 s.error("class definition not allowed here")
1752             return p_class_statement(s, decorators)
1753         elif s.sy == 'include':
1754             if ctx.level not in ('module', 'module_pxd'):
1755                 s.error("include statement not allowed here")
1756             return p_include_statement(s, ctx)
1757         elif ctx.level == 'c_class' and s.sy == 'IDENT' and s.systring == 'property':
1758             return p_property_decl(s)
1759         elif s.sy == 'pass' and ctx.level != 'property':
1760             return p_pass_statement(s, with_newline = 1)
1761         else:
1762             if ctx.level in ('c_class_pxd', 'property'):
1763                 s.error("Executable statement not allowed here")
1764             if s.sy == 'if':
1765                 return p_if_statement(s)
1766             elif s.sy == 'while':
1767                 return p_while_statement(s)
1768             elif s.sy == 'for':
1769                 return p_for_statement(s)
1770             elif s.sy == 'try':
1771                 return p_try_statement(s)
1772             elif s.sy == 'with':
1773                 return p_with_statement(s)
1774             else:
1775                 return p_simple_statement_list(
1776                     s, ctx, first_statement = first_statement)
1777
1778 def p_statement_list(s, ctx, first_statement = 0):
1779     # Parse a series of statements separated by newlines.
1780     pos = s.position()
1781     stats = []
1782     while s.sy not in ('DEDENT', 'EOF'):
1783         stats.append(p_statement(s, ctx, first_statement = first_statement))
1784         first_statement = 0
1785     if len(stats) == 1:
1786         return stats[0]
1787     else:
1788         return Nodes.StatListNode(pos, stats = stats)
1789
1790 def p_suite(s, ctx = Ctx(), with_doc = 0, with_pseudo_doc = 0):
1791     pos = s.position()
1792     s.expect(':')
1793     doc = None
1794     stmts = []
1795     if s.sy == 'NEWLINE':
1796         s.next()
1797         s.expect_indent()
1798         if with_doc or with_pseudo_doc:
1799             doc = p_doc_string(s)
1800         body = p_statement_list(s, ctx)
1801         s.expect_dedent()
1802     else:
1803         if ctx.api:
1804             s.error("'api' not allowed with this statement")
1805         if ctx.level in ('module', 'class', 'function', 'other'):
1806             body = p_simple_statement_list(s, ctx)
1807         else:
1808             body = p_pass_statement(s)
1809             s.expect_newline("Syntax error in declarations")
1810     if with_doc:
1811         return doc, body
1812     else:
1813         return body
1814
1815 def p_positional_and_keyword_args(s, end_sy_set, templates = None):
1816     """
1817     Parses positional and keyword arguments. end_sy_set
1818     should contain any s.sy that terminate the argument list.
1819     Argument expansion (* and **) are not allowed.
1820
1821     Returns: (positional_args, keyword_args)
1822     """
1823     positional_args = []
1824     keyword_args = []
1825     pos_idx = 0
1826
1827     while s.sy not in end_sy_set:
1828         if s.sy == '*' or s.sy == '**':
1829             s.error('Argument expansion not allowed here.')
1830
1831         parsed_type = False
1832         if s.sy == 'IDENT' and s.peek()[0] == '=':
1833             ident = s.systring
1834             s.next() # s.sy is '='
1835             s.next()
1836             if looking_at_expr(s):
1837                 arg = p_test(s)
1838             else:
1839                 base_type = p_c_base_type(s, templates = templates)
1840                 declarator = p_c_declarator(s, empty = 1)
1841                 arg = Nodes.CComplexBaseTypeNode(base_type.pos,
1842                     base_type = base_type, declarator = declarator)
1843                 parsed_type = True
1844             keyword_node = ExprNodes.IdentifierStringNode(
1845                 arg.pos, value = EncodedString(ident))
1846             keyword_args.append((keyword_node, arg))
1847             was_keyword = True
1848
1849         else:
1850             if looking_at_expr(s):
1851                 arg = p_test(s)
1852             else:
1853                 base_type = p_c_base_type(s, templates = templates)
1854                 declarator = p_c_declarator(s, empty = 1)
1855                 arg = Nodes.CComplexBaseTypeNode(base_type.pos,
1856                     base_type = base_type, declarator = declarator)
1857                 parsed_type = True
1858             positional_args.append(arg)
1859             pos_idx += 1
1860             if len(keyword_args) > 0:
1861                 s.error("Non-keyword arg following keyword arg",
1862                         pos = arg.pos)
1863
1864         if s.sy != ',':
1865             if s.sy not in end_sy_set:
1866                 if parsed_type:
1867                     s.error("Unmatched %s" % " or ".join(end_sy_set))
1868             break
1869         s.next()
1870     return positional_args, keyword_args
1871
1872 def p_c_base_type(s, self_flag = 0, nonempty = 0, templates = None):
1873     # If self_flag is true, this is the base type for the
1874     # self argument of a C method of an extension type.
1875     if s.sy == '(':
1876         return p_c_complex_base_type(s)
1877     else:
1878         return p_c_simple_base_type(s, self_flag, nonempty = nonempty, templates = templates)
1879
1880 def p_calling_convention(s):
1881     if s.sy == 'IDENT' and s.systring in calling_convention_words:
1882         result = s.systring
1883         s.next()
1884         return result
1885     else:
1886         return ""
1887
1888 calling_convention_words = ("__stdcall", "__cdecl", "__fastcall")
1889
1890 def p_c_complex_base_type(s):
1891     # s.sy == '('
1892     pos = s.position()
1893     s.next()
1894     base_type = p_c_base_type(s)
1895     declarator = p_c_declarator(s, empty = 1)
1896     s.expect(')')
1897     return Nodes.CComplexBaseTypeNode(pos,
1898         base_type = base_type, declarator = declarator)
1899
1900 def p_c_simple_base_type(s, self_flag, nonempty, templates = None):
1901     #print "p_c_simple_base_type: self_flag =", self_flag, nonempty
1902     is_basic = 0
1903     signed = 1
1904     longness = 0
1905     complex = 0
1906     module_path = []
1907     pos = s.position()
1908     if not s.sy == 'IDENT':
1909         error(pos, "Expected an identifier, found '%s'" % s.sy)
1910     if looking_at_base_type(s):
1911         #print "p_c_simple_base_type: looking_at_base_type at", s.position()
1912         is_basic = 1
1913         if s.sy == 'IDENT' and s.systring in special_basic_c_types:
1914             signed, longness = special_basic_c_types[s.systring]
1915             name = s.systring
1916             s.next()
1917         else:
1918             signed, longness = p_sign_and_longness(s)
1919             if s.sy == 'IDENT' and s.systring in basic_c_type_names:
1920                 name = s.systring
1921                 s.next()
1922             else:
1923                 name = 'int'  # long [int], short [int], long [int] complex, etc.
1924         if s.sy == 'IDENT' and s.systring == 'complex':
1925             complex = 1
1926             s.next()
1927     elif looking_at_dotted_name(s):
1928         #print "p_c_simple_base_type: looking_at_type_name at", s.position()
1929         name = s.systring
1930         s.next()
1931         while s.sy == '.':
1932             module_path.append(name)
1933             s.next()
1934             name = p_ident(s)
1935     else:
1936         name = s.systring
1937         s.next()
1938         if nonempty and s.sy != 'IDENT':
1939             # Make sure this is not a declaration of a variable or function.
1940             if s.sy == '(':
1941                 s.next()
1942                 if s.sy == '*' or s.sy == '**' or s.sy == '&':
1943                     s.put_back('(', '(')
1944                 else:
1945                     s.put_back('(', '(')
1946                     s.put_back('IDENT', name)
1947                     name = None
1948             elif s.sy not in ('*', '**', '[', '&'):
1949                 s.put_back('IDENT', name)
1950                 name = None
1951
1952     type_node = Nodes.CSimpleBaseTypeNode(pos,
1953         name = name, module_path = module_path,
1954         is_basic_c_type = is_basic, signed = signed,
1955         complex = complex, longness = longness,
1956         is_self_arg = self_flag, templates = templates)
1957
1958     if s.sy == '[':
1959         type_node = p_buffer_or_template(s, type_node, templates)
1960
1961     if s.sy == '.':
1962         s.next()
1963         name = p_ident(s)
1964         type_node = Nodes.CNestedBaseTypeNode(pos, base_type = type_node, name = name)
1965
1966     return type_node
1967
1968 def p_buffer_or_template(s, base_type_node, templates):
1969     # s.sy == '['
1970     pos = s.position()
1971     s.next()
1972     # Note that buffer_positional_options_count=1, so the only positional argument is dtype.
1973     # For templated types, all parameters are types.
1974     positional_args, keyword_args = (
1975         p_positional_and_keyword_args(s, (']',), templates)
1976     )
1977     s.expect(']')
1978
1979     keyword_dict = ExprNodes.DictNode(pos,
1980         key_value_pairs = [
1981             ExprNodes.DictItemNode(pos=key.pos, key=key, value=value)
1982             for key, value in keyword_args
1983         ])
1984     result = Nodes.TemplatedTypeNode(pos,
1985         positional_args = positional_args,
1986         keyword_args = keyword_dict,
1987         base_type_node = base_type_node)
1988     return result
1989
1990
1991 def looking_at_name(s):
1992     return s.sy == 'IDENT' and not s.systring in calling_convention_words
1993
1994 def looking_at_expr(s):
1995     if s.systring in base_type_start_words:
1996         return False
1997     elif s.sy == 'IDENT':
1998         is_type = False
1999         name = s.systring
2000         dotted_path = []
2001         s.next()
2002         while s.sy == '.':
2003             s.next()
2004             dotted_path.append(s.systring)
2005             s.expect('IDENT')
2006         saved = s.sy, s.systring
2007         if s.sy == 'IDENT':
2008             is_type = True
2009         elif s.sy == '*' or s.sy == '**':
2010             s.next()
2011             is_type = s.sy in (')', ']')
2012             s.put_back(*saved)
2013         elif s.sy == '(':
2014             s.next()
2015             is_type = s.sy == '*'
2016             s.put_back(*saved)
2017         elif s.sy == '[':
2018             s.next()
2019             is_type = s.sy == ']'
2020             s.put_back(*saved)
2021         dotted_path.reverse()
2022         for p in dotted_path:
2023             s.put_back('IDENT', p)
2024             s.put_back('.', '.')
2025         s.put_back('IDENT', name)
2026         return not is_type
2027     else:
2028         return True
2029
2030 def looking_at_base_type(s):
2031     #print "looking_at_base_type?", s.sy, s.systring, s.position()
2032     return s.sy == 'IDENT' and s.systring in base_type_start_words
2033
2034 def looking_at_dotted_name(s):
2035     if s.sy == 'IDENT':
2036         name = s.systring
2037         s.next()
2038         result = s.sy == '.'
2039         s.put_back('IDENT', name)
2040         return result
2041     else:
2042         return 0
2043
2044 basic_c_type_names = ("void", "char", "int", "float", "double", "bint")
2045
2046 special_basic_c_types = {
2047     # name : (signed, longness)
2048     "Py_UNICODE" : (0, 0),
2049     "Py_UCS4"    : (0, 0),
2050     "Py_ssize_t" : (2, 0),
2051     "ssize_t"    : (2, 0),
2052     "size_t"     : (0, 0),
2053 }
2054
2055 sign_and_longness_words = ("short", "long", "signed", "unsigned")
2056
2057 base_type_start_words = \
2058     basic_c_type_names + sign_and_longness_words + tuple(special_basic_c_types)
2059
2060 def p_sign_and_longness(s):
2061     signed = 1
2062     longness = 0
2063     while s.sy == 'IDENT' and s.systring in sign_and_longness_words:
2064         if s.systring == 'unsigned':
2065             signed = 0
2066         elif s.systring == 'signed':
2067             signed = 2
2068         elif s.systring == 'short':
2069             longness = -1
2070         elif s.systring == 'long':
2071             longness += 1
2072         s.next()
2073     return signed, longness
2074
2075 def p_opt_cname(s):
2076     literal = p_opt_string_literal(s, 'u')
2077     if literal is not None:
2078         cname = EncodedString(literal)
2079         cname.encoding = s.source_encoding
2080     else:
2081         cname = None
2082     return cname
2083
2084 def p_c_declarator(s, ctx = Ctx(), empty = 0, is_type = 0, cmethod_flag = 0,
2085                    assignable = 0, nonempty = 0,
2086                    calling_convention_allowed = 0):
2087     # If empty is true, the declarator must be empty. If nonempty is true,
2088     # the declarator must be nonempty. Otherwise we don't care.
2089     # If cmethod_flag is true, then if this declarator declares
2090     # a function, it's a C method of an extension type.
2091     pos = s.position()
2092     if s.sy == '(':
2093         s.next()
2094         if s.sy == ')' or looking_at_name(s):
2095             base = Nodes.CNameDeclaratorNode(pos, name = EncodedString(u""), cname = None)
2096             result = p_c_func_declarator(s, pos, ctx, base, cmethod_flag)
2097         else:
2098             result = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2099                                     cmethod_flag = cmethod_flag,
2100                                     nonempty = nonempty,
2101                                     calling_convention_allowed = 1)
2102             s.expect(')')
2103     else:
2104         result = p_c_simple_declarator(s, ctx, empty, is_type, cmethod_flag,
2105                                        assignable, nonempty)
2106     if not calling_convention_allowed and result.calling_convention and s.sy != '(':
2107         error(s.position(), "%s on something that is not a function"
2108             % result.calling_convention)
2109     while s.sy in ('[', '('):
2110         pos = s.position()
2111         if s.sy == '[':
2112             result = p_c_array_declarator(s, result)
2113         else: # sy == '('
2114             s.next()
2115             result = p_c_func_declarator(s, pos, ctx, result, cmethod_flag)
2116         cmethod_flag = 0
2117     return result
2118
2119 def p_c_array_declarator(s, base):
2120     pos = s.position()
2121     s.next() # '['
2122     if s.sy != ']':
2123         dim = p_testlist(s)
2124     else:
2125         dim = None
2126     s.expect(']')
2127     return Nodes.CArrayDeclaratorNode(pos, base = base, dimension = dim)
2128
2129 def p_c_func_declarator(s, pos, ctx, base, cmethod_flag):
2130     #  Opening paren has already been skipped
2131     args = p_c_arg_list(s, ctx, cmethod_flag = cmethod_flag,
2132                         nonempty_declarators = 0)
2133     ellipsis = p_optional_ellipsis(s)
2134     s.expect(')')
2135     nogil = p_nogil(s)
2136     exc_val, exc_check = p_exception_value_clause(s)
2137     with_gil = p_with_gil(s)
2138     return Nodes.CFuncDeclaratorNode(pos,
2139         base = base, args = args, has_varargs = ellipsis,
2140         exception_value = exc_val, exception_check = exc_check,
2141         nogil = nogil or ctx.nogil or with_gil, with_gil = with_gil)
2142
2143 supported_overloaded_operators = cython.set([
2144     '+', '-', '*', '/', '%',
2145     '++', '--', '~', '|', '&', '^', '<<', '>>', ',',
2146     '==', '!=', '>=', '>', '<=', '<',
2147     '[]', '()',
2148 ])
2149
2150 def p_c_simple_declarator(s, ctx, empty, is_type, cmethod_flag,
2151                           assignable, nonempty):
2152     pos = s.position()
2153     calling_convention = p_calling_convention(s)
2154     if s.sy == '*':
2155         s.next()
2156         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2157                               cmethod_flag = cmethod_flag,
2158                               assignable = assignable, nonempty = nonempty)
2159         result = Nodes.CPtrDeclaratorNode(pos,
2160             base = base)
2161     elif s.sy == '**': # scanner returns this as a single token
2162         s.next()
2163         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2164                               cmethod_flag = cmethod_flag,
2165                               assignable = assignable, nonempty = nonempty)
2166         result = Nodes.CPtrDeclaratorNode(pos,
2167             base = Nodes.CPtrDeclaratorNode(pos,
2168                 base = base))
2169     elif s.sy == '&':
2170         s.next()
2171         base = p_c_declarator(s, ctx, empty = empty, is_type = is_type,
2172                               cmethod_flag = cmethod_flag,
2173                               assignable = assignable, nonempty = nonempty)
2174         result = Nodes.CReferenceDeclaratorNode(pos, base = base)
2175     else:
2176         rhs = None
2177         if s.sy == 'IDENT':
2178             name = EncodedString(s.systring)
2179             if empty:
2180                 error(s.position(), "Declarator should be empty")
2181             s.next()
2182             cname = p_opt_cname(s)
2183             if name != 'operator' and s.sy == '=' and assignable:
2184                 s.next()
2185                 rhs = p_test(s)
2186         else:
2187             if nonempty:
2188                 error(s.position(), "Empty declarator")
2189             name = ""
2190             cname = None
2191         if cname is None and ctx.namespace is not None and nonempty:
2192             cname = ctx.namespace + "::" + name
2193         if name == 'operator' and ctx.visibility == 'extern' and nonempty:
2194             op = s.sy
2195             if [1 for c in op if c in '+-*/<=>!%&|([^~,']:
2196                 s.next()
2197                 # Handle diphthong operators.
2198                 if op == '(':
2199                     s.expect(')')
2200                     op = '()'
2201                 elif op == '[':
2202                     s.expect(']')
2203                     op = '[]'
2204                 if op in ['-', '+', '|', '&'] and s.sy == op:
2205                     op = op*2
2206                     s.next()
2207                 if s.sy == '=':
2208                     op += s.sy
2209                     s.next()
2210                 if op not in supported_overloaded_operators:
2211                     s.error("Overloading operator '%s' not yet supported." % op)
2212                 name = name+op
2213         result = Nodes.CNameDeclaratorNode(pos,
2214             name = name, cname = cname, default = rhs)
2215     result.calling_convention = calling_convention
2216     return result
2217
2218 def p_nogil(s):
2219     if s.sy == 'IDENT' and s.systring == 'nogil':
2220         s.next()
2221         return 1
2222     else:
2223         return 0
2224
2225 def p_with_gil(s):
2226     if s.sy == 'with':
2227         s.next()
2228         s.expect_keyword('gil')
2229         return 1
2230     else:
2231         return 0
2232
2233 def p_exception_value_clause(s):
2234     exc_val = None
2235     exc_check = 0
2236     if s.sy == 'except':
2237         s.next()
2238         if s.sy == '*':
2239             exc_check = 1
2240             s.next()
2241         elif s.sy == '+':
2242             exc_check = '+'
2243             s.next()
2244             if s.sy == 'IDENT':
2245                 name = s.systring
2246                 s.next()
2247                 exc_val = p_name(s, name)
2248         else:
2249             if s.sy == '?':
2250                 exc_check = 1
2251                 s.next()
2252             exc_val = p_test(s)
2253     return exc_val, exc_check
2254
2255 c_arg_list_terminators = ('*', '**', '.', ')')
2256
2257 def p_c_arg_list(s, ctx = Ctx(), in_pyfunc = 0, cmethod_flag = 0,
2258                  nonempty_declarators = 0, kw_only = 0, annotated = 1):
2259     #  Comma-separated list of C argument declarations, possibly empty.
2260     #  May have a trailing comma.
2261     args = []
2262     is_self_arg = cmethod_flag
2263     while s.sy not in c_arg_list_terminators:
2264         args.append(p_c_arg_decl(s, ctx, in_pyfunc, is_self_arg,
2265             nonempty = nonempty_declarators, kw_only = kw_only,
2266             annotated = annotated))
2267         if s.sy != ',':
2268             break
2269         s.next()
2270         is_self_arg = 0
2271     return args
2272
2273 def p_optional_ellipsis(s):
2274     if s.sy == '.':
2275         expect_ellipsis(s)
2276         return 1
2277     else:
2278         return 0
2279
2280 def p_c_arg_decl(s, ctx, in_pyfunc, cmethod_flag = 0, nonempty = 0,
2281                  kw_only = 0, annotated = 1):
2282     pos = s.position()
2283     not_none = or_none = 0
2284     default = None
2285     annotation = None
2286     if s.in_python_file:
2287         # empty type declaration
2288         base_type = Nodes.CSimpleBaseTypeNode(pos,
2289             name = None, module_path = [],
2290             is_basic_c_type = 0, signed = 0,
2291             complex = 0, longness = 0,
2292             is_self_arg = cmethod_flag, templates = None)
2293     else:
2294         base_type = p_c_base_type(s, cmethod_flag, nonempty = nonempty)
2295     declarator = p_c_declarator(s, ctx, nonempty = nonempty)
2296     if s.sy in ('not', 'or') and not s.in_python_file:
2297         kind = s.sy
2298         s.next()
2299         if s.sy == 'IDENT' and s.systring == 'None':
2300             s.next()
2301         else:
2302             s.error("Expected 'None'")
2303         if not in_pyfunc:
2304             error(pos, "'%s None' only allowed in Python functions" % kind)
2305         or_none = kind == 'or'
2306         not_none = kind == 'not'
2307     if annotated and s.sy == ':':
2308         s.next()
2309         annotation = p_test(s)
2310     if s.sy == '=':
2311         s.next()
2312         if 'pxd' in s.level:
2313             if s.sy not in ['*', '?']:
2314                 error(pos, "default values cannot be specified in pxd files, use ? or *")
2315             default = ExprNodes.BoolNode(1)
2316             s.next()
2317         else:
2318             default = p_test(s)
2319     return Nodes.CArgDeclNode(pos,
2320         base_type = base_type,
2321         declarator = declarator,
2322         not_none = not_none,
2323         or_none = or_none,
2324         default = default,
2325         annotation = annotation,
2326         kw_only = kw_only)
2327
2328 def p_api(s):
2329     if s.sy == 'IDENT' and s.systring == 'api':
2330         s.next()
2331         return 1
2332     else:
2333         return 0
2334
2335 def p_cdef_statement(s, ctx):
2336     pos = s.position()
2337     ctx.visibility = p_visibility(s, ctx.visibility)
2338     ctx.api = ctx.api or p_api(s)
2339     if ctx.api:
2340         if ctx.visibility not in ('private', 'public'):
2341             error(pos, "Cannot combine 'api' with '%s'" % ctx.visibility)
2342     if (ctx.visibility == 'extern') and s.sy == 'from':
2343         return p_cdef_extern_block(s, pos, ctx)
2344     elif s.sy == 'import':
2345         s.next()
2346         return p_cdef_extern_block(s, pos, ctx)
2347     elif p_nogil(s):
2348         ctx.nogil = 1
2349         if ctx.overridable:
2350             error(pos, "cdef blocks cannot be declared cpdef")
2351         return p_cdef_block(s, ctx)
2352     elif s.sy == ':':
2353         if ctx.overridable:
2354             error(pos, "cdef blocks cannot be declared cpdef")
2355         return p_cdef_block(s, ctx)
2356     elif s.sy == 'class':
2357         if ctx.level not in ('module', 'module_pxd'):
2358             error(pos, "Extension type definition not allowed here")
2359         if ctx.overridable:
2360             error(pos, "Extension types cannot be declared cpdef")
2361         return p_c_class_definition(s, pos, ctx)
2362     elif s.sy == 'IDENT' and s.systring == 'cppclass':
2363         if ctx.visibility != 'extern':
2364             error(pos, "C++ classes need to be declared extern")
2365         return p_cpp_class_definition(s, pos, ctx)
2366     elif s.sy == 'IDENT' and s.systring in ("struct", "union", "enum", "packed"):
2367         if ctx.level not in ('module', 'module_pxd'):
2368             error(pos, "C struct/union/enum definition not allowed here")
2369         if ctx.overridable:
2370             error(pos, "C struct/union/enum cannot be declared cpdef")
2371         if s.systring == "enum":
2372             return p_c_enum_definition(s, pos, ctx)
2373         else:
2374             return p_c_struct_or_union_definition(s, pos, ctx)
2375     else:
2376         return p_c_func_or_var_declaration(s, pos, ctx)
2377
2378 def p_cdef_block(s, ctx):
2379     return p_suite(s, ctx(cdef_flag = 1))
2380
2381 def p_cdef_extern_block(s, pos, ctx):
2382     if ctx.overridable:
2383         error(pos, "cdef extern blocks cannot be declared cpdef")
2384     include_file = None
2385     s.expect('from')
2386     if s.sy == '*':
2387         s.next()
2388     else:
2389         include_file = p_string_literal(s, 'u')[2]
2390     ctx = ctx(cdef_flag = 1, visibility = 'extern')
2391     if s.systring == "namespace":
2392         s.next()
2393         ctx.namespace = p_string_literal(s, 'u')[2]
2394     if p_nogil(s):
2395         ctx.nogil = 1
2396     body = p_suite(s, ctx)
2397     return Nodes.CDefExternNode(pos,
2398         include_file = include_file,
2399         body = body,
2400         namespace = ctx.namespace)
2401
2402 def p_c_enum_definition(s, pos, ctx):
2403     # s.sy == ident 'enum'
2404     s.next()
2405     if s.sy == 'IDENT':
2406         name = s.systring
2407         s.next()
2408         cname = p_opt_cname(s)
2409         if cname is None and ctx.namespace is not None:
2410             cname = ctx.namespace + "::" + name
2411     else:
2412         name = None
2413         cname = None
2414     items = None
2415     s.expect(':')
2416     items = []
2417     if s.sy != 'NEWLINE':
2418         p_c_enum_line(s, ctx, items)
2419     else:
2420         s.next() # 'NEWLINE'
2421         s.expect_indent()
2422         while s.sy not in ('DEDENT', 'EOF'):
2423             p_c_enum_line(s, ctx, items)
2424         s.expect_dedent()
2425     return Nodes.CEnumDefNode(
2426         pos, name = name, cname = cname, items = items,
2427         typedef_flag = ctx.typedef_flag, visibility = ctx.visibility,
2428         in_pxd = ctx.level == 'module_pxd')
2429
2430 def p_c_enum_line(s, ctx, items):
2431     if s.sy != 'pass':
2432         p_c_enum_item(s, ctx, items)
2433         while s.sy == ',':
2434             s.next()
2435             if s.sy in ('NEWLINE', 'EOF'):
2436                 break
2437             p_c_enum_item(s, ctx, items)
2438     else:
2439         s.next()
2440     s.expect_newline("Syntax error in enum item list")
2441
2442 def p_c_enum_item(s, ctx, items):
2443     pos = s.position()
2444     name = p_ident(s)
2445     cname = p_opt_cname(s)
2446     if cname is None and ctx.namespace is not None:
2447         cname = ctx.namespace + "::" + name
2448     value = None
2449     if s.sy == '=':
2450         s.next()
2451         value = p_test(s)
2452     items.append(Nodes.CEnumDefItemNode(pos,
2453         name = name, cname = cname, value = value))
2454
2455 def p_c_struct_or_union_definition(s, pos, ctx):
2456     packed = False
2457     if s.systring == 'packed':
2458         packed = True
2459         s.next()
2460         if s.sy != 'IDENT' or s.systring != 'struct':
2461             s.expected('struct')
2462     # s.sy == ident 'struct' or 'union'
2463     kind = s.systring
2464     s.next()
2465     name = p_ident(s)
2466     cname = p_opt_cname(s)
2467     if cname is None and ctx.namespace is not None:
2468         cname = ctx.namespace + "::" + name
2469     attributes = None
2470     if s.sy == ':':
2471         s.next()
2472         s.expect('NEWLINE')
2473         s.expect_indent()
2474         attributes = []
2475         body_ctx = Ctx()
2476         while s.sy != 'DEDENT':
2477             if s.sy != 'pass':
2478                 attributes.append(
2479                     p_c_func_or_var_declaration(s, s.position(), body_ctx))
2480             else:
2481                 s.next()
2482                 s.expect_newline("Expected a newline")
2483         s.expect_dedent()
2484     else:
2485         s.expect_newline("Syntax error in struct or union definition")
2486     return Nodes.CStructOrUnionDefNode(pos,
2487         name = name, cname = cname, kind = kind, attributes = attributes,
2488         typedef_flag = ctx.typedef_flag, visibility = ctx.visibility,
2489         in_pxd = ctx.level == 'module_pxd', packed = packed)
2490
2491 def p_visibility(s, prev_visibility):
2492     pos = s.position()
2493     visibility = prev_visibility
2494     if s.sy == 'IDENT' and s.systring in ('extern', 'public', 'readonly'):
2495         visibility = s.systring
2496         if prev_visibility != 'private' and visibility != prev_visibility:
2497             s.error("Conflicting visibility options '%s' and '%s'"
2498                 % (prev_visibility, visibility))
2499         s.next()
2500     return visibility
2501
2502 def p_c_modifiers(s):
2503     if s.sy == 'IDENT' and s.systring in ('inline',):
2504         modifier = s.systring
2505         s.next()
2506         return [modifier] + p_c_modifiers(s)
2507     return []
2508
2509 def p_c_func_or_var_declaration(s, pos, ctx):
2510     cmethod_flag = ctx.level in ('c_class', 'c_class_pxd')
2511     modifiers = p_c_modifiers(s)
2512     base_type = p_c_base_type(s, nonempty = 1, templates = ctx.templates)
2513     declarator = p_c_declarator(s, ctx, cmethod_flag = cmethod_flag,
2514                                 assignable = 1, nonempty = 1)
2515     declarator.overridable = ctx.overridable
2516     if s.sy == ':':
2517         if ctx.level not in ('module', 'c_class', 'module_pxd', 'c_class_pxd') and not ctx.templates:
2518             s.error("C function definition not allowed here")
2519         doc, suite = p_suite(s, Ctx(level = 'function'), with_doc = 1)
2520         result = Nodes.CFuncDefNode(pos,
2521             visibility = ctx.visibility,
2522             base_type = base_type,
2523             declarator = declarator,
2524             body = suite,
2525             doc = doc,
2526             modifiers = modifiers,
2527             api = ctx.api,
2528             overridable = ctx.overridable)
2529     else:
2530         #if api:
2531         #    s.error("'api' not allowed with variable declaration")
2532         declarators = [declarator]
2533         while s.sy == ',':
2534             s.next()
2535             if s.sy == 'NEWLINE':
2536                 break
2537             declarator = p_c_declarator(s, ctx, cmethod_flag = cmethod_flag,
2538                                         assignable = 1, nonempty = 1)
2539             declarators.append(declarator)
2540         s.expect_newline("Syntax error in C variable declaration")
2541         result = Nodes.CVarDefNode(pos,
2542             visibility = ctx.visibility,
2543             base_type = base_type,
2544             declarators = declarators,
2545             in_pxd = ctx.level == 'module_pxd',
2546             api = ctx.api,
2547             overridable = ctx.overridable)
2548     return result
2549
2550 def p_ctypedef_statement(s, ctx):
2551     # s.sy == 'ctypedef'
2552     pos = s.position()
2553     s.next()
2554     visibility = p_visibility(s, ctx.visibility)
2555     api = p_api(s)
2556     ctx = ctx(typedef_flag = 1, visibility = visibility)
2557     if api:
2558         ctx.api = 1
2559     if s.sy == 'class':
2560         return p_c_class_definition(s, pos, ctx)
2561     elif s.sy == 'IDENT' and s.systring in ('packed', 'struct', 'union', 'enum'):
2562         if s.systring == 'enum':
2563             return p_c_enum_definition(s, pos, ctx)
2564         else:
2565             return p_c_struct_or_union_definition(s, pos, ctx)
2566     else:
2567         base_type = p_c_base_type(s, nonempty = 1)
2568         if base_type.name is None:
2569             s.error("Syntax error in ctypedef statement")
2570         declarator = p_c_declarator(s, ctx, is_type = 1, nonempty = 1)
2571         s.expect_newline("Syntax error in ctypedef statement")
2572         return Nodes.CTypeDefNode(
2573             pos, base_type = base_type,
2574             declarator = declarator, visibility = visibility,
2575             in_pxd = ctx.level == 'module_pxd')
2576
2577 def p_decorators(s):
2578     decorators = []
2579     while s.sy == 'DECORATOR':
2580         pos = s.position()
2581         s.next()
2582         decstring = p_dotted_name(s, as_allowed=0)[2]
2583         names = decstring.split('.')
2584         decorator = ExprNodes.NameNode(pos, name=EncodedString(names[0]))
2585         for name in names[1:]:
2586             decorator = ExprNodes.AttributeNode(pos,
2587                                            attribute=EncodedString(name),
2588                                            obj=decorator)
2589         if s.sy == '(':
2590             decorator = p_call(s, decorator)
2591         decorators.append(Nodes.DecoratorNode(pos, decorator=decorator))
2592         s.expect_newline("Expected a newline after decorator")
2593     return decorators
2594
2595 def p_def_statement(s, decorators=None):
2596     # s.sy == 'def'
2597     pos = s.position()
2598     s.next()
2599     name = EncodedString( p_ident(s) )
2600     s.expect('(');
2601     args, star_arg, starstar_arg = p_varargslist(s, terminator=')')
2602     s.expect(')')
2603     if p_nogil(s):
2604         error(pos, "Python function cannot be declared nogil")
2605     return_type_annotation = None
2606     if s.sy == '->':
2607         s.next()
2608         return_type_annotation = p_test(s)
2609     doc, body = p_suite(s, Ctx(level = 'function'), with_doc = 1)
2610     return Nodes.DefNode(pos, name = name, args = args,
2611         star_arg = star_arg, starstar_arg = starstar_arg,
2612         doc = doc, body = body, decorators = decorators,
2613         return_type_annotation = return_type_annotation)
2614
2615 def p_varargslist(s, terminator=')', annotated=1):
2616     args = p_c_arg_list(s, in_pyfunc = 1, nonempty_declarators = 1,
2617                         annotated = annotated)
2618     star_arg = None
2619     starstar_arg = None
2620     if s.sy == '*':
2621         s.next()
2622         if s.sy == 'IDENT':
2623             star_arg = p_py_arg_decl(s, annotated=annotated)
2624         if s.sy == ',':
2625             s.next()
2626             args.extend(p_c_arg_list(s, in_pyfunc = 1,
2627                 nonempty_declarators = 1, kw_only = 1, annotated = annotated))
2628         elif s.sy != terminator:
2629             s.error("Syntax error in Python function argument list")
2630     if s.sy == '**':
2631         s.next()
2632         starstar_arg = p_py_arg_decl(s, annotated=annotated)
2633     return (args, star_arg, starstar_arg)
2634
2635 def p_py_arg_decl(s, annotated = 1):
2636     pos = s.position()
2637     name = p_ident(s)
2638     annotation = None
2639     if annotated and s.sy == ':':
2640         s.next()
2641         annotation = p_test(s)
2642     return Nodes.PyArgDeclNode(pos, name = name, annotation = annotation)
2643
2644 def p_class_statement(s, decorators):
2645     # s.sy == 'class'
2646     pos = s.position()
2647     s.next()
2648     class_name = EncodedString( p_ident(s) )
2649     class_name.encoding = s.source_encoding
2650     arg_tuple = None
2651     keyword_dict = None
2652     starstar_arg = None
2653     if s.sy == '(':
2654         positional_args, keyword_args, star_arg, starstar_arg = \
2655                             p_call_parse_args(s, allow_genexp = False)
2656         arg_tuple, keyword_dict = p_call_build_packed_args(
2657             pos, positional_args, keyword_args, star_arg)
2658     if arg_tuple is None:
2659         # XXX: empty arg_tuple
2660         arg_tuple = ExprNodes.TupleNode(pos, args = [])
2661     doc, body = p_suite(s, Ctx(level = 'class'), with_doc = 1)
2662     return Nodes.PyClassDefNode(pos,
2663         name = class_name,
2664         bases = arg_tuple,
2665         keyword_args = keyword_dict,
2666         starstar_arg = starstar_arg,
2667         doc = doc, body = body, decorators = decorators)
2668
2669 def p_c_class_definition(s, pos,  ctx):
2670     # s.sy == 'class'
2671     s.next()
2672     module_path = []
2673     class_name = p_ident(s)
2674     while s.sy == '.':
2675         s.next()
2676         module_path.append(class_name)
2677         class_name = p_ident(s)
2678     if module_path and ctx.visibility != 'extern':
2679         error(pos, "Qualified class name only allowed for 'extern' C class")
2680     if module_path and s.sy == 'IDENT' and s.systring == 'as':
2681         s.next()
2682         as_name = p_ident(s)
2683     else:
2684         as_name = class_name
2685     objstruct_name = None
2686     typeobj_name = None
2687     base_class_module = None
2688     base_class_name = None
2689     if s.sy == '(':
2690         s.next()
2691         base_class_path = [p_ident(s)]
2692         while s.sy == '.':
2693             s.next()
2694             base_class_path.append(p_ident(s))
2695         if s.sy == ',':
2696             s.error("C class may only have one base class")
2697         s.expect(')')
2698         base_class_module = ".".join(base_class_path[:-1])
2699         base_class_name = base_class_path[-1]
2700     if s.sy == '[':
2701         if ctx.visibility not in ('public', 'extern'):
2702             error(s.position(), "Name options only allowed for 'public' or 'extern' C class")
2703         objstruct_name, typeobj_name = p_c_class_options(s)
2704     if s.sy == ':':
2705         if ctx.level == 'module_pxd':
2706             body_level = 'c_class_pxd'
2707         else:
2708             body_level = 'c_class'
2709         doc, body = p_suite(s, Ctx(level = body_level), with_doc = 1)
2710     else:
2711         s.expect_newline("Syntax error in C class definition")
2712         doc = None
2713         body = None
2714     if ctx.visibility == 'extern':
2715         if not module_path:
2716             error(pos, "Module name required for 'extern' C class")
2717         if typeobj_name:
2718             error(pos, "Type object name specification not allowed for 'extern' C class")
2719     elif ctx.visibility == 'public':
2720         if not objstruct_name:
2721             error(pos, "Object struct name specification required for 'public' C class")
2722         if not typeobj_name:
2723             error(pos, "Type object name specification required for 'public' C class")
2724     elif ctx.visibility == 'private':
2725         if ctx.api:
2726             error(pos, "Only 'public' C class can be declared 'api'")
2727     else:
2728         error(pos, "Invalid class visibility '%s'" % ctx.visibility)
2729     return Nodes.CClassDefNode(pos,
2730         visibility = ctx.visibility,
2731         typedef_flag = ctx.typedef_flag,
2732         api = ctx.api,
2733         module_name = ".".join(module_path),
2734         class_name = class_name,
2735         as_name = as_name,
2736         base_class_module = base_class_module,
2737         base_class_name = base_class_name,
2738         objstruct_name = objstruct_name,
2739         typeobj_name = typeobj_name,
2740         in_pxd = ctx.level == 'module_pxd',
2741         doc = doc,
2742         body = body)
2743
2744 def p_c_class_options(s):
2745     objstruct_name = None
2746     typeobj_name = None
2747     s.expect('[')
2748     while 1:
2749         if s.sy != 'IDENT':
2750             break
2751         if s.systring == 'object':
2752             s.next()
2753             objstruct_name = p_ident(s)
2754         elif s.systring == 'type':
2755             s.next()
2756             typeobj_name = p_ident(s)
2757         if s.sy != ',':
2758             break
2759         s.next()
2760     s.expect(']', "Expected 'object' or 'type'")
2761     return objstruct_name, typeobj_name
2762
2763 def p_property_decl(s):
2764     pos = s.position()
2765     s.next() # 'property'
2766     name = p_ident(s)
2767     doc, body = p_suite(s, Ctx(level = 'property'), with_doc = 1)
2768     return Nodes.PropertyNode(pos, name = name, doc = doc, body = body)
2769
2770 def p_doc_string(s):
2771     if s.sy == 'BEGIN_STRING':
2772         pos = s.position()
2773         kind, bytes_result, unicode_result = p_cat_string_literal(s)
2774         if s.sy != 'EOF':
2775             s.expect_newline("Syntax error in doc string")
2776         if kind in ('u', ''):
2777             return unicode_result
2778         warning(pos, "Python 3 requires docstrings to be unicode strings")
2779         return bytes_result
2780     else:
2781         return None
2782
2783 def p_code(s, level=None):
2784     body = p_statement_list(s, Ctx(level = level), first_statement = 1)
2785     if s.sy != 'EOF':
2786         s.error("Syntax error in statement [%s,%s]" % (
2787             repr(s.sy), repr(s.systring)))
2788     return body
2789
2790 COMPILER_DIRECTIVE_COMMENT_RE = re.compile(r"^#\s*cython:\s*((\w|[.])+\s*=.*)$")
2791
2792 def p_compiler_directive_comments(s):
2793     result = {}
2794     while s.sy == 'commentline':
2795         m = COMPILER_DIRECTIVE_COMMENT_RE.match(s.systring)
2796         if m:
2797             directives = m.group(1).strip()
2798             try:
2799                 result.update( Options.parse_directive_list(
2800                     directives, ignore_unknown=True) )
2801             except ValueError, e:
2802                 s.error(e.args[0], fatal=False)
2803         s.next()
2804     return result
2805
2806 def p_module(s, pxd, full_module_name):
2807     pos = s.position()
2808
2809     directive_comments = p_compiler_directive_comments(s)
2810     s.parse_comments = False
2811
2812     if 'language_level' in directive_comments:
2813         s.context.set_language_level(directive_comments['language_level'])
2814
2815     doc = p_doc_string(s)
2816     if pxd:
2817         level = 'module_pxd'
2818     else:
2819         level = 'module'
2820
2821     body = p_statement_list(s, Ctx(level = level), first_statement = 1)
2822     if s.sy != 'EOF':
2823         s.error("Syntax error in statement [%s,%s]" % (
2824             repr(s.sy), repr(s.systring)))
2825     return ModuleNode(pos, doc = doc, body = body,
2826                       full_module_name = full_module_name,
2827                       directive_comments = directive_comments)
2828
2829 def p_cpp_class_definition(s, pos,  ctx):
2830     # s.sy == 'cppclass'
2831     s.next()
2832     module_path = []
2833     class_name = p_ident(s)
2834     cname = p_opt_cname(s)
2835     if cname is None and ctx.namespace is not None:
2836         cname = ctx.namespace + "::" + class_name
2837     if s.sy == '.':
2838         error(pos, "Qualified class name not allowed C++ class")
2839     if s.sy == '[':
2840         s.next()
2841         templates = [p_ident(s)]
2842         while s.sy == ',':
2843             s.next()
2844             templates.append(p_ident(s))
2845         s.expect(']')
2846     else:
2847         templates = None
2848     if s.sy == '(':
2849         s.next()
2850         base_classes = [p_dotted_name(s, False)[2]]
2851         while s.sy == ',':
2852             s.next()
2853             base_classes.append(p_dotted_name(s, False)[2])
2854         s.expect(')')
2855     else:
2856         base_classes = []
2857     if s.sy == '[':
2858         error(s.position(), "Name options not allowed for C++ class")
2859     if s.sy == ':':
2860         s.next()
2861         s.expect('NEWLINE')
2862         s.expect_indent()
2863         attributes = []
2864         body_ctx = Ctx(visibility = ctx.visibility)
2865         body_ctx.templates = templates
2866         while s.sy != 'DEDENT':
2867             if s.systring == 'cppclass':
2868                 attributes.append(
2869                     p_cpp_class_definition(s, s.position(), body_ctx))
2870             elif s.sy != 'pass':
2871                 attributes.append(
2872                     p_c_func_or_var_declaration(s, s.position(), body_ctx))
2873             else:
2874                 s.next()
2875                 s.expect_newline("Expected a newline")
2876         s.expect_dedent()
2877     else:
2878         attributes = None
2879         s.expect_newline("Syntax error in C++ class definition")
2880     return Nodes.CppClassNode(pos,
2881         name = class_name,
2882         cname = cname,
2883         base_classes = base_classes,
2884         visibility = ctx.visibility,
2885         in_pxd = ctx.level == 'module_pxd',
2886         attributes = attributes,
2887         templates = templates)
2888
2889
2890
2891 #----------------------------------------------
2892 #
2893 #   Debugging
2894 #
2895 #----------------------------------------------
2896
2897 def print_parse_tree(f, node, level, key = None):
2898     from types import ListType, TupleType
2899     from Nodes import Node
2900     ind = "  " * level
2901     if node:
2902         f.write(ind)
2903         if key:
2904             f.write("%s: " % key)
2905         t = type(node)
2906         if t is tuple:
2907             f.write("(%s @ %s\n" % (node[0], node[1]))
2908             for i in xrange(2, len(node)):
2909                 print_parse_tree(f, node[i], level+1)
2910             f.write("%s)\n" % ind)
2911             return
2912         elif isinstance(node, Node):
2913             try:
2914                 tag = node.tag
2915             except AttributeError:
2916                 tag = node.__class__.__name__
2917             f.write("%s @ %s\n" % (tag, node.pos))
2918             for name, value in node.__dict__.items():
2919                 if name != 'tag' and name != 'pos':
2920                     print_parse_tree(f, value, level+1, name)
2921             return
2922         elif t is list:
2923             f.write("[\n")
2924             for i in xrange(len(node)):
2925                 print_parse_tree(f, node[i], level+1)
2926             f.write("%s]\n" % ind)
2927             return
2928     f.write("%s%s\n" % (ind, node))
2929