-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathparser.c
2581 lines (2250 loc) · 74.5 KB
/
parser.c
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
#include "ynicc.h"
#include <stdlib.h>
/*
* chibiccのスコープ管理の実装メモ
*
* locals ... 現在パース中の関数内のローカル変数のみを管理(ただし関数の仮引数もローカル変数として確保している)
* 関数を管理しているFunction構造体には仮引数用のfunc->paramもあるが、これらの変数(Var型)も含めて重複して
* ローカル変数、仮引数まとめて全部このlocalsで管理されている。
* なぜかというと、ローカル変数用のスタック領域の確保時に、ローカル変数用+仮引数用両方をみなくてもこのlocals
* で管理している分のサイズを全部合計してスタック領域として確保できて楽なため。
*
* globals ... 現在パース中のグローバル変数(たぶんstatic含む)を管理する。
*
* Scope ... 変数(ローカル、グローバル含む)と構造体のタグ名のスコープを管理する
* 変数がlocalsと重複しているが、このScopeの方はなまえの通りScopeの管理もしていて、ブロックスコープの管理をするために、
* localsの中の各変数(+グローバル変数) に関して、その時点でのスコープにある変数のみ保持している。
* なので、 locals >= Scopeのvar_scope という関係になる
*/
// 構造体とeumのタグ
typedef struct TagScope TagScope;
struct TagScope {
TagScope *next;
char *name; // タグ名
Type *ty; // 構造体/enumの型自身
int depth;
};
typedef struct VarScope VarScope;
struct VarScope {
VarScope *next;
char *name;
// 変数の場合に設定
Var *var;
// typedefの場合のみ設定
Type *type_def;
// enumの場合のみ設定
Type *enum_ty;
int enum_val;
int depth;
};
typedef struct Scope Scope;
struct Scope {
VarScope *var_scope;
TagScope *tag_scope;
};
typedef enum {
TYPEDEF = 1 << 0,
STATIC = 1 << 1,
EXTERN = 1 << 2,
} StorageClass;
// 現在パース中のスコープにある変数(ローカル、グローバル含む)を管理する
static VarScope *var_scope;
// 現在パース中のスコープにある構造体のタグ名を管理する
static TagScope *tag_scope;
// 現在パース中のスコープの深さを保持
static int scope_depth;
// 今パース中の関数のローカル変数(+仮引数)
static VarList *locals = NULL;
// グローバル変数
static VarList *globals = NULL;
// 現在処理中のswitch文のノード(caseとdefaultをその後追加していく)
static Node *current_switch = NULL;
static Scope *enter_scope(void) {
Scope *new_scope = calloc(1, sizeof(Scope));
new_scope->var_scope = var_scope;
new_scope->tag_scope = tag_scope;
scope_depth++;
return new_scope;
}
static void leave_scope(Scope *prev_scope) {
var_scope = prev_scope->var_scope;
tag_scope = prev_scope->tag_scope;
scope_depth--;
}
static void push_tag_scope(Token *tag_tok, Type *type) {
TagScope *sc = calloc(1, sizeof(TagScope));
sc->name = my_strndup(tag_tok->str, tag_tok->len);
sc->ty = type;
sc->next = tag_scope;
sc->depth = scope_depth;
tag_scope = sc;
}
static VarScope *push_var_scope_helper(char *name) {
VarScope *sc = calloc(1, sizeof(VarScope));
sc->name = name;
sc->next = var_scope;
sc->depth = scope_depth;
var_scope = sc;
return sc;
}
static void push_var_scope(char *name, Var *var) {
push_var_scope_helper(name)->var = var;
}
static void push_typedef_scope(char *name, Type *type_def) {
push_var_scope_helper(name)->type_def = type_def;
// fprintf(stderr, "push_typedef\n");
// fprintf(stderr, "name: %s\n" ,name);
// fprintf(stderr, "%s\n", type_info(type_def));
}
static void push_enum_scope(char *name, Type *enum_ty, int enum_val) {
VarScope *sc = push_var_scope_helper(name);
sc->enum_ty = enum_ty;
sc->enum_val = enum_val;
}
static TagScope *find_tag(Token *tk) {
for (TagScope *sc = tag_scope; sc; sc = sc->next) {
if (strlen(sc->name) == tk->len && strncmp(sc->name, tk->str, tk->len) == 0) {
// fprintf(stderr, "tag: %s, sc_name: %s\n", my_strndup(tk->str, tk->len), sc->name);
return sc;
}
}
return NULL;
}
static Node *new_node(NodeKind kind, Token *tok) {
Node *node = calloc(1, sizeof(Node));
node->kind = kind;
node->tok = tok;
return node;
}
static Node *new_bin_node(NodeKind kind, Node *lhs, Node *rhs, Token *tk) {
Node *node = new_node(kind, tk);
node->lhs = lhs;
node->rhs = rhs;
add_type(node);
return node;
}
static Node *new_unary_node(NodeKind kind, Node *lhs, Token *tk) {
Node *node = new_node(kind, tk);
node->lhs = lhs;
return node;
}
static Node *new_num_node(long val, Token *tk) {
Node *node = new_node(ND_NUM, tk);
node->val = val;
return node;
}
static Var *new_var(char *name, Type *type, bool is_local) {
Var *var = calloc(1, sizeof(Var));
var->type = type;
var->name = name;
var->is_local = is_local;
// 今のscopeにこの変数を追加
push_var_scope(name, var);
return var;
}
// ローカル変数の確保+このfunctionでのローカル変数のリストにも追加
static Var *new_lvar(char *name, Type *type) {
Var *var = new_var(name, type, true);
VarList *v = calloc(1, sizeof(VarList));
v->var = var;
v->next = locals;
// fprintf(stderr, "new_lvar:next ... %s\n", locals ? "nanika" : "NULL");
locals = v;
return var;
}
static Var *new_gvar(char *name, Type *type, bool emit, bool is_static) {
Var *var = new_var(name, type, false);
var->is_static = is_static;
if (emit) {
// 通常のグローバル変数や、文字列リテラルは.dataセクションに出力するように
// VarListとして保存するが、関数定義などのND_CALLのときのチェックようにしか使わないものは
// (new_varの中でやっている)スコープにのみいれて、
// emit: false で呼び出してコード生成時に何も出力しないようにする。
VarList *v = calloc(1, sizeof(VarList));
v->var = var;
v->next = globals;
globals = v;
}
return var;
}
static int error_at_line_num(char *loc) {
// user_input から loc までの間に何個改行があったか計算
char *p = user_input;
int num_lines = 0;
while (p != loc) {
if (*p == '\n') {
num_lines++;
}
p++;
}
return num_lines;
}
static int get_pos_by_line(char *loc) {
// locがその行で何桁目か返す
char *p = user_input;
int column = 0;
while (p != loc) {
if (*p == '\n') {
column = 0;
} else {
column++;
}
p++;
}
return column;
}
static char *get_error_lines(char *loc) {
int pos = 0;
char *p = user_input;
while (p != loc) {
pos++;
p++;
}
// locまできたら、その行の行末または文字列の最後まですすめる
while (*p && *p != '\n') {
pos++;
p++;
}
return my_strndup(user_input, pos);
}
void error_at(char *loc, char *fmt, ...) {
va_list ap;
va_start(ap, fmt);
int column = get_pos_by_line(loc);
fprintf(stderr, "file: %s\n", filename);
fprintf(stderr, "%s\n", get_error_lines(loc));
fprintf(stderr, "%*s", column, "");
fprintf(stderr, "^ ");
vfprintf(stderr, fmt, ap);
fprintf(stderr, "\n");
exit(1);
}
void error(char *fmt, ...) {
va_list ap;
va_start(ap, fmt);
vfprintf(stderr, fmt, ap);
fprintf(stderr, "\n");
exit(1);
}
static int align_to(int n, int align) {
// chibicc では、
// return (n + align - 1) & ~(align - 1);
// という速そうなコードだった。
// https://github.com/rui314/chibicc/commit/b6d512ee69ea455031cf57612437e238f233a293#diff-2045016cb90d1e65d71c2407a2570927R4
// 取り敢えず挙動としては、align = 8 の場合
// 0 -> 0
// 1.. 8 -> 8
// 9..16 -> 16
// 17..24 -> 24
// ....
// となれば良さそうなのでそうなるように計算する
return ((n / align) + (n % align == 0 ? 0 : 1)) * align;
}
static bool peek_token(char *op) {
if (token->kind != TK_RESERVED ||
token->len != strlen(op) ||
memcmp(token->str, op, token->len)) {
return false;
}
return true;
}
static Token *consume(char *op) {
Token *tk = token;
if (!peek_token(op)) {
return NULL;
}
token = token->next;
return tk;
}
static bool peek_kind(TokenKind kind) {
if (token->kind == kind) {
return true;
}
return false;
}
static Token *consume_kind(TokenKind kind) {
if (!peek_kind(kind)) {
return NULL;
}
Token *t = token;
token = token->next;
return t;
}
static void expect_kind(TokenKind kind) {
if (!consume_kind(kind)) {
error_at(token->str, "トークン %s がありません", token_kind_to_s(kind));
}
}
static Token *consume_ident() {
if (token->kind == TK_IDENT) {
Token *ret = token;
token = token->next;
return ret;
}
return NULL;
}
static void expect(char *op) {
if (token->kind != TK_RESERVED ||
token->len != strlen(op) ||
memcmp(token->str, op, token->len)) {
error_at(token->str, "'%c'(token->kind: %s, token->len: %d, op: %s)ではありません", op, token_kind_to_s(token->kind), token->len, op);
}
token = token->next;
}
static long expect_number() {
if (token->kind != TK_NUM) {
error_at(token->str, "数ではありません。");
}
long val = token->val;
token = token->next;
return val;
}
// strndup が mac側になくてlspでエラーになるので作る
char *my_strndup(char *str, int len) {
char *buf = calloc(len + 1, sizeof(char));
int i;
for (i = 0; i < len; i++) {
buf[i] = str[i];
}
buf[i] = '\0';
return buf;
}
static char *expect_ident() {
if (token->kind != TK_IDENT) {
error_at(token->str, "識別子ではありません。");
}
char *s = my_strndup(token->str, token->len);
token = token->next;
return s;
}
static void expect_token(TokenKind kind) {
if (token->kind != kind) {
error_at(token->str, "トークンが %s ではありません。", token_kind_to_s(kind));
}
token = token->next;
}
// }か }, で終わると受理する
bool consume_end() {
if (consume("}")) {
return true;
}
Token *tmp = token;
if (consume(",") && consume("}")) {
return true;;
}
token = tmp;
return false;
}
static void expect_end() {
if (!consume_end())
expect("}");
}
// }か }, で終わると受理する
bool peek_end() {
Token *tmp = token;
bool result = false;
if (consume("}")) {
result = true;
} else if (consume(",") && consume("}")) {
result = true;;
}
token = tmp;
return result;
}
static bool at_eof() {
return token->kind == TK_EOF;
}
static VarScope *find_var(Token *token) {
for (VarScope *sc = var_scope; sc; sc = sc->next) {
if (sc->type_def) {
// typedef は変数じゃないので無視
continue;
}
if (strlen(sc->name) == token->len &&
strncmp(sc->name, token->str, token->len) == 0) {
return sc;
}
}
return NULL;
}
static Type *find_typedef(Token *tk) {
for (VarScope *sc = var_scope; sc; sc = sc->next) {
if (sc->var) {
// var はtypedefじゃないので無視
continue;
}
assert(sc);
if (strlen(sc->name) == tk->len &&
strncmp(sc->name, tk->str, tk->len) == 0) {
return sc->type_def;
}
}
return NULL;
}
static bool is_builtin_type(Token *tk) {
switch (tk->kind) {
case TK_VOID:
case TK_BOOL:
case TK_INT:
case TK_CHAR:
case TK_LONG:
case TK_SHORT:
return true;
default:
return false;
}
}
static bool is_type(Token *tk) {
if (is_builtin_type(tk)) {
return true;
}
// ビルトインでなくても、typedefか構造体かenumかtypedefされた型ならtrueを返す
// 型の途中でtypedef/static/externが出てくる場合もあるのでtypedef/static/extern自体も型名の一つとしてtrueにしておき
// 詳細はbasetype関数で判断する
switch (tk->kind) {
case TK_TYPEDEF:
case TK_STRUCT:
case TK_ENUM:
case TK_STATIC:
case TK_EXTERN:
return true;
default:
return (bool)find_typedef(tk);
}
}
// ynicc BNF
//
// program = (
// function_def_or_decl
// | global_var_decl
// )*
// basetype = ("void" | "_Bool" | "int" | "char" | "long" | "long" "long" | "short" | struct_decl | typedef_types | enum_decl)
// declarator = "*" * ( "(" declarator ")" | ident ) type_suffix
// abstract_declarator = "*" * ( "(" abstract_declarator")" )? type_suffix
// typename = basetype abstract_declarator type_suffix
// type_suffix = ("[" const_expr? "]" type_suffix)?
// function_def_or_decl = basetype declarator "(" function_params? ")" ("{" stmt* "}" | ";")
// global_var_decl = basetype declarator ( "=" gvar_initializer )? ";"
// stmt = expr ";"
// | ";"
// | "{" stmt* "}"
// | "return" expr? ";"
// | "if" "(" expr ")" stmt ("else" stmt)?
// | "while" "(" expr ")" stmt
// | "do" stmt "while" "(" expr ")"
// | "for" "(" (expr | var_decl)? ";" expr? ";" expr? ")" stmt
// | "switch" "(" expr ")"
// | "case" const_expr ":" stmt
// | "default" ":" stmt
// | var_decl
// | "break" ";"
// | "continue" ";"
// | "goto" ident ";"
// | ident ":" stmt
// var_decl = basetype ( (var_decl_sub ("," var_decl_sub)*) | (static_var_decl_sub ("," static_var_decl)*) ) ";"
// | basetype ";"
// var_decl_sub = declarator ( "=" local_var_initializer)?
// static_vart_decl = declarator ( "=" gvar_initializer)?
// local_var_initializer = local_var_initializer_sub
// local_var_initializer_sub = "{" local_var_initializer_sub ("," local_var_initializer_sub)* "}"
// | assign
// struct_decl = "struct" ident? ("{" struct_member* "}") ?
// struct_member = basetype declarator
//
// 以降の演算子の優先順位は下記参照(この表で上にある演算子(優先度が高い演算子)ほどBNFとしては下にくる)
// http://www.bohyoh.com/CandCPP/C/operator.html
// expr = assign ("," assign)*
// assign = ternary ( ("=" | "+=" | "-=" | "*=" | "/=" | "|=" | "&=" | "^=") assign)?
// ternary = logical_or ("?" expr : expr)?
// const_expr = eval( ternary )
// logical_or = logical_and ( "||" logical_and )*
// logical_and = bit_or ( "&&" bit_or )*
// bit_or = bit_and ( "|" bit_and )*
// bit_xor = bit_and ( "&" bit_and )*
// bit_and = equality ( "^" equality )*
// equality = relational ("==" relational | "!=" relational)*
// relational = shift ("<" shift | "<=" shift | ">" shift | ">=" shift)*
// shift = add ("<<" add | ">>" add)*
// add = mul ("+" mul | "-" mul)*
// mul = cast ("*" cast | "/" cast)*
// cast = "(" typename ")" cast | unary
// unary = "+"? cast
// | "-"? cast
// | "&" cast
// | "*" cast
// | "++" cast
// | "--" cast
// | "!" cast
// | "sizeof" cast
// | "sizeof" "(" type_name ")"
// | "_Alignof "(" type_naem ")"
// | postfix
// postfix = ccompound-literal
// | parimary ("[" expr "]" | "." ident | "->" ident | "++" | "--")*
// compound_literal = "(" type_name ")" "{" (gvar_initializer | local_var_initializer) "}"
// primary = num
// | ident ("(" arg_list? ")")?
// | "(" expr ")"
// | str
Program *program();
static Function *function_def_or_decl();
static Node *stmt();
static Type *basetype(StorageClass *sclass);
static Type *declarator(Type *ty, char **name);
static Type *abstract_declarator(Type *ty);
static Node *var_decl();
static Node *var_decl_sub();
static void static_var_decl_sub(Type *base, StorageClass sclass);
static Node *expr();
static Node *assign();
static Node *ternary();
static long const_expr();
static long eval(Node *node);
static long eval2(Node *node, Var **var);
static Node *bit_and();
static Node *logical_or();
static Node *logical_and();
static Node *bit_or();
static Node *bit_xor();
static Node *equality();
static Node *relational();
static Node *shift();
static Node *add();
static Node *new_add_node(Node *lhs, Node *rhs, Token *tk);
static Node *new_sub_node(Node *lhs, Node *rhs, Token *tk);
static Node *mul();
static Node *cast();
static Node *unary();
static Node *postfix();
static Node *compound_literal();
static Node *primary();
static Node *read_expr_stmt();
static Type *type_suffix(Type *base);
static Type *struct_decl();
static Type *enum_decl();
static char *new_label();
typedef enum {
NEXT_DECL_DUMMY,
NEXT_DECL_FUNCTION_DEF,
NEXT_DECL_GLOBAL_VAR_OR_TYPEDEF,
} next_decl_type;
static next_decl_type next_decl() {
// 先読みした結果今の位置に戻る用に今のtokenを保存
Token *tmp = token;
bool is_func = false;
bool is_global_var = false;
StorageClass sclass = 0;
Type *ty = basetype(&sclass);
if (sclass == TYPEDEF) {
// typedefがあったら、それは関数ではないとみなす
token = tmp;
return NEXT_DECL_GLOBAL_VAR_OR_TYPEDEF;
}
// toplevelでは
// int;
// のような式も合法で、これらは単に無視される。ので、その対応。
if (!consume(";")) {
char *name = NULL;
declarator(ty, &name);
if (consume("(")) {
token = tmp;
return NEXT_DECL_FUNCTION_DEF;
}
}
// 先読みした結果、関数定義かグローバル変数かわかったので、tokenを元に戻す
token = tmp;
// それ以外はグローバル変数
return NEXT_DECL_GLOBAL_VAR_OR_TYPEDEF;
}
static void parse_typedef() {
Type *ty = basetype(NULL);
char *name;
ty = declarator(ty, &name);
expect(";");
push_typedef_scope(name, ty);
}
static Initializer *new_init_val(Initializer *cur, int sz, long val) {
Initializer *initializer = calloc(1, sizeof(Initializer));
initializer->val = val;
initializer->sz = sz;
cur->next = initializer;
return initializer;
}
// addendは labelからのオフセットを指定するときに渡される
static Initializer *new_init_label(Initializer *cur, char *label, long addend) {
Initializer *initializer = calloc(1, sizeof(Initializer));
initializer->label = label;
initializer->addend = addend;
cur->next = initializer;
return initializer;
}
static Initializer *new_init_string(char *p, int len) {
Initializer head = {};
Initializer *cur = &head;
for (int i = 0; i < len; i++) {
cur = new_init_val(cur, 1, p[i]);
}
return head.next;
}
static Initializer *new_init_zero(Initializer *cur, int nbytes) {
for (int i = 0; i < nbytes; i++) {
cur = new_init_val(cur, 1, 0);
}
return cur;
}
// global変数として今パース中の構造体を割り付けるにあたって、
// 各メンバーの間にあるパディングに0を埋めるためのInitializeを確保する
// 例)
// struct {
// char a;
// int b;
// } x;
// というグローバル変数xがある場合、この構造体のメモリ上でのレイアウトは下記のようになる
// +--+
// x -> | | <- char a のアドレス(1バイト, xからのoffset 0)
// +--+
// | | -+-- A
// +--+ |
// | | |
// +--+ |
// | | -+-- B このAからBまでの3byteはアラインメントによるパディングで、ここをゼロで初期化するためのinitializerを生成するのがこの関数
// +--+
// | | <- int b のアドレス(4バイト, xからのoffset 4)
// +--+ |
// | | |
// +--+ |
// | | |
// +--+ |
// | | |
// +--+ <--ここまでがint bの領域
//
// この関数の前提として、 引数のcurがあるメンバーを読んだ直後のInitializerになるので、
// 例えば、 char aの初期化式を読んだ場合は、その初期化式を設定するinitializerがcurとして渡ってくる
static Initializer *emit_struct_padding(Initializer *cur, Type *parent, Member *mem) {
// padding領域の開始位置
int a = mem->offset + mem->ty->size;
// padding領域の終了位置(最後のメンバーの場合、構造体の最後の領域までをパッディングとする
int b = mem->next ? mem->next->offset : parent->size;
int padding_size = b - a; // a, b はそれぞれ上の説明の A, Bのこと。例でいうと b = 4, a = (0 + 1) = 1 となって b - a が 3になり3バイト分ゼロで初期化する
cur = new_init_zero(cur, padding_size);
return cur;
}
static bool is_array_limit_over(Type *ty, int i) {
if (ty->is_incomplete) {
// サイズが不定の場合は無制限にする
return false;
}
return i >= ty->array_size;
}
static void skip_excess_elements2() {
for (;;) {
if (consume("{")) {
skip_excess_elements2();
} else {
// brace以外の場合は何か式があるはずなので読み飛ばす
assign();
}
if (consume_end()) {
return;
}
expect(",");
}
}
static void skip_excess_elements(void) {
expect(",");
fprintf(stderr, "省略された初期化式があります\n");
skip_excess_elements2();
}
static Initializer *gvar_initializer_sub(Initializer *cur, Type *ty) {
Token *cur_tok = token;
if (ty->kind == TY_ARRAY && ty->ptr_to->kind == TY_CHAR) {
Token *str = consume_kind(TK_STR);
if (str) {
if (ty->is_incomplete) {
ty->array_size = ty->size = str->content_length;
ty->is_incomplete = false;
}
int len = str->content_length > ty->array_size ? ty->array_size : str->content_length;
for (int i = 0; i < len; i++) {
cur = new_init_val(cur, 1, str->contents[i]);
}
for (; len < ty->array_size; len++) {
cur = new_init_val(cur, 1, 0);
}
return cur;
}
}
if (ty->kind == TY_ARRAY) {
bool has_open_brace = consume("{");
int i = 0;
if (!peek_token("}")) {
do {
cur = gvar_initializer_sub(cur, ty->ptr_to);
i++;
} while(!is_array_limit_over(ty, i) && !peek_end() && consume(","));
if (has_open_brace && !consume_end()) {
// "{" で始まってるのに、配列のサイズ個の初期化式を読んでもなおまだ初期化式が残っている場合、無視する
skip_excess_elements();
}
}
if (i < ty->array_size) {
for (; i < ty->array_size; i++) {
cur = new_init_zero(cur, ty->ptr_to->size);
}
}
if (ty->is_incomplete) {
ty->array_size = i;
ty->size = ty->ptr_to->size * i;
ty->is_incomplete = false;
}
return cur;
}
if (ty->kind == TY_STRUCT) {
bool has_open_brace = consume("{");
if (!peek_token("}")) {
Member *mem = ty->members;
do {
cur = gvar_initializer_sub(cur, mem->ty);
cur = emit_struct_padding(cur, ty, mem);
mem = mem->next;
} while(mem && !peek_end() && consume(","));
if (has_open_brace && !consume_end()) {
// "{" で始まってるのに、配列のサイズ個の初期化式を読んでもなおまだ初期化式が残っている場合、無視する
skip_excess_elements();
}
if (mem) {
for (; mem; mem = mem->next) {
cur = new_init_zero(cur, mem->ty->size);
}
}
}
return cur;
}
// compound-literal で "{" 初期化式 "}" で初期化する場合に "{" が存在する
// (int) { 1 } とか
bool has_open_brace = consume("{");
Node *expr = ternary();
if (has_open_brace) {
expect_end();
}
// グローバル変数の初期化で別のグローバル変数のアドレス参照のみ使えるため、
// 初期化式の中に最大一つだけ変数を取れる。
// その変数をevalの評価中に合わせて取得し返してもらう。
// その初期化式の値は、 evalの中で見つかった別のグローバル変数を基準にしたアドレス計算の結果をinitializerとする
Var *var = NULL;
long addend = eval2(expr, &var);
if (var) {
// 変数からのオフセットの初期化式だったので、ポインタ演算とみなして実際のバイト数に変換する
int scale = (var->type->kind == TY_ARRAY) ? var->type->ptr_to->size : var->type->size;
return new_init_label(cur, var->name, addend * scale);
}
// 変数がない場合は単にevalの値を定数として設定するinitializerとする
return new_init_val(cur, ty->size, addend);
}
static Initializer *gvar_initializer(Type *ty) {
Initializer head;
gvar_initializer_sub(&head, ty);
return head.next;
}
// グローバル変数のパース
static void global_var_decl() {
StorageClass sclass = false;
Type *type = basetype(&sclass);
if (consume(";")) {
// int; とかの場合
return;
}
char *ident_name;
Token *tk = token;
type = declarator(type, &ident_name);
if (sclass == TYPEDEF) {
expect(";");
push_typedef_scope(ident_name, type);
return;
}
// extern が設定sれていない場合はこのファイルで領域を確保する
// それ以外はどこかのファイルのコンパイルで領域が確保されているはずなので、名前のみ登録
Var *var = new_gvar(ident_name, type, sclass != EXTERN, sclass == STATIC);
if (sclass == EXTERN) {
// extern の場合初期化式は書けず、宣言のみになる
expect(";");
return;
}
if (!consume("=")) {
if (type->is_incomplete) {
error_at(tk->str, "incomplete element type(gvar)");
}
expect(";");
return;
}
var->initializer = gvar_initializer(type);
expect(";");
}
Program *program() {
Function head = {};
Function *cur = &head;
while (!at_eof()) {
switch(next_decl()) {
case NEXT_DECL_FUNCTION_DEF:
{
Function *f = function_def_or_decl();
if (f) {
cur->next = f;
cur = cur->next;
}
}
break;
case NEXT_DECL_GLOBAL_VAR_OR_TYPEDEF:
global_var_decl();
break;
default:
// ここには来ないはず
assert(false);
}
}
Program *program = calloc(1, sizeof(Program));
program->global_var = globals;
program->functions = head.next;
return program;
}
// cの宣言
// - typedefは何回書いても1個とみなされる。またtypedefしたい型名を省略した場合intとしてtypedefされる。
// - 下記は全部合法で、 hogeをint型としてtypedefする
// typedef typedef int hoge;
// typedef typedef hoge
// int typedef hoge;
// int typedef typdef hoge;
//
// このため、変数の宣言をパースしきらないとtypedefかどうかもわからないので、今パースしようとしている場所がtypedef可能かどうかを引数のsclassで渡してもらう。
// その上で、本当にtypedefがあったか、なかったか(=普通の変数宣言だったか)を sclassに設定して返す
// 一方、例えば関数の戻り値の型部分などのようにtypedefが存在しできない場合は sclass をNULLとして渡してもらって判断する。
//
// また、intやlongのように何度か型宣言に含められるものがあり、
// それらの順番まですべてを想定すると大変なので、最大何個まで各型を書けるかの数で判断する方針らしい
// - short型
// short
// short int
// int short
// => shortがある場合はintが1個あっても良い
// - long型
// long
// long long
// long long int
// long int long
// int long long
// => longがある場合は longかintがそれぞれ最大1個あっても良い
//
static Type *basetype(StorageClass *sclass) {
if (!is_type(token)) {
error_at(token->str, "typename expected");
}
// typedef x
// なども合法なのでデフォルトの型をintにしておく
Type *ty = int_type;
// 各型が何回出てきたかを数えるcounter
int counter = 0;
// counterに加えていく値。
// 適当に2回足してもかぶらないようにシフトさせているんだと思う
enum {
VOID = 1 << 0,
BOOL = 1 << 2,
CHAR = 1 << 4,
SHORT = 1 << 6,
INT = 1 << 8,
LONG = 1 << 10,
OTHER = 1 << 12,
};
// storage class が指定可能な場所はまず未定義で初期化
if (sclass) {
*sclass = 0;