Телеграмм чат группы compilerdev страница 2260

17:20пожаловаться #1

Ну. В случае с CST многого сказать не могу — не приходилось делать полноценное CST.
Но проще разделять набор CST нод и набор AST нод. При этом CST и AST будут корректными, только если парсер не сгенерировал ни одной ошибки
А если у вас есть CST, то вы очень легко из него сделаете AST, так как AST отличается от него лишь отсутствием токенов содержащих лишь синтаксический смысл ({, например)

17:22пожаловаться #2

Про ошибки в парсинге это я к тому, что вы не должны получить CST из программы с неправильными конструкциями.
То есть, если пользователь написал func ; foo() {}, то CST:
- Либо не должно в принципе собраться
- Либо вы слегка заморочитесь и сделаете специальный ErrorNode, который в данном примере будет стоять вместо ; после func

17:25пожаловаться #3

Э!

17:26пожаловаться #4

Вот щас обидно было

17:26пожаловаться #5

Да и котёл - такое себе, у него паттерн-матчинг почти не развит

17:26пожаловаться #6

я возможно отдалился слишком сильно. Но это всё я говорю для того, чтобы вы поняли, что "Абстрактные решения" не настолько абстрактные как вы думаете

17:27пожаловаться #7

Если меняется суть языка - добавляются фичи, например - то добавлять в/менять само AST и парсер

17:28пожаловаться #8

ага. вот эту мысль я и пытался донести.
не бойтесь сделать разные типы для нод, так как добавить новый синтаксис это не так сложно

(если конечно из-за этого синтаксиса ваш парсер не превратится из LL в LR 😁)

17:28пожаловаться #9

Правда? Блин, надо было мне новости-то читать

Убежал читать

17:29пожаловаться #10

Во. Это будет абсолютный ад.

Роман Соловьев... in Compiler Development

17:30пожаловаться #11

РС

восстановление ошибок это отдельная тема, да

но все же, из примеров @slowpnir AST - это набор структур для удобного хранения.

но ведь CST заполняется не исходя из описанных в AST структур.

Роман Соловьев... in Compiler Development

17:31пожаловаться #12

РС

где подписать?😂

17:31пожаловаться #13

У тебя есть - в голове - описание того, какие конструкции будут в языке и как они будут вложены. Вот AST и есть тип-описание этой структуры. А парсер будет строить объект этого типа.

17:32пожаловаться #14

Не, у меня парсер возвращает объект типа program как раз

17:33пожаловаться #15

я бы сделал на основе AST 100%.

Так как CST это дерево всё для того же самого языка.

Приведу пример:

func foo

func
foo()

Предположим яп разрешает делать здесь перенос строк. И единственное чем нода FunctionDeclaration в CST будет отличаться от AST аналога это значением, хранящим условный перенос строки.
Вот и всё (на самом деле много где ещё можно такое сделать, но самое главное, что CST не дает вам возможности собрать его из вообще чего угодно — это всё ещё дерево синтаксиса вашей грамматики)

17:34пожаловаться #16

У меня бы оба текста отображались бы в одно и то же AST, c разными location в полях Info у узлов

17:35пожаловаться #17

да. AST будет одно. а вот CST разные

17:36пожаловаться #18

Пора в чате вводить разные синтаксис для типов и значений в сообщениях

17:36пожаловаться #19

И никто не хранит переводы строк в дереве. Я надеюсь, ты имел ввиду, что у имени foo будут другие значения полей line/column