Общие принципы построения библиотеки

1. Typescript как основа

Вся библиотека построена как обвязка для компилятора typescript (tsc). Из библиотеки интенсивно используются парсер и тайпчекер, а также структуры данных, порождаемые вместе с AST. Это означает, что:

Заменить typescript другим парсером не представляется возможным, поскольку проще написать библиотеку заново.
Для справки относительно парсера, AST и типов можно использовать любые источники, относящиеся к typescript, в том числе:
- https://github.com/Microsoft/TypeScript/wiki/Using-the-Compiler-API
- https://ts-ast-viewer.com/ или https://astexplorer.net/ для изучения AST
Входные файлы должны быть правильными ts(x)-файлами, в ином случае не будет гарантий корректной транспиляции.

2. Принцип ортогональности синтаксических конструкций

Архитектура построения компиляторов в целом и использование AST в частности позволяет использовать относительно независимые обработчики различных синтаксических конструкций. В терминологии библиотеки elephize такие обработчики называются рендерерами (renderer). Каждый рендерер (в идеальном мире) отвечает за свою и только за свою синтаксическую конструкцию. В реальном мире независимости рендереров удается достичь не всегда - часто смысл синтаксических конструкций зависит от контекста. Тем не менее к такой независимости следует всячески стремиться в процессе разработки.

Отдельную категорию в составе elephize составляют рендереры стандартной библиотеки (stdlib renderers), которые отвечают за преобразование отдельных библиотечных вызовов (например, .toString() или Array.prototype.map).

3. Дополнительные слои и подсистемы

Рендереры в процессе работы не только генерируют код, но и общаются с более высокоуровневыми слоями библиотеки, в частности:

Слой поддержки модулей, отвечающий за:
- Поддержку модульности в целом на основе инструкций import-export
- Поддержку react-компонентов, enum-модулей и внешних модулей
- Разрешение путей и раскладывание файлов по папкам и неймспейсам
Слой специфической поддержки react, в частности - поддержки хуков и логики, позволяющей отличить компонент от обычной функции.
Слой вывода типов, необходимый для:
- Корректной генерации операторов и вызовов в случае неоднозначности (например, разница в генерации при обработке .slice() от строки и от массива)
- Генерации типизированных phpdoc-комментариев
Слой удаления неиспользуемого кода, необходимый для корректной очистки серверного кода после удаления из него клиентских обработчиков (например, onclick).

От консольной команды до рендеринга конкретных конструкций

Внешний слой: CLI, опции и связка с tsc

Рассмотрим вкратце схему внешнего слоя:

Жирными стрелками обозначены основные потоки данных, состоящие по большей части из опций компилятора и транслятора. Немного пояснений по компонентам схемы:

cli.ts: точка входа консольной утилиты. Именно она запускается при вызове elephize из командной строки. Здесь мы разбираем опции, переданные непосредственно в cli, добавляем к ним опции из конфигурационного файла, а потом - опции по умолчанию, в дальнейшем этот набор опций используется везде при конфигурировании поведения.
transpile.ts: определяет режим работы (сборка или watch-режим), генерирует bootstrap-файл (содержащий все php-файлы, полезно на случай отсутствия автозагрузки, хотя в общем случае рекомендуется лучше воспользоваться именно автозагрузкой через spl_register_autoload или аналогичные средства), а также копирует готовые файлы стандартной библиотеки elephize по месту назначения.
translateCode (andWatch): функции, делающие одно и то же, но для разных режимов работы библиотеки. Суть в том, чтобы создать программу (т.е. экземпляр объекта Program из пакета typescript) и передать ее на следующий слой. Помимо самой программы также создается и передается ниже объект NodeFlagsStore, единый для всего проекта, по сути являющийся подобием контекста проекта. В типе NodeFlags есть подробные комментарии к каждому полю.

Промежуточный слой: поддержка модульности, UCE, контексты и области видимости

На предыдущем слое голубым цветом был помечен компонент translateProgram - это обычная функция, а по сути своей это точка входа на промежуточный слой. Рассмотрим то, что происходит внутри этой функции.

Всё начинается с функции renderModule, в нее передаются NodeFlagsStore, экземпляр объекта TypeChecker из пакета typescript и набор опций, пришедший из внешнего слоя.
Внутри функции создается объект глобальной области видимости модуля - rootScope, а также два объекта контекста - для двух проходов, о которых далее. Изначально объекты контекстов идентичны и пусты.
Для того, чтобы собрать начальные данные относительно используемых переменных, а потом удалить неиспользуемые, в библиотеке используется двойной проход по AST (корень которого приходит в функцию как корневая нода файла - SourceFile). Процесс состоит из трех шагов:
- На первом проходе (первый вызов функции renderNode, так называемый dry run) мы собираем информацию о том, какие идентификаторы у нас в принципе есть и как они связаны друг с другом, т.е. строим граф связности. Результат рендеринга кода с первого этапа отбрасывается.
- Между проходами на собранном графе связности (который доступен через rootScope) мы вызываем функцию обхода в ширину, которая обходит граф и помечает все достижимые вершины.
- На втором проходе (второй вызов функции renderNode, помечен голубым) у нас уже есть информация о том, используется или нет конкретный идентификатор, соответственно при генерации кода мы можем принять решение о том, рендерить ли этот идентификатор и сопутствующие ему синтаксические конструкции.
Результат рендеринга кода со второго этапа поступает в компонент ModuleRegistry, где регистрируется в качестве одного или нескольких php-модулей. Дополнительные модули могут появиться в случае использования react-компонентов и enum-конструкций, т.к. для их корректного представления на стороне сервера потребовалось использовать полноценные классы.
После того как все исходные файлы были преобразованы, в объекте ModuleRegistry вызывается метод generateContent, который собирает готовый текст php-файла из выражений, полученных при транспиляции. Далее этот текст передается в prettier for php, который обеспечивает консистентное форматирование кода. Далее текст передается в предыдущий слой для записи в файлы.

Внутренний слой: рендереры, поддержка стандартной библиотеки

Функция renderNode принимает конкретный узел AST и пытается его корректно перевести в соответствующее строковое представление на языке php. Внутри содержится большой switch-case по типам синтаксических конструкций, каждая из которых отдается на реализацию конкретному рендереру.

Среди множества рендереров следует упомянуть некоторые, имеющие особый интерес:

Функциональные рендереры - для узлов FunctionDeclaration, FunctionExpression и ArrowFunction - имеют много общего кода, в частности, отвечающего за поддержку замыканий и областей видимости, а также за функциональные react-компоненты.
Рендерер вызова CallExpression - является помимо всего прочего точкой входа для рендереров функций поддержки стандартной библиотеки. По сути все stdlib-рендереры являются частным случаем CallExpression. Кроме того, именно здесь происходит обработки функций react-хуков.
Рендерер EnumDeclaration, порождающий отдельные php-классы для каждой enum-конструкции.

Далее: Обзор рабочего процесса при разработке

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

basic-architecture.md

basic-architecture.md

Общие принципы построения библиотеки

1. Typescript как основа

2. Принцип ортогональности синтаксических конструкций

3. Дополнительные слои и подсистемы

От консольной команды до рендеринга конкретных конструкций

Внешний слой: CLI, опции и связка с tsc

Промежуточный слой: поддержка модульности, UCE, контексты и области видимости

Внутренний слой: рендереры, поддержка стандартной библиотеки

Files

basic-architecture.md

Latest commit

History

basic-architecture.md

File metadata and controls

Общие принципы построения библиотеки

1. Typescript как основа

2. Принцип ортогональности синтаксических конструкций

3. Дополнительные слои и подсистемы

От консольной команды до рендеринга конкретных конструкций

Внешний слой: CLI, опции и связка с tsc

Промежуточный слой: поддержка модульности, UCE, контексты и области видимости

Внутренний слой: рендереры, поддержка стандартной библиотеки