Телеграмм чат группы compilerdev страница 1409

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Compiler Development

847 membersпожаловаться на группу

2020 May 25

AD

Artyom Drozdov in Compiler Development

Вот кстати вопрос, насколько автовекторизация это хорошо если она только тривиальная. Получается, что незначительное изменение может вдруг сильно ударить по производительности

memset векторизовать получилось - уже хорошо

источник

13:03пожаловаться #1

AK

Andrei Kurosh in Compiler Development

memset векторизовать получилось - уже хорошо

Так мы про библиотечные функции говорим, или про пользовательский код?

источник

13:03пожаловаться #2

M

MaxGraey in Compiler Development

Ну вот взять тот же Hermes. По моему у него как раз необходимый минимум:
https://github.com/facebook/hermes/tree/master/lib/Optimizer/Scalar

facebook/hermes

Hermes is a small and lightweight JavaScript engine optimized for running React Native on Android. - facebook/hermes

источник

13:04пожаловаться #3

AD

Artyom Drozdov in Compiler Development

Так мы про библиотечные функции говорим, или про пользовательский код?

В пользовательском коде наверняка будут аналогичные функции в достаточном количестве. А если делать единообразно, то не будет разницы.

источник

13:05пожаловаться #4

M

MaxGraey in Compiler Development

memset векторизовать получилось - уже хорошо

Так его и руками можно оптимизировать если конечно своя stdlib

источник

13:05пожаловаться #5

AD

Artyom Drozdov in Compiler Development

MaxGraey

Так его и руками можно оптимизировать если конечно своя stdlib

Можно. Но кажется такую векторизацию написать незначительно сложнее, чем оптимизнуть руками.

источник

13:05пожаловаться #6

K

Kitsu in Compiler Development

MaxGraey

DCE, CSE, inlining, constant propagation (const folding) еще DAE (dead argument elimination)

О, есть что-нибудь почитать по инлайнингу? Когда, к примеру его лучше не делать (instruction cache или что-то еще?), когда от него него наоборот профит очень важен (e.g. c++ vtables), и т.д.

источник

13:07пожаловаться #7

A

Alex in Compiler Development

Если так подумать, то я не знаю ни одной серьёзной оптимизации, на которую бы ушло "20% усилий". Но в целом самые необходимые оптимизации - это inline, softpipe (или аналогичные цикловые, при этом на x86 это будет векторизация). Ну и нормальное планирование, разумеется. Остальные оптимизации либо подготавливают контекст для них, либо получают контекст после них

источник

13:09пожаловаться #8

AD

Artyom Drozdov in Compiler Development

Можно. Но кажется такую векторизацию написать незначительно сложнее, чем оптимизнуть руками.

Опять же, как сделал условный memset, появляется простая возможность сделать условный memcpy.

источник

13:10пожаловаться #9

A

Alex in Compiler Development

О, есть что-нибудь почитать по инлайнингу? Когда, к примеру его лучше не делать (instruction cache или что-то еще?), когда от него него наоборот профит очень важен (e.g. c++ vtables), и т.д.

Для того чтобы для vtable применить inline, нужно написать не самую простую девиртуализацию. Но если виртуальный вызов в горячем коде, то эффект будет очень сильным

источник

13:11пожаловаться #10

M

MaxGraey in Compiler Development

О, есть что-нибудь почитать по инлайнингу? Когда, к примеру его лучше не делать (instruction cache или что-то еще?), когда от него него наоборот профит очень важен (e.g. c++ vtables), и т.д.

К сожалению у меня сугубо практический опыт и изучение уже готовых имплементаций. Так что сосоветовать чтиво не смогу, но могу поделиться некоторыми нюансами если интерестно, например о том на каие эвристики можно разделить анализ для инлайна. А вообще конечно нету идеальной и быстрой эвристики, это всегда некий компромисс

источник

13:11пожаловаться #11

A

Alex in Compiler Development

MaxGraey

К сожалению у меня сугубо практический опыт и изучение уже готовых имплементаций. Так что сосоветовать чтиво не смогу, но могу поделиться некоторыми нюансами если интерестно, например о том на каие эвристики можно разделить анализ для инлайна. А вообще конечно нету идеальной и быстрой эвристики, это всегда некий компромисс

Плюсую. Эвристики очень зависят от того как устроен конкретный компилятор. Есть несколько статей о том кто и как реализовывал Inline в своих конкретных системах

источник

13:13пожаловаться #12

PS

Peter Sovietov in Compiler Development

Конечно, все зависит от контекста. И в соотв. контексте сама постановка вопроса по поводу 80/20, на мой взгляд, вполне уместна.
В первую очередь, поиск "джентльменского набора" оправдан там, где нужны легковесные методы компиляции.
Это различные системы частичных вычислений и стадийного программирования, JIT-компиляторы, DSL и спецпроцессоры.

Если говорить о единственном методе, который дает очень хороший результат, то, думаю, у нумерации значений Ершова нет конкурентов. Это пример так называемой комбо-оптимизации, которая включает в себя сразу множество типов преобразований.

источник

13:17пожаловаться #13

МБ

Михаил Бахтерев... in Compiler Development

deforestation важная в контексте ФП.

источник

13:26пожаловаться #14

RS

Rifat S in Compiler Development

Что за нумерация значений у Ершова? Я читал некоторые книги Ершова, как я понял, там описывались некоторые вещи, похожие на SSA. Также там большое внимание уделялось частичным вычислениям.

источник

13:30пожаловаться #15

МБ

Михаил Бахтерев... in Compiler Development

Rifat S

Что за нумерация значений у Ершова? Я читал некоторые книги Ершова, как я понял, там описывались некоторые вещи, похожие на SSA. Также там большое внимание уделялось частичным вычислениям.

Это разные темы. Числа Ершова нужны для размещения данных по регистрам. А частичными вычислениями он занимался в контексте поиска математической модели алгоритмов (вычислимых функций).

источник

13:39пожаловаться #16

PS

Peter Sovietov in Compiler Development

Rifat S

Что за нумерация значений у Ершова? Я читал некоторые книги Ершова, как я понял, там описывались некоторые вещи, похожие на SSA. Также там большое внимание уделялось частичным вычислениям.

В английской терминологии это value numbering, она описана в любом учебнике по оптимизирующим компиляторам.
VN одновременно может производить свертку и продвижение констант, упрощение выражений, экономию выражений (CSE), а также может быть основой для очень эффективного алгоритма построения SSA.

источник

13:40пожаловаться #17

PS

Peter Sovietov in Compiler Development

Михаил Бахтерев

Это разные темы. Числа Ершова нужны для размещения данных по регистрам. А частичными вычислениями он занимался в контексте поиска математической модели алгоритмов (вычислимых функций).

Нет, числа Ершова это несколько иное :)

источник

13:42пожаловаться #18

MO

Mar Ort in Compiler Development

Rifat S

По поводу оптимизаций, кто как считает, какие оптимизации являются оптимизациями, соответствующими принципу Парето, то есть их реализация достаточно проста (20% усилий), но дает значительные улучшения (80% результата). И наоборот какие оптимизации не стоят свеч.

Для архитектур с ограниченным количеством регистров (читай x86) ключевой может оказаться фаза распределения регистров. Беда в том, что оптимизации вроде инлайнига и CSE с регаллокатором плохо дружат.

источник

13:42пожаловаться #19

TS

Timur Safin in Compiler Development

Rifat S

По поводу оптимизаций, кто как считает, какие оптимизации являются оптимизациями, соответствующими принципу Парето, то есть их реализация достаточно проста (20% усилий), но дает значительные улучшения (80% результата). И наоборот какие оптимизации не стоят свеч.

У Владимира Макарова в его MIR для CRuby была табличка оптимизаций, которые дают 70% скорости gcc

Only the most valuable optimization usage:

* function inlining
* global common sub-expression elimination
* variable renaming
* register pressure sensitive loop invariant code motion
* sparse conditional constant propagation
* dead code elimination
* code selection
* fast register allocator with implicit * coalescing hard registers and stack slots for copy elimination

Different optimization levels to tune compilation speed vs generated code performance

No SSA (single static assignment form)

vnmakarov/mir

A light-weight JIT compiler based on MIR (Medium Internal Representation) - vnmakarov/mir

источник

13:43пожаловаться #20