Телеграмм чат группы dereference_pointer_there страница 69

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Блог*

845 membersпожаловаться на группу

1
«
…
‹
64
65
66
67
68
69
70
›
…
»

2020 December 05

Ну и в годовщину имеет смысл устроить небольшое голосование. Я отобрал пачку наиболее достойных, на мой взгляд, авторских постов, а теперь предлагаю судить вам о том, какой из них лучший. Вот они (ибо ссылки в опросах не работают):

1. Реализация трейта, гарантирующего нулевой размер Self.
2. Написание zero-cost (ну, почти) форматировщиков даты.
3. Эпические "Хроники замыканий" в трёх частях: раз, два, три.
4. Рассказ о lifetime elision и анонимном лайфтайме ('_).
5. Как написать код, за который вас возненавидят коллеги (или о том, как можно абьюзить Deref).
6. Конструирование макроса, переводящего численные константы в строки на этапе компиляции.
7. Тонкий и глубокий анализ недостатков регулярных выражений (aka "Да не бомбит у меня!").

⬇️⬇️⬇️⬇️

#prog #rust
Допустим, ты пишешь на Rust библиотеку и определяешь трейт, для вызова метода которого по каким-то причинам требуется, чтобы Self был ZST. Для удобства дальнейшего изложения сделаем подобное определение:
pub mod foo {
pub trait Foo {
fn requires_zero_size(self) {
println!("requires_zero_size called");
}
}
}
В идеале для этого достаточно было бы навесить на Self ограничение : ZeroSized, который является auto-трейтом, но... Такого трейта в std нет.

Окей, наученный опытом static_assertions, ты пишешь примерно следующее:
pub mod zero_sized {
pub trait ZeroSized: Sized {
#[deny(const_err)] //потому что выше по скоупу может быть #[allow(const_err)]
const I_AM_ZERO_SIZED: ();
}

// blanket impl вместо дефолтного значения, чтобы I_AM_ZERO_SIZED нельзя было переопределить
impl<T: Sized> ZeroSized for T {
const I_AM_ZERO_SIZED: () = [()][std::mem::size_of::<Self>()]; //является ошибкой, если Self имеет ненулевой размер
}
}
…

источник

71723:02пожаловаться #1

Лучший пост?

Окончательные результаты

15%

Трейт, гарантирующий нулевой размер

9%

Форматировщики даты

13%

Хроники замыканий

6%

'_ and friends

17%

Абьюз Deref

11%

Макрос для перевода численных констант в строковой литерал

29%

Регуляр_очки

Проголосовало: 89

источник

64023:02пожаловаться #2

2020 December 06

#prog #rust #моё

Вы что, правда думали, что за всеми празднествами я оставлю вас без поста? Не скрою, идея заманчивая, но я решил ей не поддаваться... Хотя к тому моменту, как я закончу писать этот пост, уже наверняка наступит 6 декабря... Впрочем, достаточно прелюдий — переходим к постановке задачи!

Иногда нам требуется сопоставить значение с одной из строк... Но при этом игнорируя регистр символов. В общем случае это довольно сложная задача, и даже не из-за зависимости от локали, а просто от сложности правил перевода символов из одного регистра в другой. Пока что забьём на это и будем рассматривать только ASCII-строки. Что нам требуется? Чтобы:
а) чтобы можно было сопоставить (ASCII) строку, невзирая на её регистр;
б) чтобы нас предупреждал компилятор о перекрывающихся паттернах (а вот это уже интересно — компилятор требует точного совпадения паттернов для проверки);
в) чтобы по возможности сохранить возможности, предоставляемые match.

Итак, как нам проверить, что строки неодинаковы с точностью до регистра? В принципе, можно сделать уже известным способом const assert, используя соответствующие const fn, но так как я человек ленивый, я пойду по лёгкому пути: я проверю, что все паттерны на самом деле в нижнем регистре, а проверить их уникальность оставлю компилятору.

Итак, переходим к подзадаче: убедиться, что строка состоит из символов ASCII, но в нижнем регистре, на этапе компиляции. Правда, так как мы хотим использовать в паттернах не только буквы, но и, скажем, цифры, правильнее сказать "из символов ASCII не в верхнем регистре". Для решения части "на этапе компиляции" воспользуемся уже знакомым трюком, который я тут вроде уже показывал: заведём новую константу типа [(); 1], а в качестве значения ей присвоим [(); condtion as _], где condition — условие, которое нам нужно проверить. Если condition вычисляется в true (и вычисляется на этапе компиляции в принципе), то as _ приводит булево значение к 1usize, получая выражение [(); 1], соответствующее типу. В противном случае false приводится к 0 и выражение принимает вид [(); 0], вызывая ошибку компиляции из-за несовпадения типов. Теперь всё, что нам остаётся для решения это подзадачи — написать функцию, которую можно вызвать на этапе компиляции и которая проверяет указанное выше условие. Написать такую функцию несколько неудобно из-за ограничений const fn (в частности, мы не можем использовать итераторы), но вполне возможно:

const fn is_ascii_lowercase(s: &str) -> bool {
    let s = s.as_bytes();
    let len = s.len();
    let mut i = 0;
    while i < len {
        if !s[i].is_ascii() || s[i].is_ascii_uppercase() {
            return false;
        }
        i += 1;
    }
    true
}

Ладно, а как нам проверить, что несколько строк записаны в ASCII lowercase? Ну как-как, принимаем список и проходимся о нему:

const fn are_all_ascii_lowercase(ss: &[&str]) -> bool {
    let len = ss.len();
    let mut i = 0;
    while i < len {
        if !is_ascii_lowercase(&ss[i]) {
            return false;
        }
        i += 1;
    }
    true
}

Окей, с этой подзадачей мы разобрались. Как нам теперь убедиться, что все строки разные? А эту задачу мы уже решали: генерируем функцию, которая разбирает строку, и подсовываем в match наши строки — и компилятор всё прекрасно проверяет за нас!

#prog #rust #моё

Как сравнить в Rust две строки, игнорируя регистр символов? Строго говоря, используя лишь стандартную библиотеку — никак, поскольку перевод из одного регистра в другой зависит от локали, но давайте пока проигнорируем эту деталь и притворимся, что среди пользователей нашего приложения нет кого-то, кто живёт в Турции или Азербайджане (а также что у нас нет проблемы нормализования строк).

Итак, как же нам сравнить две строки, игнорируя регистр символов? Большинство Rust-программистов (особенно новичков) напишут что-то вроде этого:

fn equal_ignoring_case(a: &str, b: &str) -> bool {
a.to_lowercase() == b.to_lowercase()
}

Правильное ли это решение? НЕТ, НЕПРАВИЛЬНОЕ, КТО ВООБЩЕ ТАК ПИШЕТ Технически оно верное, но оно делает много лишней работы. Что тут происходит? Сначала под первую строку выделяется место в куче, которое заполняется проходом по строке с преобразованиями по довольно нетривиальным правилам, во время которых выполняется бинарный поиск по захардкоженным таблицам, затем то же самое…

источник

55200:44пожаловаться #3

Отлично, теперь переходим к самому вкусному: написанию макроса! Нам нужно разобрать match, так что начнём с этого:

macro_rules! ascii_case_insensitive {
    (match $value:ident {
        $(... ,)*
        _ => $catch_all:expr $(,)?
    }) => { ... }
}

А теперь на минуту остановимся и подумаем, что из себя представляет паттерн, который мы пытаемся разобрать. В прошлый раз я совершенно упустил из виду, что обычно мы можем перечислить несколько паттернов, разделив их |, равно как и то, что паттерн может также предваряться |. Таким образом, корректный кусок макроса для распознавания паттернов должен выглядеть так:

$(|)? $($pattern:literal)|+

$(|)? отвечает за опциональную черту в начале. $pattern:literal говорит, что $pattern — это литерал, а $(...)|+ говорит о том, что то, что внутри скобок, повторяется один или более раз, и что повторы разделены |. Но постойте-ка, есть же ещё и опциональное охранное выражение! С учётом всего этого паттерн для одной ветви принимает такой вид:

$(|)? $($pattern:literal)|+ $(if $condition:expr)? => $arm:expr,

Отлично, с разбором мы справились (правда, всё так же упустив возможность привязать имена к паттернам). Что мы со всем этим делаем? Мы проверяем, что все строки в нижнем регистре:

#[deny(const_err)]
const _ARE_ALL_ASCII_LOWERCASE: [(); 1] = [(); are_all_ascii_lowercase(&[$($($pattern,)+)*]) as _];

И что они все разные:

#[allow(dead_code)]
fn non_repeating(s: &str) {
    #[deny(unreachable_patterns)]
    match s {
        $($(| $pattern)+ => (),)*
        _ => (),
    }
}

А что нам делать непосредственно самой проверкой? Мы проверяем, что значение равно, за вычетом ASCII-регистра, одному из паттернов... И что охранное выражение также справедливо, если оно есть:

x if ($(x.eq_ignore_ascii_case($pattern))||+) $(&& $condition)? => $arm,

Обратите внимание, здесь мы повторяем (+) выражения для паттернов, разделив их ||.

Что ж, давайте опробуем макрос в действии:

#[derive(Debug)]
enum Example {
    Foo,
    Bar,
    FourtyTwo,
}

impl std::str::FromStr for Example {
    type Err = String;
    fn from_str(s: &str) -> Result<Self, Self::Err> {
        Ok(ascii_case_insensitive!(match s {
            "foo" => Self::Foo,
            "bar" if s.as_bytes()[0].is_ascii_lowercase() => Self::Bar,
            "fourtytwo" | "fourty_two" | "42" => Self::FourtyTwo,
            _ => return Err(s.into()),
        }))
    }
}

fn main() {
    let inputs = [
        "foo",
        "Foo",
        "FOO",
        "bar",
        "bAr",
        "BAR", // ошибка, первый символ в верхнем регистре
        "fourtytwo",
        "Fourtytwo",
        "FOURTYTWO",
        "fourty_two",
        "fOuRtY_tWo",
        "42",
        "bogus",
    ];
    for &input in &inputs[..] {
        println!("{:?}", input.parse::<Example>());
    }
}

Эта программа выдаёт следующее:

Ok(Foo)
Ok(Foo)
Ok(Foo)
Ok(Bar)
Ok(Bar)
Err("BAR")
Ok(FourtyTwo)
Ok(FourtyTwo)
Ok(FourtyTwo)
Ok(FourtyTwo)
Ok(FourtyTwo)
Ok(FourtyTwo)
Err("bogus")

...как и ожидалось. Что будет, если мы попытаемся сделать два одинаковых паттерна? Скажем, так:

            ...
            "foo" | "foo" => Self::Foo,
            ...

Компилятор жалуется:

error: unreachable pattern

А если один из паттернов не в нижнем регистре:

            ...
            "Foo" => Self::Foo,
            ...

то компилятор опять жалуется:

error[E0308]: mismatched types

Всё работает, как и ожидалось! Как всегда, весь код в гисте.

#prog #rust #моё

В Rust есть такая удобная вещь, как сопоставление с образцом (pattern matching), и она работает в том числе и для строк. К сожалению, оно позволяет сопоставлять только строки целиком, но не по частям. В частности (no pun intended), match не позволяет разделить строку на некоторый фиксированный префикс и всё остальное.

Или всё же позволяет? В конце-концов, можно написать так:

match str_value.as_bytes() {
[b'p', b'r', b'e', b'f, b'i', b'x', rest @ ..] => {}
_ => {}
}

, и тут даже будет помогать компилятор — он подскажет нам, если мы будем дважды проверять один и тот же префикс. Но тут есть и недостатки: остаток строки (rets во второй строчке) — не &str, а &[u8], ну и, конечно, это довольно неудобно писать. Первый недостаток отчасти перекрывается str::get_unchecked/std::str::from_utf8_unchecked — отчасти, поскольку в паттерн байта можно написать и часть многобайтового символа, а вот второй недостаток обойти сложнее. В идеале мы бы хотели написать матч в виде сопоставления части строки…

источник

50100:44пожаловаться #4

Как же хочется временами простого человеческого "Вот тебе деньги, возьми их"

источник

49014:18пожаловаться #5

2020 December 07

#prog #article

Обзор истории систем контроля версий с разбором их внутренних устройств в двух частях: первая, вторая.

В тему также интервью с Pierre-Étienne Meunier, ведущим разработчиком Pijul.

The Evolution of Version Control System (VCS) Internals

Compare and contrast the inner workings of some of the most historically significant Version Control Systems, including SCCS, RCS, CVS, Subversion, Git, and Mercurial.

источник

48819:02пожаловаться #6

#prog #rust #article

Статья о том, чего бы автору хотелось видеть для Rust в 2021 году. Всё ключевые моменты выделять не буду (а иначе зачем я вам ссылку даю?), выделю только то, что привлекло моё внимание:

* I want to see Rust shed some of its reputation for being hard to learn

Согласно автору, новички сталкиваются с повышенной нагрузкой при изучении языка, поскольку им приходится учить и сам язык, и то, как писать на нём идиоматичный код. Учить Rust сложно ввиду того, что он схож с мейнстримными ЯП, но при этом довольно сильно от них отличается — достаточно, чтобы предыдущий опыт был не слишком полезен. Одним из следствий этих отличий является то, что лучшие практики из одних языков считаются антипаттернами в Rust (pub/sub, observer pattern), равно как и наоборот (затенение переменных). Автор считает, что новичкам имеет смысл позволить себе писать сначала неаккуратный и/или неидиоматичный код, а улучшать его уже потом. Да, это вопрос чисто психологический, но в интернете чаще выкладывают хороший код и редко — скажем так, не очень хороший, что создаёт определённое психологическое давление. Именно это и пишет автор:

I am not exactly sure how to create the conditions for this outcome. Maybe more people can publish more Rust that looks messy but “just works”.

Собственно, как совершенно справедливо заметил trentj на URLO (что в итоге стало фразой недели в TWiR №360):

"Just because Rust allows you to write super cool non-allocating zero-copy algorithms safely, doesn’t mean every algorithm you write should be super cool, zero-copy and non-allocating."

* More blog posts from developers and management using Rust at work

Особенно автору хочется видеть материалы с информацией о том, почему был выбран именно Rust, и о том, каков был опыт по сравнению с предыдущей реализацией — как правило, написанной на другом языке.

It’s great to hear Rust used in complicated, low-level development, but it would be normalizing to read about more trivial types of applications, just as a way to highlight Rust as being good for general purpose use.

Я со своей стороны могу лишь добавить, что по мере возможности стараюсь закрывать этот пробел в русскоязычном сообществе Telegram. Некоторые из подобных постов на моём канале можно найти по хештегу #successstory.

* More shared experiences from people picking up Rust as a second language.

Во многом перекликается с первым тезисом. Согласно автору, это может поспособствовать двум вещам: показать, что для того, чтобы выучить Rust, не нужно быть каким-то выдающимся человеком, и раскрыть глаза на вещи, которые опытные Rust-разработчики не замечают или воспринимают как должное.

I believe content from this crowd would be my favorites to read since I think they’ll give valid opinions to someone who has been using Rust for years (like me) now overlook or accept without second thoughts.

Rust in 2021

I missed the official call for blog post submissions, I still want to share some ramblings of my hope...

источник

46719:59пожаловаться #7

#prog #rust #article

Тем временем народ настолько звереет от нехватки анонимных сумм-типов в Rust (а RFC для них было немало — Вафель не даст соврать), что пишет свои. В этот раз получилось даже неплохо.

Anonymous Sum Types for Rust Error Handling

Blog post from 18 November 2020

источник

44820:19пожаловаться #8

#prog #rust #article

Небольшая заметка о том, как можно ограничить видимость реализации трейта, используя исключительно имеющиеся возможности системы типов Rust.

Jack Sometimes Writes

Scoped Trait Implementations

источник

46020:29пожаловаться #9

#prog #go #article

Статья о внутреннем устройстве map в Go. К сожалению, в статье длиннющая преамбула о различных вариантах реализации хэш-таблиц в разных языках и крайне мало о собственно реализации в Go.

Ключевая фишка реализации — фактически нетипизированная реализация мапы как таковой, отвечающая структуре hmap. Поле buckets имеет тип unsafe.Pointer, который является аналогом void* из C: может указывать на что угодно. В контексте Go примечателен ещё и тем, что, в отличие от встроенных указателей, он не отслеживается сборщиком мусора. Все мало-мальски интересные функции, манипулирующие map, принимают также указатель на значение типа maptype. В нем описаны характеристики хэш-таблицы — такие, как размер ключей, значений, бакетов, хранятся ли они значения по месту или же хранятся лишь указатели на них, а также функция для хэширования ключей и (через поле тип type_) функции для сравнения значений ключей и значений. Откуда берутся значения для maptype? А их генерирует компилятор автоматически, когда переписывает обращения к map через функции типа mapaccess1/mapaccess2. На этапе же компиляции он может проверить, что для типа ключа map определены операции хэширования и сравнения.

Не знаю, как вам, а мне эта картина кажется весьма шаткой, особенно с учётом комментариев вроде "сохраняйте это определение структуры согласованным с вот этим местом в реализации рефлексии и той части компилятора, которая обходит AST". Ну и дублирование кода между mapaccess1/mapaccess2 не может не радовать.

The Go programming language. Contribute to golang/go development by creating an account on GitHub.

источник

57822:50пожаловаться #10

Если быстро выдернуть чеку у гранаты и поднести ухо к дыре, где была чека, можно услышать, как увеличивается средний мировой IQ.

источник

47423:30пожаловаться #11

2020 December 08

#prog #cpp #suckassstory

https://twitter.com/Nekrolm/status/1334819396590710784

Dmitry /Undefined Behavior/ Sviridkin

C++ настолько современный, что до 17 стандарта самымы простым способом распарсить строковое представление числа с плавающей точкой и не влететь в локали является тупой ручной разбор по одному символу как деды делали

источник

46823:36пожаловаться #12

2020 December 09

#prog #cpp

Длиннющий тред с примерами undefined behavior в C++. По состоянию на этот день в нём 98 записей

Dmitry /Undefined Behavior/ Sviridkin

98. Начиная с C++11, все временные значения живут до ; (end of statement). Начиная с него же появился удобный range based for. Но вот незадача: он раскрывается не в один statement, а в несколько. И временные значения в заголовке цикла могут не дожить... https://t.co/yhMlZDMuFk

источник

71200:03пожаловаться #13

State of #rust community

https://twitter.com/maybewaffle/status/1291662438417551361

just waffle

Rust: игрушечный язык Сидим пилим библиотеку. Мне 17, хиру 16, полунину 18, новеньким 17 и 16. Сплошные дети

источник

48200:28пожаловаться #14

В разработке пост с рабочим названием "как быть, если тебе нужно написать простенький парсер, но nom выглядит перебором"

источник

46000:48пожаловаться #15

Crate was updated: err_or#0.1.0 [docs.rs] [crates.io] [lib.rs]

источник

38914:22пожаловаться #16

А я тут маленький крейтик релизнул 👀

Он добавляет методы Option::{err_or,err_or_else} аналогичные к Option::{ok_or,ok_or_else}

источник

39914:22пожаловаться #17

xxx:

    // This call is safe since ...
    unsafe { ... }

yyy:

.. tomorrow (простите)

#трудовыебудни

источник

46916:42пожаловаться #18

#prog #suckassstory

1С — это не просто язык, это образ мышления.

источник

45818:22пожаловаться #19

Когда у меня спрашивают, почему я не люблю одинэсников. Хотя бы, блять, за это.
Из рабочей переписки. В общем, базу товаров синхронизируем в 1С и мускуле.

источник

44218:22пожаловаться #20

1
«
…
‹
64
65
66
67
68
69
70
›
…
»