Size: a a a

2021 May 19

SG

Serg Gini in dlang.ru
источник

SG

Serg Gini in dlang.ru
крутую штуку нашёл - однодневный курс за 500$ :) Надо брать ящитаю https://www.theknowledgeacademy.com/ru/courses/programming-training/d-programming-language-training/
источник

Тᅠ

Туночка ᅠᅠ... in dlang.ru
Так тур же есть капец
источник

КП

Константин Пунш... in dlang.ru
Тут в основном БАЗА из тура, и как скачать IDE
источник

KF

Konstantin Firsov in dlang.ru
ммм... очистка текста от тэгов регекспами такая себе оказалась идея, из лент прилетают не простенькие сниппеты, а целиком страницы даже. Погуглил и эксперимента ради взял гошную bluemonday, из простенькой обертки для неё получил .so-либу и вызвал из D через extern. Вроде как работает, тэги вырезает явно получше костылей на регекспах. С другой стороны, если из вызываемой из ди go-функции вернуть, например, неправильный тип, то будет паника, которая, как я понимаю, не ловится обычными recover т.к. она со стороны cgo. Кто-нибудь вызывал го из ди, есть ли способы отлавливать этот случай?
источник

EP

Egor Pugin in dlang.ru
нужно определённые хмл теги удалять?
источник

KF

Konstantin Firsov in dlang.ru
тут как выйдет. в некоторых новостных лентах прилетает целиком страница сайта, со всей разметкой и вложенность тегов там может быть бесконечной, с разными атрибутами и свойствами, между которыми может затесаться нужный текст. Поэтому мне хотелось бы привести это к более-менее читаемому виду. От браузера я отказался, остается вариант - конвертить html в текст.
источник

EP

Egor Pugin in dlang.ru
ну так хмл либы чем не подходят?
источник

KF

Konstantin Firsov in dlang.ru
Какие, dxml? По парсингу rss я лишь понял, что там (как и везде) масса частных случаев - когда в узле есть дети, когда нет, когда можно оттуда доставать текст, когда нет и т.п. и его очень легко положить неаккуратной работой с узлом, поэтому здесь велосипеды меня не устраивают. Пока мне нравится результат гошной либы, пока не заметил серьезных просадок по производительности, да и кликов по новостям для вычитки текста в целом мало. Технически, если мне потребуется oauth, то я буду экспериментировать с markbates/goth.
источник

KF

Konstantin Firsov in dlang.ru
источник

KF

Konstantin Firsov in dlang.ru
ну, кстати чистильщик из arsd вроде тоже как построен на работе с dom
источник

KF

Konstantin Firsov in dlang.ru
но там пропускаются тэги.
источник

KF

Konstantin Firsov in dlang.ru
кстати, сейчас протестирую, обработает ли он этот текст
источник

KF

Konstantin Firsov in dlang.ru
Вот выхлоп дефолтный выхлоп из htmltotext из arsd. Есть вероятность, что я как-то некорректно его использую, но тем не менее тэги он почти  корректно удаляет:
источник

KF

Konstantin Firsov in dlang.ru
источник

KF

Konstantin Firsov in dlang.ru
Технически, ссылки могут пригодится, так что нельзя упрекнуть его в том, что работа некорректна.... но особых настроек я там не заметил.
источник

KF

Konstantin Firsov in dlang.ru
Да по-сути это и не либа даже, а код под потребности автора: https://github.com/adamdruppe/arsd/blob/9dd0a00f0825d7def8048ae1b2ed8b57890c5f44/htmltotext.d#L150
источник

KF

Konstantin Firsov in dlang.ru
хотя можно регекспом ссылки после него вырезать, как вариант, но там почти нет никаких настроек  и это меня печалит
источник
2021 May 20

Е

Евгений in dlang.ru
У него все либы такие. Под его потребности. Но работают.
Я тут вчера прикола ради сделал игру "змейка" на его simpledisplay.d
Завелось на линуксе сразу, бинарник 350кб весит.
источник

Е

Евгений in dlang.ru
Из которых, наверное, 300 это неиспользуемые строки и 45 сборщик мусора :)
источник