Size: a a a

Конкурсы Telegram

2020 July 07

AD

Aik Dallakyan in Конкурсы Telegram
Хм, интересно. Если новость опубликована на сайте СМИ, который поддерживает Instant view, но нигде не засветилась в ТГ и не обработалась. Следовательно она и в Алгоритмы не попадет 🤔
источник

DK

Danila Kutenin in Конкурсы Telegram
Многие агенства имеют ТГ каналы, скорее всего много попадёт
источник

パベル in Конкурсы Telegram
Не имеешь канал = нет в ленте
источник

MF

Max Fomichev in Конкурсы Telegram
Всем, кто интересуется результатами #dataclustering, хотел бы предложить протестировать мой код, В ходе тестирования возникли очень значительные расхождения между результатами моих тестов и опубликованных тестов, например в категории en/categories/sports я получаю 1179 статей, а на страницу тестов их всего 6 (https://entry1394-dcround2.usercontent.dev/20200525/categories/en/sports.html)

Свой код я тестировал на различных дистрибутивах Linux и не т олько, использовал gcc и clang, виртуальные машины из-под Proxmox и Parallels, анализаторы кода и прочее. Результат всегда воспроизводится с точность 100%

Файл, отправленный боту (1.1GB) - https://www.dropbox.com/s/thrt1z4l6yib5ss/submission.zip

Официальный тестовый датасет - https://data-static.usercontent.dev/DataClusteringDataset0525En.tar.gz

Вывод "./tgnews categories ../20200525 > out.json" - https://www.dropbox.com/s/tgem0ga6j3d7h2y/out.json

Всем спасибо
источник

DK

Danila Kutenin in Конкурсы Telegram
==810212==ERROR: AddressSanitizer: heap-use-after-free on address 0x620000562080 at pc 0x5571ca5b9990 bp 0x7f4802ef6130 sp 0x7f4802ef6128
READ of size 1 at 0x620000562080 thread T10
   #0 0x5571ca5b998f  (/submission/tgnews+0x2b998f)
источник

DK

Danila Kutenin in Конкурсы Telegram
Max Fomichev
Всем, кто интересуется результатами #dataclustering, хотел бы предложить протестировать мой код, В ходе тестирования возникли очень значительные расхождения между результатами моих тестов и опубликованных тестов, например в категории en/categories/sports я получаю 1179 статей, а на страницу тестов их всего 6 (https://entry1394-dcround2.usercontent.dev/20200525/categories/en/sports.html)

Свой код я тестировал на различных дистрибутивах Linux и не т олько, использовал gcc и clang, виртуальные машины из-под Proxmox и Parallels, анализаторы кода и прочее. Результат всегда воспроизводится с точность 100%

Файл, отправленный боту (1.1GB) - https://www.dropbox.com/s/thrt1z4l6yib5ss/submission.zip

Официальный тестовый датасет - https://data-static.usercontent.dev/DataClusteringDataset0525En.tar.gz

Вывод "./tgnews categories ../20200525 > out.json" - https://www.dropbox.com/s/tgem0ga6j3d7h2y/out.json

Всем спасибо
Вот тебе полный дамб heap-use-after free https://pastebin.com/TPxgU0FU

Что происходит с UB в плюсах ты сам и знаешь
источник

DK

Danila Kutenin in Конкурсы Telegram
https://pastebin.com/Qzrj5Wky — со строчками кода
источник

MF

Max Fomichev in Конкурсы Telegram
@Danlark и что это должно мне сказать?  Я про вывод спрашивал...
источник

DK

Danila Kutenin in Конкурсы Telegram
Что у тебя есть проезд по памяти
источник

DK

Danila Kutenin in Конкурсы Telegram
Что будет происходить дальше, C++ не гарантирует
источник

MF

Max Fomichev in Конкурсы Telegram
Так результат какой на выходе?
источник

DK

Danila Kutenin in Конкурсы Telegram
0 байт, потому что проезд по памяти
источник

MF

Max Fomichev in Конкурсы Telegram
не надо ля-ля
источник

IG

Ilya Gusev in Конкурсы Telegram
ну на одной машине один результат, на другой машине - другой
источник

IG

Ilya Gusev in Конкурсы Telegram
не надо ожидать воспроизводимости от бинаря, который ездит по памяти
источник

MF

Max Fomichev in Конкурсы Telegram
@YallenGusev нет там никокого проезда по памяти, более того этот код уже много лет работает на различных проектах - https://github.com/maxoodf/word2vec/blob/master/include/wordReader.hpp
источник

DK

Danila Kutenin in Конкурсы Telegram
explicit stringMapper_t(const std::string &_source):
               mapper_t(_source.c_str(), static_cast<off_t>(_source.length())) {}

w2v::stringMapper_t stringMapper(std::string(tmp.data()));


Разрушение временного объекта у тебя тут
источник

IG

Ilya Gusev in Конкурсы Telegram
Max Fomichev
@YallenGusev нет там никокого проезда по памяти, более того этот код уже много лет работает на различных проектах - https://github.com/maxoodf/word2vec/blob/master/include/wordReader.hpp
ты с кем споришь? с санитайзером? так это заранее проигрышное дело
источник

DK

Danila Kutenin in Конкурсы Telegram
создал временный std::string, взял указатель, вернул обратно — проезд
источник

h

holk in Конкурсы Telegram
Ilya Gusev
ты с кем споришь? с санитайзером? так это заранее проигрышное дело
Ору брат
источник