Size: a a a

2020 March 09

AZ

Alex Zenoo in rupython
казацкому роду.
источник
2020 March 10

V

Volk in rupython
Привет, подайте идею пожалуйста, как можно реализовать следующий функционал: имеется строка большой длины, в которой символы могут повторятся друг за дргуом (ааабаапроввффафффеев). Нужно очистить строку от дубликатов таким образом, что если символ повторяется четное количестов раз - удалить полностью со строки, а если нечетное -  оставить 1 символ. Строка в длину примерно 120к символов. Нужно чтобы как можно быстрее работало. Возможно есть у кого-нибудь идеи?
источник

J

Jmik in rupython
Volk
Привет, подайте идею пожалуйста, как можно реализовать следующий функционал: имеется строка большой длины, в которой символы могут повторятся друг за дргуом (ааабаапроввффафффеев). Нужно очистить строку от дубликатов таким образом, что если символ повторяется четное количестов раз - удалить полностью со строки, а если нечетное -  оставить 1 символ. Строка в длину примерно 120к символов. Нужно чтобы как можно быстрее работало. Возможно есть у кого-нибудь идеи?
Регулярки?
источник

V

Volk in rupython
Jmik
Регулярки?
А такое можно с помощью регулярок провернуть?
источник

VG

Vitaly Gordeev in rupython
Можно - погугли
источник

ЗР

Зайчаток Разума in rupython
Volk
Привет, подайте идею пожалуйста, как можно реализовать следующий функционал: имеется строка большой длины, в которой символы могут повторятся друг за дргуом (ааабаапроввффафффеев). Нужно очистить строку от дубликатов таким образом, что если символ повторяется четное количестов раз - удалить полностью со строки, а если нечетное -  оставить 1 символ. Строка в длину примерно 120к символов. Нужно чтобы как можно быстрее работало. Возможно есть у кого-нибудь идеи?
ну, если без сложностей, то стандартные функции строки
count и replace
наверное ещё index или find для того чтобы найти место первого символа, ну а вставить его в то место, ну как хочешь уже
источник

VG

Vitaly Gordeev in rupython
Зайчаток Разума
ну, если без сложностей, то стандартные функции строки
count и replace
наверное ещё index или find для того чтобы найти место первого символа, ну а вставить его в то место, ну как хочешь уже
Речь идет о быстрой обработке.так что тут лучше regex
источник

V

Volk in rupython
Посоветуете хороший ресурс для изучения регулярок?
источник

ЗР

Зайчаток Разума in rupython
Volk
Посоветуете хороший ресурс для изучения регулярок?
на хабре была хорошая статья
источник

V

Volk in rupython
Зайчаток Разума
на хабре была хорошая статья
Понял, спасибо
источник
2020 March 11

V

Volk in rupython
Сделал без регулярок, может кому интересно
источник

ЗР

Зайчаток Разума in rupython
Volk
Сделал без регулярок, может кому интересно
попробуй)
источник
2020 March 12

V

Volk in rupython
Привет! Сделал парсер страницы. Есть данные, которые, нужно загрузить в бд. Я смог выгрузить в csv файл и после записать данные в бд. Можно ли напрямую с парсера записывать данные в бд? Не могу найти толковой инфы. Если есть полезные ссылки на уроки, скиньте пожалуйста. Буду очень благодарен
источник

ВD

Валентин Dreyk in rupython
Volk
Привет! Сделал парсер страницы. Есть данные, которые, нужно загрузить в бд. Я смог выгрузить в csv файл и после записать данные в бд. Можно ли напрямую с парсера записывать данные в бд? Не могу найти толковой инфы. Если есть полезные ссылки на уроки, скиньте пожалуйста. Буду очень благодарен
Можно конечно. pymysql в помощь, если бд - mysql/mariadb
источник

V

Volk in rupython
Понял, спасибо
источник
2020 March 14

V

Volk in rupython
Если при гет запросе указать атрибут proxies= передав туда схему и адрес, то при парсинге сайт увидит не мой радой ip а тот, который указан в proxies. Это ведь так работает?
источник
2020 March 16

V

Volk in rupython
Народ, нужен совет. Нормально ли при парсинге влкадывать один цикл в другой?
источник

V

Volk in rupython
Могу конкретно объяснить, что делаю и код скинуть
источник

V

Volk in rupython
При просмотре элементов страницы показывается один html, получаю другой хтмл с помощью requests.get.text. С чем может быть связанно?
источник
2020 March 17

J

Jmik in rupython
Volk
При просмотре элементов страницы показывается один html, получаю другой хтмл с помощью requests.get.text. С чем может быть связанно?
С тем что на сайте стоит 302 переадресация а requests по ней не переходит
источник