Size: a a a

Сообщество Python Программистов

2021 February 13

КБ

Кирилл Баст... in Сообщество Python Программистов
Айван
Согласно какой логике? Не вижу паттерна
то что после буквы d могут пойти два любых символа
источник

А

Айван in Сообщество Python Программистов
d1*символ"?
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Айван
d1*символ"?
и d11 является истинной, и его там должно быть больше(но я написал всего 1)
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
while need_cleaning(string):
   string = clean(string)
В общем, бензу плюс
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
while need_cleaning(string):
   string = clean(string)
+
источник

K

KarmaBot in Сообщество Python Программистов
Вы увеличили карму Бензофуран Гетероцикл до 3639.06 (+16.83)
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Если все же интересно что я делал(или пытался) то скажите как называется вот эти штуки \uXXXX\
источник

А

Айван in Сообщество Python Программистов
Кирилл Баст
Если все же интересно что я делал(или пытался) то скажите как называется вот эти штуки \uXXXX\
Юникод, вроде бы
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Кирилл Баст
Если все же интересно что я делал(или пытался) то скажите как называется вот эти штуки \uXXXX\
Unicode escape, емнип
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Айван
Юникод, вроде бы
В общем, при парсинге мне возвращался текст в юникоде. Проблема была в том что .decode не мог декодировать символы смайликов(что логично) и вот собственно я вырезал оттуда все эти смайлики. благо они все имеют начало вида \udXXX\
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Кирилл Баст
В общем, при парсинге мне возвращался текст в юникоде. Проблема была в том что .decode не мог декодировать символы смайликов(что логично) и вот собственно я вырезал оттуда все эти смайлики. благо они все имеют начало вида \udXXX\
\udXXX это ещё и русские буквы, насколько я помню таблицу юникода)
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Language:
py3


Source:
print("ж".encode())


Result:
b'\xd0\xb6'
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
\udXXX это ещё и русские буквы, насколько я помню таблицу юникода)
Да.Это русский текст, это только с ним такое
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Кирилл Баст
Да.Это русский текст, это только с ним такое
Не только с ним)
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
И тебе уже вроде Вадим скидывал функцию unicode_unescape
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
Не только с ним)
Ну , у меня текста будут только eng/rus , eng текста норм возвращаются  в символьном виде, а rus нужно вот такую хрень крч деелтаь
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
И тебе уже вроде Вадим скидывал функцию unicode_unescape
Я же сказал, она не декодирует смайлики
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
И тебе уже вроде Вадим скидывал функцию unicode_unescape
Потому и с помощью цикла(спасибо тебе!) пришлось вырезать их
источник

БГ

Бензофуран Гетероцик... in Сообщество Python Программистов
Кирилл Баст
Я же сказал, она не декодирует смайлики
Ошибку выдаёт или что?
источник

КБ

Кирилл Баст... in Сообщество Python Программистов
Бензофуран Гетероцикл
Ошибку выдаёт или что?
UnicodeEncodeError: 'utf-8' codec can't encode characters in position 995-996: surrogates not allowed
источник