Size: a a a

2021 May 04

МС

Мак Сим in SPb Python
Я думаю тут одним re-паттерном не обойдётся. Придётся 'велосипед' самому придумывать)
источник

SK

Sergio Keler in SPb Python
Надо нейронную сеть натренировать ;)
Возьми все наименования, выдели там модель, скорми нейронке. Потом жаргонные названия типа лыжа яблоко или хуявей. Модели тоже бывают типа бнв хз или сяоми ноте5.
Вот. Получишь прекрасный инструмент :D
источник

DG

Donat Gorbachev in SPb Python
Можно где-нибудь напарсить готовых, размеченных данных и натренировать...

А потом придумать, как эти данные сопоставлять
источник

DG

Donat Gorbachev in SPb Python
А походу из названия модели телека можно еще и параметры извлечь https://uk.pcmag.com/tvs/123682/what-do-tv-model-numbers-and-skus-actually-mean-how-to-know-if-youre-getting-a-good-deal
источник

DG

Donat Gorbachev in SPb Python
https://gadgets.ndtv.com/tv/led-tv <- отсюда можно попарсить
источник

GO

Gor Ohanyan in SPb Python
Пацаны кто умеет делать лаунчер самп
источник

МС

Мак Сим in SPb Python
Это не 'велосипед', а 'ВЕЛОСИПЕЕЕДИИЩЕЕЕЕЕЕ')))))
источник

МС

Мак Сим in SPb Python
Намешаю все в кучу и посмотрим. Тема просто актуал для обработки прайсов разных
источник

DG

Donat Gorbachev in SPb Python
https://spacy.io/ вот эту штуку для более-менее адекватного поиска можно заюзать. Там можно и выцепить инфу про деньги и фильтрануть по регуляркам. А дальше уже в зависимости от найденого либо по расстоянию Левенштейна поискать, либо еще как-нибудь.
источник

DG

Donat Gorbachev in SPb Python
Она вроде как даже по регуляркам ищет быстрее, чем просто cpython, ну и понятно, позволяет более сложный поиск строить
источник

A

Alexander in SPb Python
Ты бы написал, в каком формате тебе выходные данные приходят. Это текст или это изображения или видео вообще
источник

SK

Sergio Keler in SPb Python
Дык.
Я предложил руками всё сделать, фактически ;)
источник

МС

Мак Сим in SPb Python
Задача банальная, но задолбавшая. Нужно две таблицы обработать: в первой взять название продукта, найти его второй и перекинуть в первую параметры. Полные названия просто разные, и Модель продукта получается в названии самое приоритетное
источник

S

Serg in SPb Python
Надо в ЦЕРН звонить, их суперкомпьютеры нужны, чтобы нейронную сеть заюзать... 😂😂😂
источник

S

Serg in SPb Python
Ребята тут уже подкатили тяжёлую артиллерию... 💪😎
источник

S

Serg in SPb Python
А таблицы в каком формате у вас? HTML, PDF? Может быть их поучиться в csv распарсить?
источник

DI

Danil Ivanov in SPb Python
Скинь лучше пример
источник

DG

Donat Gorbachev in SPb Python
Аааааа дак тут вообще всё проще, чем было описано ранее. Я думал, что есть текст и из него надо название выцеплять. Типо есть текст: "Телевизор Sony XXX продавался за $500". Тут никаких spacy не нужно
источник

DG

Donat Gorbachev in SPb Python
Тут надо ручками придумать алгоритм, как распарсить модель. Скинь пожалуйста пример данных
источник

DG

Donat Gorbachev in SPb Python
Надо уже вводить какие-то правила по вопросам. А то постоянно оказывается, что ТЗ совершенно другое))))
источник