Size: a a a

Data Science Chat

2016 June 18

MP

Monty Ponty in Data Science Chat
Что можешь рассказать про нее? Впечатление? Пробывал ли еще какие модели для нее? Я просто нуб с нейронками и потому собрался знакомится с предметом на каких-нибудь интересных примерах)
источник

A

Andrey in Data Science Chat
ignore it
источник
2016 June 20

IN

Ivan Nikitin in Data Science Chat
Ребята, а есть какие интересные конференции в СНГ по теме?
источник

A

Alexander in Data Science Chat
+1
Желательно не в мск, если кто знает
источник

A

Alexander in Data Science Chat
Спасибо
Для мск написано, если я правильно понял, no meet ups
источник
2016 June 21

KM

Klim Merzlyakov in Data Science Chat
Привет!
В слэке есть довольно активное сообщество саентологов.
Там отдельные ветки встреч по разным городам.
Нужно подать заявку вот тут:

http://opendatascience.ru/contacts/ и заходите в канал
источник

A

Alexander in Data Science Chat
😨
источник

KN

Kalash Nikita in Data Science Chat
ФСБ пришла с обысками в петербургскую Саентологическую церковь https://c.the.tj/30072
источник

KM

Klim Merzlyakov in Data Science Chat
Слушайте, я тут NLP-шной ересью занялся.
У меня есть довольно большой корпус текста переписки с тех. поддержкой.
Я хотел сгруппировать вопросы по тематикам.
Для этого хотел лихо-задорно построить граф, где узлами будут уникальные слова, а ребрами связи между словами.
Связью считаю наличие двух слов в одной беседе клиента с тех. поддержкой.
После удаления стоп-слов и стемминга. У меня получилось где-то 130 тыс узлов и порядка 14 млн ребер.
И тут я понял, что ничего не выйдет. Даже небольшие (50 тыс.) сэмплы из этих ребер отрисовываются с большим трудом.
Скажите, я нормальный или вообще не в ту степь полез?..
Может можно как-то еще слова сгруппировать, а потом уже граф строить?
Или графы в NLP строить пропащая затея?
источник

A

Alexander in Data Science Chat
Ты приглашаешь людей в секту саентологов и занялся ересью, я не думаю, что ты нормальный :3
источник

KM

Klim Merzlyakov in Data Science Chat
Мне чел, который графами активно пользуется сказал, что в NLP лучше их не использовать. Я так понимаю вычислительных мощностей потребуется очень много, а выхлоп небольшой.
Еще посоветовали вместо стеминга использовать pymorphy2.
И для выявления тематики текста bigARTM.
Пока вообще не знаю что это и как с этим жить. Покопаюсь - отпишусь, если интересно :)
источник

A

Alexander in Data Science Chat
Что значит зачет?
источник

A

Alexander in Data Science Chat
Я не смотел о чем речь по ссылке, типа шутка какая-то?
источник

KM

Klim Merzlyakov in Data Science Chat
Мы на работе так себя называем)
источник

A

Alexander in Data Science Chat
По ссылке встреча Data scientist'ов
почему они вдруг стали саентологами 🙄
источник

KM

Klim Merzlyakov in Data Science Chat
Alexander
По ссылке встреча Data scientist'ов
почему они вдруг стали саентологами 🙄
Шутка: назвать дата саентиста дата саентологом.
Суть: ирония над тем, что он занимается не наукой, а околонаучной религиозной деятельностью.
источник

A

Alexander in Data Science Chat
Ок
источник

A

Alexander in Data Science Chat
Но ты бы написал хотя бы "встреча дата саентологов" тогда, чтобы как-то намекнуть -_-
источник

KM

Klim Merzlyakov in Data Science Chat
Кстати это не встреча, а сообщество.
Это что-то вроде форума, где подписываешь на тематические каналы.
В т.ч. есть каналы, связанные с встречами с СПб и т.п.
источник

IN

Ivan Nikitin in Data Science Chat
Klim Merzlyakov
Кстати это не встреча, а сообщество.
Это что-то вроде форума, где подписываешь на тематические каналы.
В т.ч. есть каналы, связанные с встречами с СПб и т.п.
вчера, кстати, дёрнул контакты. А в ответ тишина :)
источник