Size: a a a

Natural Language Processing

2020 July 17

CT

Cookie Thief in Natural Language Processing
началось в колхозе утро
источник

CT

Cookie Thief in Natural Language Processing
минус еще один соседний чат
источник

CT

Cookie Thief in Natural Language Processing
это уже скорее грустно, нежели смешно
источник

OS

Oleg Serikov in Natural Language Processing
да ну лан
мб и вправду очень нужна и срочно и сложно и погода сегодня не всюду хорошая
источник

I

I Апрельский... in Natural Language Processing
показалось, что человек последовательно и настойчиво хамит. первый раз решил попробовать воспользоваться таким механизмом (ботом).
предполагаю, что бан — это хороший сигнал что пересмотреть свои манеры. но нужно знать куда их пересматривать. хороший чат — это возможность увидеть, как другие общаются.
думаю, что хорошо бы разбанить попозже. через пару неделек, например.
не знаю как это делается... есть ли тут живые админы?
источник

CT

Cookie Thief in Natural Language Processing
Oleg Serikov
да ну лан
мб и вправду очень нужна и срочно и сложно и погода сегодня не всюду хорошая
ну хз, я ему самолично еще очень давно и про ру гпт говорил, и как завести токенайзер оттуда, и про пплм, и че то с тех пор не сильно что то поменялось
источник

t

toriningen in Natural Language Processing
Cookie Thief
Переслано от Den
добрый день, очень нужна русская модель GPT-2 адаптированная под Transformers без манятокенайзеров местного розлива и завязки на скриптах.
подождите, это не тот, что в DS чате (upd: похоже, в этом чате) требовал ему немедля выдать GPT3 175B, да чтобы в колабе поднялся?
источник

MT

Mikhail Tikhomirov in Natural Language Processing
Да, он тут этого хотел, если я ничего не путаю
источник

CT

Cookie Thief in Natural Language Processing
toriningen
подождите, это не тот, что в DS чате (upd: похоже, в этом чате) требовал ему немедля выдать GPT3 175B, да чтобы в колабе поднялся?
он самый
источник

РН

Роман Некрасов... in Natural Language Processing
коллеги, такой вопрос мучает уже не одну неделю. возможно ли построение востребованных среди практиков баз знаний, базирующихся на сырых (неразмеченных) текстах. другими словами, кодирование знаний в эмбеддинги. у гугла видел эмбеддинг по научным статьям, связанным с вирусом, покрутил его, но не уверен, что прикладникам это интересно.
источник

I

I Апрельский... in Natural Language Processing
хочется спросить про "практиков" — кто это? что у них за требования?

p.s.
про эмбеддинги ремарка, мне кажется, не очень в тему. скорее демонстрирует поверхностность понимания.
источник

РН

Роман Некрасов... in Natural Language Processing
I Апрельский
хочется спросить про "практиков" — кто это? что у них за требования?

p.s.
про эмбеддинги ремарка, мне кажется, не очень в тему. скорее демонстрирует поверхностность понимания.
речь про построение экспертных систем, позволяющих излекать знания в виде запросов к базам сырых текстов, что-то близкое к информационному поиску, только с упором на прикладную область, по сути, систематизация знаний. у Рашке в репозитории NLP есть примеры таких систем.  про эмбеддинги не совсем понял вашу тональность - чего я не понимаю в эмбеддингах?)
источник

I

I Апрельский... in Natural Language Processing
ну сорян за наброс. эмбеддинг — это про векторное пространство. то что мы можем представить что-то в векторном пространстве нам ничего не гарантирует. запросто можно что-то да закодировать. а вот полезно это сделать — это вот надо умудриться.

соответственно:
1) можем ли заэмбеддить "знания"?
да
2) можно ли полезно это сделать?
да
3) может ли это быть настолько полезно, что пригодится "прикладникам"?
не знаю. кто это такие? зависит от задач и требований
источник

I

I Апрельский... in Natural Language Processing
для меня "экспертная система", "информационный поиск" и "систематизация знаний" — разные вещи, например. поэтому когда я вижу это в одном предложение я подозреваю, что тут не очень чего человеку хочется :)
источник

РН

Роман Некрасов... in Natural Language Processing
I Апрельский
ну сорян за наброс. эмбеддинг — это про векторное пространство. то что мы можем представить что-то в векторном пространстве нам ничего не гарантирует. запросто можно что-то да закодировать. а вот полезно это сделать — это вот надо умудриться.

соответственно:
1) можем ли заэмбеддить "знания"?
да
2) можно ли полезно это сделать?
да
3) может ли это быть настолько полезно, что пригодится "прикладникам"?
не знаю. кто это такие? зависит от задач и требований
в SQuAD 2.0 заявлено 50 тыс. вопросов для обучения без учителя (поправьте, если не прав). вот именно такая технология интересует. как без учителя на сырых текстах строить системы для ответа на предметные вопросы
источник

I

I Апрельский... in Natural Language Processing
FB, например, генерирует вопросы, маскируя слова и таким образом избавляет от необходимости разметки

https://github.com/facebookresearch/UnsupervisedQA
источник

РН

Роман Некрасов... in Natural Language Processing
I Апрельский
FB, например, генерирует вопросы, маскируя слова и таким образом избавляет от необходимости разметки

https://github.com/facebookresearch/UnsupervisedQA
Спасибо, полезная ссылка. Ещё нашёл их статью https://arxiv.org/pdf/1906.04980.pdf
источник

ES

Eugene Solomatin in Natural Language Processing
Роман Некрасов
речь про построение экспертных систем, позволяющих излекать знания в виде запросов к базам сырых текстов, что-то близкое к информационному поиску, только с упором на прикладную область, по сути, систематизация знаний. у Рашке в репозитории NLP есть примеры таких систем.  про эмбеддинги не совсем понял вашу тональность - чего я не понимаю в эмбеддингах?)
Без разметки и онтологий любая база " сырых" текстов это только Информационная помойка.
источник

ES

Eugene Solomatin in Natural Language Processing
Как Интернет..
источник

I

I Апрельский... in Natural Language Processing
что под онтологией понимается?
источник