Size: a a a

Язык программирования Julia / Julia programming language

2020 April 10

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Так что через корень не вариант
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
Ну, в несколько проходов
Нейронка этого тоже не решит - на единичных случаях она всё равно не обучится.
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
Для неё это выбросы будут, которые она предпочтёт игнорировать.
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Андрей Оськин
Ну, в несколько проходов
Нейронка этого тоже не решит - на единичных случаях она всё равно не обучится.
По этому я решил классифицировать вручную 1к имен, а дальше посмотреть на результат
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
VлАDos частично решается через приведение к фонемам, в данном случае vlados
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
что уже близко к vladislav
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
Ну и не корень, а n-граммы.
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Андрей Оськин
Ну и не корень, а n-граммы.
Через них делаю, пытаюсь точнее
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
+ корень не всегда полезен, так как есть aleksandr, alieksander, alyksandyr, sania, sanych, oleksander
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
И т.д
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
А есть aleksandrija
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Что вообще не имя
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Но с корнем san
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
так это тебе надо несколько разных классификаторов одновременно запускать
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
1. является ли слово именем
2. если слово является именем, то каким.
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Андрей Оськин
1. является ли слово именем
2. если слово является именем, то каким.
Я вот тоже думал, но я подумал, и сделал так, что пометил все неимена в датасете для тренировок как класс1
источник

AY

Artem Yurchenko in Язык программирования Julia / Julia programming language
Не знаю, поможет ли это
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
В любом случае, если даже хочется нейронку, имхо лучше уж делать полносвязную сетку обычную.
Имена - короткие слова, нет смысла RNN запускать.
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
Учится дольше, надёжность ниже.
Onehot encoding для букв, делаешь padding, чтобы выровнять слова до одного размера, получаешь тензор 26 x длина слова x количество слов.
источник

АО

Андрей Оськин in Язык программирования Julia / Julia programming language
По последнему измерению нарезаешь батчи.
источник