Size: a a a

Data Science Kazakhstan (DS/ML kz)

2020 July 25

AB

Azamat Berdysh in Data Science Kazakhstan (DS/ML kz)
AC
Есть ссылка что нур купили их?
ЛОЛ, не нур, а Nubank, бразильский стартап ))
источник

A

AC in Data Science Kazakhstan (DS/ML kz)
Azamat Berdysh
ЛОЛ, не нур, а Nubank, бразильский стартап ))
Сори. Вижу, что хочу увидеть)))
источник

TC

Tasty Cake in Data Science Kazakhstan (DS/ML kz)
Iv
Где там любители хадупы?
ну да, использовать хадуп для OLTP. Использовать хадуп для мгновенного извлечения данных из петабайтной непартицированной таблицы. лол -)))) А хадуп в онпреме это уже легаси 😉
источник
2020 July 26

К

Кir in Data Science Kazakhstan (DS/ML kz)
Azamat Berdysh
У дикомов, как правило, очень высокое разрешение. Не знаю важно ли это в твоём случае, но DICOM -> JPEG will be a highly lossy compression
источник

К

Кir in Data Science Kazakhstan (DS/ML kz)
Azamat Berdysh
ЛОЛ, не нур, а Nubank, бразильский стартап ))
Теперь я не смогу без улыбки смотреть на лого Нурбанка, буду вспоминать бразильянок и ню :))
источник

YO

Yerzhan Orazayev in Data Science Kazakhstan (DS/ML kz)
ДД, дайте плиз ссылку на датасет казахсих корпусов с большим количеством уникальных токенов.
источник

AM

A. Mak. in Data Science Kazakhstan (DS/ML kz)
Yerzhan Orazayev
ДД, дайте плиз ссылку на датасет казахсих корпусов с большим количеством уникальных токенов.
корпус википедии: https://github.com/chapayevdauren/kazakh-language-corpus

там в ридми есть ссылка на сырой текст и на списки униграммов, биргаммов и триграммов.

униграммов (уникальных токенов) там 11.6+ млн., но это с учётом сохранения регистра (встречаются, например, Халық, ХАЛЫҚ и халық) и с учётом "шума", типа цифирки, слова с остатками пунктуации, например, жыл" (с ковычками на конце), и т.д.
источник

D

Darkhan in Data Science Kazakhstan (DS/ML kz)
A. Mak.
корпус википедии: https://github.com/chapayevdauren/kazakh-language-corpus

там в ридми есть ссылка на сырой текст и на списки униграммов, биргаммов и триграммов.

униграммов (уникальных токенов) там 11.6+ млн., но это с учётом сохранения регистра (встречаются, например, Халық, ХАЛЫҚ и халық) и с учётом "шума", типа цифирки, слова с остатками пунктуации, например, жыл" (с ковычками на конце), и т.д.
👍🏻
источник

AM

A. Mak. in Data Science Kazakhstan (DS/ML kz)
Yerzhan Orazayev
ДД, дайте плиз ссылку на датасет казахсих корпусов с большим количеством уникальных токенов.
вот корпус новостных статей:
https://github.com/makazhan/kazcorpus-news

тут более-менее чистых типов (уникальных алфавитных токенов, без цифр и проч.) 455+ тыс.
источник

AM

A. Mak. in Data Science Kazakhstan (DS/ML kz)
Yerzhan Orazayev
ДД, дайте плиз ссылку на датасет казахсих корпусов с большим количеством уникальных токенов.
вот ещё корпус по-меньше, но зато в формате удобном для обучения язвковых моделек (меленьких, по нынешним меркам)
https://github.com/Baghdat/LSTM-LM
источник

YO

Yerzhan Orazayev in Data Science Kazakhstan (DS/ML kz)
A. Mak.
вот корпус новостных статей:
https://github.com/makazhan/kazcorpus-news

тут более-менее чистых типов (уникальных алфавитных токенов, без цифр и проч.) 455+ тыс.
Рахмет!
источник
2020 July 27

D

Darkhan in Data Science Kazakhstan (DS/ML kz)
источник

NK

ID:0 in Data Science Kazakhstan (DS/ML kz)
Данная группа существует с октября 2017 года
Многие из активных членов этого чата состоят в нем практически с самого создания

За это время в жизни каждого из нас произошло много важных и интересных событий
Мы проводили митапы, радовались успехам друг друга, пытались делиться опытом, ругались на вакансии без вилки,  верили в халяльный дата саенс, защищали права качков и даже научились правильно применять kmeasn++,

Хотелось бы выразить благодарность каждому камраду, внесшего посильный вклад в развитие нашего сообщества!

А меньше чем через 10 минут будет перевернута новая страница в жизни этой телеграм странички
источник

D

Dasten in Data Science Kazakhstan (DS/ML kz)
ой, а что будет
источник

p

panda in Data Science Kazakhstan (DS/ML kz)
бунд
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
правильно применять kmeasn++  научились а писать нет)
источник

e

engliwdevil_ in Data Science Kazakhstan (DS/ML kz)
😂😂😂
источник

N

Noorik in Data Science Kazakhstan (DS/ML kz)
Интрига
источник

RA

Renat Alimbekov in Data Science Kazakhstan (DS/ML kz)
саспенс
источник

N

Noorik in Data Science Kazakhstan (DS/ML kz)
Тишина перед бурей
источник