Size: a a a

R language and Statistical data analysis

2020 April 29

a

aGricolaMZ in R language and Statistical data analysis
О, спасибо, я не знал, посмотрю.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Привет! Я считываю текстовый файл fread-ом. Он определяет новую строку комбинацией \r\n. Попался мерзкий файлик, где такие символы понаставили внутри текстового поля и чтение обрывается на середине. Можете подсказать способ починить этот файлик? Пример в скрине, где сначала правильное разделение строки, потом неправильное, где чтение и ломается.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Alexey Burnakov
Привет! Я считываю текстовый файл fread-ом. Он определяет новую строку комбинацией \r\n. Попался мерзкий файлик, где такие символы понаставили внутри текстового поля и чтение обрывается на середине. Можете подсказать способ починить этот файлик? Пример в скрине, где сначала правильное разделение строки, потом неправильное, где чтение и ломается.
Может регуляркой пройтись, типа за этими символами должно идти число ID?....
источник

А[

Александр [capsula] in R language and Statistical data analysis
Alexey Burnakov
Может регуляркой пройтись, типа за этими символами должно идти число ID?....
А паразитарные переводы только внутри строки? Можно регуляркой пройти, чтобы их на пробелы заменить?
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Александр [capsula]
А паразитарные переводы только внутри строки? Можно регуляркой пройти, чтобы их на пробелы заменить?
они внутри поля. может, двух полей.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Alexey Burnakov
они внутри поля. может, двух полей.
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Вот так в Excel выглядит. сделали переносы внутри поля с текстом
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Alexey Burnakov
Привет! Я считываю текстовый файл fread-ом. Он определяет новую строку комбинацией \r\n. Попался мерзкий файлик, где такие символы понаставили внутри текстового поля и чтение обрывается на середине. Можете подсказать способ починить этот файлик? Пример в скрине, где сначала правильное разделение строки, потом неправильное, где чтение и ломается.
Прочитать файл readLines(), пройтись gsub() по каждой строке, сохранить файл writeLines(), и его уже читать fread
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Юрий 🐙💻🤖📊📈🚬
Прочитать файл readLines(), пройтись gsub() по каждой строке, сохранить файл writeLines(), и его уже читать fread
Ок, не совсем понял, что удалять gsub
источник

AB

Alexey Burnakov in R language and Statistical data analysis
readLines разве не попилит строки по тем же символам,
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Alexey Burnakov
readLines разве не попилит строки по тем же символам,
Возможно, надо проверить, если кусок файла, тут нашлись бы желающие попробовать
источник

АК

Артём Клевцов in R language and Statistical data analysis
Alexey Burnakov
Привет! Я считываю текстовый файл fread-ом. Он определяет новую строку комбинацией \r\n. Попался мерзкий файлик, где такие символы понаставили внутри текстового поля и чтение обрывается на середине. Можете подсказать способ починить этот файлик? Пример в скрине, где сначала правильное разделение строки, потом неправильное, где чтение и ломается.
Есть возможность выложить?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
такое впечатление, что [А-Яа-я]\r\n[А-Яа-я] yflj надо заменять на \\s
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Юрий 🐙💻🤖📊📈🚬
Возможно, надо проверить, если кусок файла, тут нашлись бы желающие попробовать
источник

AB

Alexey Burnakov in R language and Statistical data analysis
readLines тем же страдает
источник

AB

Alexey Burnakov in R language and Statistical data analysis
Артём Клевцов
Есть возможность выложить?
Могу выложить несколько строк, пойдет?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Alexey Burnakov
Могу выложить несколько строк, пойдет?
лучше несколько десятков
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Вот, убрать пустые строки, строку до пустой и после склеить в одну
источник

AB

Alexey Burnakov in R language and Statistical data analysis
выглядит как регулярка. Попробую сам пока...
источник

AB

Alexey Burnakov in R language and Statistical data analysis
источник