Вопрос по fread, r, data.table – data.table :: fread and Unbalanced "

4

Когда я попытался прочитать CSV-файл с помощьюdata.table:fread(fn, sep='\t', header=T)ДаетНесбалансированный " наблюдается на этой линии " ошибка. Данные имеют 3 целочисленных переменных и 1 строковую переменную. Строки в CSV-файле не заключены в"и да, есть несколько строк, которые содержат" в строковой переменной и" символы не в парах.

Мне интересно, можно лиfread просто игнорировать непарный" в переменной и продолжить чтение данных? Благодарю.

Вот пример данных (только одна запись)

N_ID    VISIT_DATE  REQ_URL REQType
175931  2013-3-8 23:40:30   http://aaa.com/rest/api2.do?api=getSetMobileSession&data={"imei":"60893ZTE-CN13cd","appkey":"android_client","content":"Z0JiRA0qPFtWM3BYVltmcx5MWF9ZS0YLdW1ydXoqPycuJS8idXdlY3R0TGBtU   1
без воспроизведения вашей ошибки там "Мы мало чем можем помочь (если только у вас не возникли именно те проблемы, с которыми выперед лицом). Arun
Я добавил образец записи. Пожалуйста, подтвердите. Спасибо baidao
Можете ли вы добавить первые строки вашего файла к вопросу? Обратите внимание, что fread все еще находится в стадии разработки и содержит кавычки ("\" " а также """") Есть проблемы... agstudy

Ваш Ответ

1   ответ
6

ОБНОВЛЕНИЕ: теперь реализовано в v1.8.11

Из новостей:

Fread теперь принимает кавычки (оба ' а также ") в середине полей, начинается ли поле с " или нет, а ненесбалансированные цитаты ошибка, № 2694. Спасибо baidao за сообщение. Это было известно и задокументировано в верхней части? Fread (текст теперь удален). Если поле начинается с " должно заканчиваться (необходимо, если сам разделитель полей находится в содержимом поля). Встроенные кавычки тоже могут быть в названиях столбцов. Newlines () все еще можетне может быть в кавычках или именах кавычек, пока.

Да, как сказал @agstudy, встроенные кавычки - известная документированная проблема, еще не реализованнаяfread новый. Строго говоря, я полагаю, что эти нет, потому что строка в вашем примере неНачнем с цитаты.

Тем не менее, я'мы подали это как отчет об ошибке, так что это незабыть Будет сделано в следующем выпуске. Спасибо за выделение.

# 2694: Строки, содержащие кавычки, но не начинающиеся с кавычек в fread

спасибо, Мэтью. Я'Я буду продолжать следовать. baidao
@ZacharyST Вы искали README и тестировали? Если проблема не устранена, найдите и +1 (или поднимите новую) проблему с GitHub. Matt Dowle
Это было исправлено? Я'У меня похожая проблема при обработке твитов, я считаю, что в полях tweet_text есть символы \ n, которые следует игнорировать. ZacharyST

Похожие вопросы