Вопрос по r, python – Как удалить повторяющиеся элементы в векторе, аналогично «set» в Python

39

У меня есть вектор с повторяющимися элементами, и я хотел бы удалить их, чтобы каждый элемент появлялся только один раз.

В Python я мог бы построитьSet из вектора, чтобы достичь этого, но как я могу сделать это в R?

Можете ли вы привести некоторые примеры данных, чтобы проиллюстрировать, что вы подразумеваете под «повторением». Не все пользователи R будут иметь представление о том, что "просто" кормят ". вектор к набору & quot; в питоне значит. Повторяя, вы имеете в виду повторяющиеся или смежные повторения? Для бывшего см?duplicated Gavin Simpson
Чтобы удалить только смежные повторы, используйте пример формы ответа нижеv <- c(1, 1, 5, 5, 2, 2, 6, 6, 1, 3)Вы можете сравнить вектор со смещенной версией самого себя:v[c(TRUE, !v[-length(v)] == v[-1])], Он вернется1 5 2 6 1 3сохраняя второе повторение1 это не смежно с первыми. Paul Rougieux

Ваш Ответ

3   ответа
11

но полезно, если вам также нужен логический вектор дубликатов:

v[duplicated(v)]
Error: User Rate Limit ExceededuniqueError: User Rate Limit Exceeded
Error: User Rate Limit ExceededremoveError: User Rate Limit Exceededv[!duplicated(v)]Error: User Rate Limit Exceeded
65

unique функция.

 > v = c(1, 1, 5, 5, 2, 2, 6, 6, 1, 3)
 > unique(v)
 [1] 1 5 2 6 3
1

вы можете сравнить вектор со смещенной версией самого себя:

v <- c(1, 1, 5, 5, 5, 5, 2, 2, 6, 6, 1, 3, 3)
v[c(TRUE, !v[-length(v)] == v[-1])]
[1] 1 5 2 6 1 3

То же самое можно написать немного более элегантно, используяdplyr:

library(dplyr)
v[v != lag(v)]
[1] NA  5  2  6  1  3

АН вернулсяlag() удаляет первое значение, чтобы сохранить первое значение, вы можете изменить значение по умолчанию на значение, которое будет отличаться от первого значения.

v[v != lag(v, default = !v[1])]
[1] 1 5 2 6 1 3

Похожие вопросы