Лучшие dataframe вопросы ИТ разработчиков

  • 9голосов
  • 3ответа
  • 0просмотров

как заменить числовые коды метками значений из справочной таблицы?

Этот вопрос связан сэтот вопрос [https://stackoverflow.com/questions/8433523/creating-a-new-variable-from-a-lookup-table] , но не совсем то же самое. Скажи, у меня есть этот фрейм данных, df <- data.frame( id = c(1:6), profession = c(1, 5, 4, ...

Задан May 23, 2017, 11:48 AMотCommunityEric Fail
  • 41голосов
  • 4ответа
  • 0просмотров

Почему не рекомендуется использовать attach () в R, и что я должен использовать вместо этого?

Предположим, что у нас есть фрейм данныхx который содержит столбцыjob а такжеincome, Для обращения к данным в кадре обычно требуются командыx$jobдля данных вjob столбец иx$income для данных вincome колонка. Однако, используя командуattach(x) ...

Задан Feb 06, 2017, 3:04 PMотScarabeeSavedByJESUS
  • 27голосов
  • 4ответа
  • 0просмотров

использовать несколько столбцов в качестве переменных с sapply

у меня естьdataframe и я хотел бы применить функцию, которая принимает значения трех столбцов и вычисляет минимальную разницу между тремя значениями. #dataset df <- data.frame(a= sample(1:100, 10),b = sample(1:100, 10),c= sample(1:100, 10)) ...

Задан Apr 10, 2012, 12:42 PMотAbelzach
  • 10голосов
  • 4ответа
  • 0просмотров

Python Pandas: как превратить DataFrame с «факторами» в матрицу проектирования для линейной регрессии?

Если память меня обслуживает, в R есть тип данных, называемый фактором, который при использовании внутри DataFrame может автоматически распаковываться в необходимые столбцы матрицы регрессионного проектирования. Например, фактор, содержащий ...

Задан Apr 17, 2012, 9:28 PMотSetJmp
  • 1голосов
  • 2ответа
  • 0просмотров

Объединение нескольких CSV-файлов в R

У меня есть около 100 CSV-файлов с общими заголовками, которые я хочу объединить. Заголовками являются "Lat", "Long" и "значение". Я пытаюсь объединить все файлы CSV, так что вывод будет "Lat" "Lon" "Value1" "Value2"..."Value 100"Lat а такжеLon ...

Задан Apr 18, 2012, 1:32 PMотcsgillespieNavin
  • 6голос
  • 1ответ
  • 0просмотров

Нахождение номера столбца и значение второго по величине значения в строке

Я пытаюсь написать некоторый код, который идентифицирует два самых больших значения для каждой строки и предоставляет их номер столбца и значение. df = data.frame( car = c (2,1,1,1,0), bus = c (0,2,0,1,0), walk = c (0,3,2,0,0), bike = ...

Задан Jul 11, 2016, 3:48 PMот989BuckyOH
  • 5голосов
  • 4ответа
  • 0просмотров

ошибка перевода (перекодировки) в r

Вот небольшой пример: X1 <- c("AC", "AC", "AC", "CA", "TA", "AT", "CC", "CC") X2 <- c("AC", "AC", "AC", "CA", "AT", "CA", "AC", "TC") X3 <- c("AC", "AC", "AC", "AC", "AA", "AT", "CC", "CA") mydf1 <- data.frame(X1, X2, X3)Фрейм входных данных X1 ...

Задан Apr 27, 2012, 3:46 PMотjon
  • 357голосов
  • 8ответов
  • 0просмотров

Преобразование объекта Pandas GroupBy в DataFrame

Я начинаю с таких входных данных df1 = pandas.DataFrame( { "Name" : ["Alice", "Bob", "Mallory", "Mallory", "Bob" , "Mallory"] , "City" : ["Seattle", "Seattle", "Portland", "Seattle", "Seattle", "Portland"] } )Который при печати выглядит ...

Задан May 06, 2017, 2:09 PMотjezraelsaveenr
  • 30голосов
  • 4ответа
  • 0просмотров

Самый быстрый способ добавить строки для пропущенных временных шагов?

У меня есть столбец в моих наборах данных, где периоды времени (Time) являются целыми числами от a-b. Иногда для любой группы могут отсутствовать периоды времени. Я хотел бы заполнить эти строкиNA, Ниже приведен пример данных для 1 (из нескольких ...

Задан Feb 21, 2019, 12:24 PMотHenrikMaiasaura
  • 48голосов
  • 4ответа
  • 0просмотров

Почему я получаю X. в именах моих столбцов при чтении фрейма данных?

Я спросилвопрос об этом несколько месяцев назад [https://stackoverflow.com/questions/9098245/r-why-are-xs-added-to-the-names-of-variables-in-my-data-frame] и я подумал, что ответ решил мою проблему, но я снова столкнулся с проблемой, и решение не ...

Задан Jun 27, 2018, 12:20 AMотsmcimikebmassey
  • 43голосов
  • 3ответа
  • 0просмотров

Сравните, если два объекта данных в R равны?

Как проверить, если два объекта, например, фреймы данных равны ли значения в R? Под значением равно я имею в виду, что значение каждой строки каждого столбца одного кадра данных равно значению соответствующей строки и столбца во втором кадре данных.

Задан Feb 02, 2017, 8:22 AMотsmcimindless.panda
  • 49голосов
  • 17ответов
  • 0просмотров

Python / Pandas - графический интерфейс для просмотра DataFrame или Matrix

Я использую пакет Pandas, и он создает объект DataFrame, который в основном представляет собой помеченную матрицу. Часто у меня есть столбцы с длинными строковыми полями или фреймы данных со многими столбцами, поэтому простая команда печати не ...

Задан Jan 04, 2017, 11:02 PMотpiRSquaredRoss R
  • 401голосов
  • 15ответов
  • 0просмотров

Создать пустой data.frame

Я пытаюсь инициализировать data.frame без каких-либо строк. По сути, я хочу указать типы данных для каждого столбца и дать им имена, но в результате не нужно создавать никаких строк. Лучшее, что я смог сделать до сих пор, это что-то вроде: df ...

Задан Aug 29, 2018, 10:31 AMотJaapJeff Allen
  • 28голосов
  • 3ответа
  • 0просмотров

Условно заполнить значения столбцов на основе другого значения столбцов в пандах

у меня естьDataFrame с несколькими столбцами. Один столбец содержит символ, для которого используется валюта, например знак евро или доллар. Другой столбец содержит значение бюджета. Так, например, в одном ряду это может означать бюджет в 5000 ...

Задан Jan 04, 2017, 11:05 PMотpiRSquaredJan Willem Tulp
  • 2голосов
  • 3ответа
  • 0просмотров

r индекс базы данных со значениями условия по вектору

Кажется, это довольно легко, но с тех пор я занят. У меня есть датафрейм (df) с n столбцами и вектором с таким же числом (n) значений. Значения в векторе являются пороговыми значениями для наблюдений в столбцах в кадре данных. Итак, подсказка в ...

Задан Jun 05, 2012, 3:04 PMотmitchbu
  • 75голосов
  • 10ответов
  • 0просмотров

Как распечатать (на бумаге) красиво отформатированный фрейм данных

Я хотел бы напечатать хорошо отформатированные фреймы данных на бумаге, в идеале из сценария. (Я пытаюсь собрать данные с помощью инструмента, автоматически обработать и распечатать их с помощью сценария R). Прямо сейчас я могу записать фрейм ...

Задан Apr 09, 2018, 3:43 PMотFrankDrew Steen
  • 16голосов
  • 4ответа
  • 0просмотров

Извлечение выходных данных из lapply в массив данных

У меня есть некоторый код R, который выполняет некоторые операции извлечения данных для всех файлов в текущем каталоге, используя следующий код: files <- list.files(".", pattern="*.tts") results <- lapply(files, data_for_time, "17/06/2006 ...

Задан May 14, 2012, 8:56 PMотrobintw
  • 32голосов
  • 4ответа
  • 0просмотров

Преобразование данных из длинного формата в широкоформатный с несколькими столбцами мер

У меня возникают проблемы с поиском наиболее элегантного и гибкого способа переключения данных из длинного формата в широкоформатный, когда у меня есть более одной переменной меры, которую я хочу взять с собой. Например, вот простой фрейм данных ...

Задан Mar 15, 2019, 2:38 PMотUwecolonel.triq
  • 15голосов
  • 6ответов
  • 0просмотров

применить функцию к группам столбцов

Как я могу использоватьapply или связанная функция для создания нового фрейма данных, который содержит результаты усреднения строк каждой пары столбцов в очень большом фрейме данных? У меня есть инструмент, который выводитn повторить измерения ...

Задан Mar 30, 2013, 5:31 PMотBen
  • 34голосов
  • 9ответов
  • 0просмотров

Как исправить пробелы в именах столбцов data.frame (удалить пробелы, ввести точки)?

После импорта файла я всегда стараюсь удалять пробелы в именах столбцов, чтобы упростить обращение к именам столбцов. Есть ли лучший способ сделать это иначе, чем использовать transform и затем удалить дополнительный столбец, который создает эта ...

Задан Dec 29, 2015, 8:26 PMотuserJT
  • 3голосов
  • 3ответа
  • 0просмотров

Удаление временного ряда только с нулевыми значениями из фрейма данных

У меня есть фрейм данных с несколькими временными рядами, идентифицированными уникальными идентификаторами. Я хотел бы удалить любой временной ряд, который имеет только 0 значений. Фрейм данных выглядит следующим образом, id date value AAA ...

Задан May 23, 2017, 11:45 AMотCommunitysizeight
  • 3голос
  • 1ответ
  • 0просмотров

Rcpp: рекомендуемая структура кода при использовании фреймов данных с Rcpp (inline)

[Я набросал это как комментарий в другом месте, но решил создать правильный вопрос ...] Что в настоящее время считается «наилучшей практикой» с точки зрения структурирования кода при использовании фреймов данных в Rcpp? Легкость, с которой можно ...

Задан Jun 06, 2012, 9:57 AMотTim P
  • 42голосов
  • 4ответа
  • 0просмотров

Вычислить средние значения ряда по подмножеству столбцов

Учитывая образец фрейма данных: C1<-c(3,2,4,4,5) C2<-c(3,7,3,4,5) C3<-c(5,4,3,6,3) DF<-data.frame(ID=c("A","B","C","D","E"),C1=C1,C2=C2,C3=C3) DF ID C1 C2 C3 1 A 3 3 5 2 B 2 7 4 3 C 4 3 3 4 D 4 4 6 5 E 5 5 3Каков наилучший способ создать ...

Задан Jul 26, 2015, 9:33 AMотArunVinterwoo
  • 5голос
  • 1ответ
  • 0просмотров

Фрейм данных XML для панд

У меня есть XML-файл с тысячами строк, таких как: <Word x1="206" y1="120" x2="214" y2="144" font="Times-Roman" style="font-size:22pt">WORD</Word>Я хочу преобразовать его (все атрибуты) вpandas dataframe, Чтобы сделать это, я мог бы перебрать ...

Задан Jan 04, 2017, 11:16 PMотpiRSquaredroot
  • 74голосов
  • 6ответов
  • 0просмотров

Как переместить столбец в Pandas DataFrame

Я хотел бы переместить столбец в пандDataFrame, но я не смог найти способ сделать это из документации, не переписывая весь DF. кто нибудь знает как это сделать? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 ...

Задан Jun 09, 2017, 12:44 PMотroot
  • 2голосов
  • 2ответа
  • 0просмотров

Удалить строки фрейма данных, чьи ячейки соответствуют заданному вектору

У меня большой фрейм данных с различным количеством столбцов и строк. Я хотел бы найти во фрейме данных значения данного вектора и удалить строки ячеек, которые соответствуют значениям данного вектора. Я хотел бы иметь это как функцию, потому что ...

Задан Jul 05, 2013, 2:43 PMотECII
  • 4голосов
  • 3ответа
  • 0просмотров

Расчет среднечасовых значений по многолетним временным рядам

У меня есть набор данных, заполненный средней скоростью ветра в час за несколько лет. Я хотел бы создать «средний год», в котором для каждого часа рассчитывается средняя скорость ветра за этот час за несколько лет. Как я могу сделать это, ...

Задан Apr 04, 2012, 9:17 AMотPaul HiemstraGerrit Jan
  • 9голосов
  • 4ответа
  • 0просмотров

Преобразование числовой матрицы в data.table (или data.frame)

Надеюсь, здесь есть простой ответ, но я не могу найти его где-либо. У меня есть числовая матрица с помеченными строками и столбцами: 1 2 3 4 a 6 7 8 9 b 8 7 5 7 c 8 5 4 1 d 1 6 3 2Я хотел бы data.table (или data.frame я могу затем ...

Задан Apr 20, 2012, 9:13 AMотMatt DowleIna
  • 23голосов
  • 5ответов
  • 0просмотров

Панды: объединить два столбца в DataFrame

У меня есть пандыDataFrame в котором есть несколько столбцов: Index: 239897 entries, 2012-05-11 15:20:00 to 2012-06-02 23:44:51 Data columns: foo 11516 non-null values bar 228381 non-null values Time_UTC 239897 non-null values dtstamp 239897 ...

Задан Jan 04, 2017, 11:17 PMотpiRSquaredBFTM
  • 1голосов
  • 2ответа
  • 0просмотров

Заполнение матрицы с использованием кадра данных в R

У меня пустая матрицаm: m <- matrix(0, nrow = 4, ncol = 2, byrow = TRUE, dimnames = list(c("sp1", "sp2", "sp3", "sp4"), c("x", "y")))И нужно заполнить матрицу с использованием фрейма данных d d <- data.frame(site = c("x", "y", "u", "v"), ...

Задан Jun 20, 2012, 9:24 AMотA5C1D2H2I1M1N2O1R2T1Elizabeth
  • 15голосов
  • 4ответа
  • 0просмотров

Преобразование массива в data.frame

У меня есть следующая структура данных («атомный вектор?»), Выводимая изdaply вplyr, в которой у меня была функция, возвращающая три разных показателя для каждого предмета, условия и элемента. x = structure(c(-0.93, 0.39, 0.88, 0.63, 0.86, ...

Задан Jun 21, 2012, 4:29 PMотA5C1D2H2I1M1N2O1R2T1Amyunimus
  • 20голос
  • 1ответ
  • 0просмотров

R: Передача фрейма данных по ссылке

У R есть семантика передачи по значению, которая минимизирует случайные побочные эффекты (хорошо). Однако, когда код организован во множество функций / методов для повторного использования / удобочитаемости / обслуживания, и когда этому коду ...

Задан May 23, 2017, 12:09 PMотCommunitySim
  • 92голосов
  • 6ответов
  • 0просмотров

Пропустить строки, содержащие определенный столбец NA

Я хочу знать, как опуститьNA значения в кадре данных, но только в некоторых столбцах, которые меня интересуют. Например, DF <- data.frame(x = c(1, 2, 3), y = c(0, 10, NA), z=c(NA, 33, 22))но я только хочу опустить данные, гдеy ...

Задан Aug 20, 2014, 2:27 AMотJohn Pauluser1489975
  • 1312голосов
  • 29ответов
  • 0просмотров

Переименование столбцов в пандах

У меня есть DataFrame, использующий панды и метки столбцов, которые мне нужно отредактировать, чтобы заменить оригинальные метки столбцов. Я хочу изменить имена столбцов в DataFrameA где исходные имена столбцов: ['$a', '$b', '$c', '$d', ...

Задан Dec 12, 2017, 6:55 PMотjmuhlenkampuser1504276
  • 251голосов
  • 7ответов
  • 0просмотров

pandas + dataframe - выбрать по частичной строке

у меня естьDataFrame с 4 столбцами, из которых 2 содержат строковые значения. Мне было интересно, если есть способ выбрать строки на основе частичного совпадения строк с конкретным столбцом? Другими словами, функция или лямбда-функция, которая ...

Задан Jan 20, 2019, 11:03 AMотnickeuforia
  • 6голосов
  • 2ответа
  • 0просмотров

Разделить data.frame по значению

как я могу разделить следующий data.frame df <- data.frame(var1 = c("a", 1, 2, 3, "a", 1, 2, 3, 4, 5, 6, "a", 1, 2), var2 = 1:14)в списки / группы a 1 1 2 2 3 3 4 a 5 1 6 2 7 3 8 4 9 5 10 6 11 a 12 1 13 2 14Таким образом, в основном, значение ...

Задан Jul 09, 2012, 7:50 PMотuser969113
  • 11голосов
  • 4ответа
  • 0просмотров

Расширить диапазоны, определенные столбцами «от» и «до»

У меня есть фрейм данных, содержащий"name" президентов США, годы, когда они начинаются и заканчиваются в должности, ("from" а также"to" колонны). Вот образец: name from to Bill Clinton 1993 2001 George W. Bush 2001 2009 Barack Obama 2009 2012... ...

Задан Oct 15, 2017, 5:52 PMотHenrikedgester
  • 1голос
  • 1ответ
  • 0просмотров

Как создать один блок-график, используя несколько столбцов и аргумент «разделить»

Мне нужно создать коробочный график из data.frame сthree numeric columnsи использовать аргументsplitотделить коробкиpaint, У меня есть большой data.frame, но мне нужен следующий пример: paint<-c("blue", "black", "red", "blue", "black", "red", ...

Задан Jul 15, 2012, 8:34 PMотRhinoBR
  • 2голосов
  • 2ответа
  • 0просмотров

Заполните пропущенные значения в data.frame данными из того же фрейма данных

Я пытаюсь заполнить полностью внешнюю объединенную таблицу данными ближайшего предыдущего столбца. Фрейм данных у меня выглядит как .. (Ни одна строка не имеет обеих сторон как NA, и таблица отсортирована по дате). date X Y 2012-07-05 00:01:19 ...

Задан Jul 16, 2012, 8:48 PMотGSeebeaglebagel
  • 14голосов
  • 3ответа
  • 0просмотров

Сопоставить значения во фрейме данных со значениями в другом фрейме данных и заменить прежний соответствующим шаблоном из другого фрейма данных

Сложное название, но вот простой пример того, чего я пытаюсь достичь: d <- data.frame(v1 = c(1,2,3,4,5,6,7,8), v2 = c("A","E","C","B","B","C","A","E")) m <- data.frame(v3 = c("D","E","A","C","D","B"), v4 = c("d","e","a","c","d","b"))Значения ...

Задан Jul 17, 2012, 8:15 PMотuser969113
  • 26голос
  • 1ответ
  • 0просмотров

Изменить настройки stringsAsFactors для data.frame

У меня есть функция, в которой я определяюdata.frame что я использую циклы для заполнения данными. В какой-то момент я получаю предупреждение: Warning messages: 1: In [<-.factor(*tmp*, iseq, value = "CHANGE") : invalid factor level, NAs ...

Задан Feb 01, 2018, 10:31 PMотsmciVincentH
  • 15голос
  • 1ответ
  • 0просмотров

Как я могу найти первое и последнее вхождение элемента в data.frame?

Я искал исчерпывающий прямой перевод R для ПЕРВОГО. и ПОСЛЕДНЕЕ. указатели в шагах SAS DATA, но, кажется, не могут их найти. Для тех, кто не знаком с SAS, в первую очередь. является логическим значением, которое идентифицирует первое появление ...

Задан Apr 15, 2017, 9:24 PMотBrian Tompsett - 汤莱恩asteri
  • 11голосов
  • 4ответа
  • 0просмотров

R: общее выравнивание JSON к data.frame

Этот вопрос касается общего механизма для преобразования любого набора нециклических однородных или гетерогенных структур данных в фрейм данных. Это может быть особенно полезно при работе со многими документами JSON или с большим документом JSON, ...

Задан Jul 19, 2012, 3:39 AMотSim
  • 44голосов
  • 3ответа
  • 0просмотров

Рассчитать среднее по группе

У меня есть большой фрейм данных, похожий на это: df <- data.frame(dive=factor(sample(c("dive1","dive2"),10,replace=TRUE)),speed=runif(10)) > df dive speed 1 dive1 0.80668490 2 dive1 0.53349584 3 dive2 0.07571784 4 dive2 0.39518628 5 dive1 ...

Задан Jul 30, 2018, 2:39 PMотJaapJojo Ono
  • 1голосов
  • 5ответов
  • 0просмотров

агрегировать значения из нескольких полей в одно

У меня есть следующий кадр данных в R: objects categories A 162 B 162 B 190 C 123 C 162 C 185 C 190 C 82 C 191 D 185Как видите, есть объекты и категории, к которым они принадлежат. Я хотел бы суммировать категории каждого объекта в списке через ...

Задан Apr 11, 2013, 7:24 PMотMatt Dowlesabsirro
  • 103голосов
  • 2ответа
  • 0просмотров

Назначьте несколько столбцов, используя: = в data.table, по группе

Каков наилучший способ назначить несколько столбцов, используяdata.table? Например: f <- function(x) {c("hi", "hello")} x <- data.table(id = 1:10)Я хотел бы сделать что-то вроде этого (конечно, этот синтаксис неверен): x[ , (col1, col2) := f(), ...

Задан Nov 13, 2018, 1:19 PMотMoody_MudskipperAlex
  • 1голос
  • 1ответ
  • 0просмотров

Как обращаться с «аргументом« несравнимо! = ЛОЖЬ »не используется (пока)»?

Я хочу проверить, является ли строка в data.frame () дубликатом существующей строки. Как уже указывалосьВот [https://stackoverflow.com/questions/5916854/existing-function-for-seeing-if-a-row-exists-in-a-data-frame] Одним из способов может быть ...

Задан May 23, 2017, 10:30 AMотCommunity
  • 448голосов
  • 12ответов
  • 0просмотров

Разница между скобками [] и двойными скобками [[]] для доступа к элементам списка или фрейма данных

R предоставляет два разных метода для доступа к элементам списка или data.frame-[] а также[[]] операторы. Какая разница между двумя? В каких ситуациях я должен использовать один поверх другого?

Задан Aug 09, 2018, 6:27 PMотGregorSharpie
  • 5голосов
  • 2ответа
  • 0просмотров

удалить столбцы с NA из всех информационных фреймов в списке

У меня есть список, состоящий из нескольких фреймов данных. Я хотел бы удалить все столбцы с NA в каждом кадре данных. Обратите внимание, что столбцы, которые нужно удалить, не одинаковы в каждом фрейме данных. Пример данных приведен ниже. Любые ...

Задан Aug 03, 2012, 2:23 PMотKeith W. Larson
Пред12...29След