Лучшие dataframe вопросы ИТ разработчиков

  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

, Мы должны использовать функцию агрегирования при повороте, так как поворот всегда находится в контексте агрегации. Функция агрегирования может быть суммой, счетом, средним, минимальным или максимальным, в зависимости от желаемого выхода -

от вопрос уже есть ответ: Как развернуть DataFrame? [/questions/30244910/how-to-pivot-dataframe] 6 ответов Я хочу перенести информационный кадр. Это всего лишь небольшая выдержка из моего исходного кадра данных - from pyspark.sql.functions ...

Задан 06 Nov 2018, 11:30 от cph_sto
  • 11 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Как вычесть предыдущую строку из текущей строки в фрейме данных pandas и применить ее к каждой строке; без использования цикла?

Я использую Python3.5, и я работаю с пандами. Я загрузил фондовые данные из Yahoo Finance и сохранил файлы в CSV. Мои DataFrames загружают эти данные из CSV....

Задан 13 Sep 2016, 22:30 от ZacAttack
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Спасибо @Jezrael, я проверю и обновлю

аюсь сгенерировать df для производства этого ниже JSON. Данные JSON: { "name": "flare", "children": [ { "name": "K1", "children": [ {"name": "Exact", "size": 4}, {"name": "synonyms", "size": 14} ] }, { "name": "K2", "children": [ {"name": ...

Задан 30 Oct 2017, 13:42 от pyco
  • 5 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

Вы можете задавать неправильный вопрос. collect_list потянет все в одного исполнителя. Таким образом, вопрос должен быть, есть ли шанс, который взорвется на вас Если это так, вы должны использовать UDAF. Если нет никакой возможности взорвать collect_list, используйте udf + collect_list.

асто приходится выполнять пользовательские агрегации на фреймах данных в spark 2.1, и я использовал эти два подхода: использование groupby / collect_list для получения всех значений в одной строке, а затем применение UDF для агрегирования ...

Задан 15 Mar 2018, 08:08 от Raphael Roth
  • 6 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Интересный вопрос

аюсь распаковать данные () в кадре данных Pandas, но я продолжаю получать эту ошибку, и я не уверен, почему. Вот мой код с образцом моих данных. Моя попытка исправить это состояла в том, чтобы убрать все строки, где в качестве ...

Задан 26 Mar 2018, 00:21 от Rilcon42
  • 62 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Разделить большой фрейм данных на список фреймов данных на основе общего значения в столбце

У меня есть фрейм данных с 10 столбцами, собирающий действия «пользователей», где один из столбцов содержит идентификатор (не уникальный, идентифицирующий пользователя) (столбец 10). длина фрейма данных составляет около 750000 строк. Я пытаюсь ...

Задан 30 Aug 2013, 07:14 от MartinT
  • 8 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Получите скалярное произведение dataframe с вектором и верните dataframe в Pandas

Я не могу найти запись по методуdot() в официальной документации [http://pandas.pydata.org/pandas-docs/dev/api.html], Однако метод есть, и я могу его использовать. Почему это? По этой теме, есть ли способ вычислить поэлементное умножение каждой ...

Задан 02 Apr 2013, 00:00 от Amelio Vazquez-Reina
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Это дает мне TypeError «не может выполнить __floordiv__ с этим типом индекса: DatetimeIndex»

я есть длинный фрейм данных с индексом временных рядов, как это: datetime number 2015-07-06 00:00:00 12 2015-07-06 00:10:00 55 2015-07-06 00:20:00 129 2015-07-06 00:30:00 5 2015-07-06 00:40:00 3017 2015-07-06 00:50:00 150 2015-07-06 01:00:00 347 ...

Задан 04 Feb 2019, 18:48 от David
  • 24 голосов
  • 8 ответов
  • 0 просмотров
8 ответов

Уникальные значения в каждом из столбцов фрейма данных

Я хочу получить количество уникальных значений в каждом из столбцов фрейма данных. Позволять'скажем, у меня есть следующий фрейм данных:

Задан 04 Nov 2013, 04:01 от Benoit_Plante
  • 52 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Панды сортируются по группам агрегатов и столбцов

Учитывая следующий кадр данных In [31]: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar', 'baz'] * 2, 'B': rand.randn(6), 'C': rand.rand(6) > .5}) In [32]: df Out[32]: A B C 0 foo 1.624345 False 1 bar -0.611756 True 2 baz ...

Задан 18 Feb 2013, 16:55 от beardc
  • 25 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Панды: создавать именованные столбцы в DataFrame из dict

У меня есть словарь объекта формы: my_dict = {id1: val1, id2: val2, id3: val3, ...}Я хочу создать это в DataFrame, где я хочу назвать 2 столбца «business_id» и «business_code». Я пытался: business_df ...

Задан 03 Dec 2013, 00:56 от anonuser0428
  • 33 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Уровни переупорядочения факторов во фрейме данных [дубликаты]

На этот вопрос уже есть ответ здесь:Изменение порядка уровней фактора без изменения порядка значений 7 ответовУ меня есть data.frame, как показано ниже:

Задан 23 Aug 2013, 22:36 от siva82kb
  • 74 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как наиболее эффективно создать словарь из двух панд столбцов Dataframe?

Какой самый эффективный способ организовать следующие панды Dataframe: данные = Position Letter 1 a 2 b 3 c 4 d 5 eв словарь, какalphabet[1 : 'a', 2 : 'b', 3 : 'c', 4 : 'd', 5 : 'e']?

Задан 02 Jul 2013, 12:58 от user1083734
  • 56 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Первая строка кода выполняет слияние. Следующие две строки изменяют имена столбцов в объединенном фрейме. Оператор if заменяет NA на ноль, но только если есть строки с NA.

я есть два data.frames, один только символы и другой с символами и значениями. df1 = data.frame(x=c('a', 'b', 'c', 'd', 'e')) df2 = data.frame(x=c('a', 'b', 'c'),y = c(0,1,0)) merge(df1, df2) x y 1 a 0 2 b 1 3 c 0Я хочу объединить df1 и df2. ...

Задан 11 May 2011, 14:15 от Lisann
  • -2 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

stackoverflow.com/questions/47495118/...

я есть data.frame NOAA_OLR_TEST NOAA_OLR_TEST <- structure(list(DATE_START = structure(c(1170720000, 1170806400, 1170892800, 1170979200, 1171065600, 1171152000, 1171238400, 1171324800, 1171411200, 1171497600), class = c("POSIXct", "POSIXt")), ...

Задан 24 Nov 2017, 13:24 от Pan
  • 1 голос
  • 2 ответа
  • 0 просмотров
2 ответа

Спасибо Хория. твой код тоже работает.

я есть 10 CSV-файлов с именемdata_run1_all.csv, data_run2_all.csv...,data_run10_all.csv, Файлы CSV имеют одинаковые столбцы, но разные строки. Теперь я импортирую их один за другим вdf_run1, df_run2...,df_run10. Могу ли я использовать цикл для ...

Задан 30 Sep 2017, 13:00 от Zheng
  • 23 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

PySpark: несколько условий в предложении когда

Я хотел бы изменить значения ячеек столбца данных (Возраст), где в настоящее время он пуст, и я сделал бы это только в том случае, если другой столбец (Выжив...

Задан 08 Jun 2016, 15:51 от sjishan
  • 4 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Динамическая сортировка столбцов в dplyr путем передачи упорядоченного вектора с именами столбцов для выбора

Я использую приведенный ниже код для генерации простой сводной таблицы:

Задан 03 Dec 2015, 13:19 от Konrad
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Заказать фрейм данных в списке

Если у меня есть список фреймов данных list.dfs <- list(df1 = data.frame(var1 = c(1:3), var2 = c(1:3), var3 = c(1:3)), df2 = data.frame(var1= c(1:3), var2 = c(1:3), var3 = c(1:3)), df3 = data.frame(var1= c(1:3), var2 = c(1:3), var3 = c(3:1)))Как ...

Задан 27 Jan 2014, 20:50 от Brett Phinney
  • 4 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Вывод отформатированной таблицы, печать в консоль R

У меня есть функция, которая обрабатывает некоторые данные, и я хотел бы напечатать промежуточные шаги, пока функция (цикл) продолжается. Я мог бы сделать эт...

Задан 06 Mar 2015, 09:29 от Maximilian
  • 22 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Панды: чистый способ инициализации фрейма данных со списком namedtuple

Я новичок в пандах, поэтому, возможно, я задаю очень глупый вопрос. Обычно инициализация фрейма данных в пандах происходит по столбцам, где я помещаю dict с ключом имен столбцов и значениями подобного списку объекта такой же длины. Но я хотел бы ...

Задан 15 Nov 2013, 23:33 от Mai
  • 28 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как я могу изменить XTS на data.frame и сохранить Index?

У меня есть XTS временных рядов в R следующего формата, и я пытаюсь выполнить некоторую обработку, поднабор и реорганизацию перед экспортом в CSV для работы ...

Задан 02 Aug 2010, 10:24 от phrozenpenguin
  • 46 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Преобразовать все столбцы символов фрейма данных в факторы

Учитывая (ранее существующий) фрейм данных, который имеет столбцы различных типов, каков самый простой способ преобразовать все его символьные столбцы в факторы, не затрагивая какие-либо столбцы других типов? Вот примерdata.frame: df <- ...

Задан 17 Dec 2013, 14:54 от Museful
  • 2 голосов
  • 0 ответов
  • 0 просмотров
0 ответов

 это по умолчанию на самом деле ...

имаю, что падениеNaNs из кадра данных так же просто, какdf.dropna но по какой-то причине это не работает на моем, и я не знаю почему. Вот мой оригинальный фрейм данных: fish_frame1: 0 1 2 3 4 5 6 7 0 #0915-8 NaN NaN NaN NaN NaN NaN NaN 1 NaN ...

Задан 17 Jul 2017, 14:38 от theprowler
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 в теме

Задан 14 Mar 2017, 06:39 от dan
Page 1 of 36
1 2 3 4 5