Лучшие pandas вопросы ИТ разработчиков

  • 3 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Самый простой способ чтения CSV-файлов с помощью многопроцессорной обработки в Pandas

Вот мой вопросС кучей файлов .csv (или других файлов). Панды - это простой способ прочитать их и сохранить в

Задан 13 Apr 2016, 02:00 от Han Zhengzu
  • 10 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

тепловая карта морского побережья с использованием pandas

Я изо всех сил пытаюсь втиснуть фрейм данных в пандах в правильный формат для тепловой карты Морского Рога (или на самом деле matplotlib), чтобы создать тепл...

Задан 13 Jun 2016, 12:55 от cancerconnector
  • 8 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

В Pandas Как отсортировать один уровень мультииндекса на основе значений столбца, сохраняя при этом группировку другого уровня

Я сейчас прохожу курс Data Mining в университете, но я немного застрял в проблеме многоиндексной сортировки. Фактические данные включают около 1 млн. Обзоров фильмов, и я пытаюсь проанализировать их на основе американских почтовых индексов, но ...

Задан 05 Dec 2013, 23:55 от Nadamir
  • 19 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Выберите сечение нескольких клавиш в DataFrame

У меня есть DataFrame "df" со столбцами данных (время, тикер) Multiindex и bid / ask / etc: tod last bid ask volume time ticker 2013-02-01 SPY 1600 149.70 150.14 150.17 1300 SLV 1600 30.44 30.38 30.43 3892 GLD 1600 161.20 161.19 161.21 3860Я ...

Задан 17 Mar 2013, 17:19 от joe-ts
  • 41 голос
  • 3 ответа
  • 0 просмотров
3 ответа

Конфигурация Pandas DataFrame vs append

У меня есть список из 4 панелей данных, содержащих день данных о тиках, которые я хочу объединить в один фрейм данных. Я не могу понять поведение concat на моих метках времени. Подробности см. Ниже: data [<class 'pandas.core.frame.DataFrame'> ...

Задан 04 Apr 2013, 18:37 от JPBelanger
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Найти все индексы максимума в Pandas DataFrame

Мне нужно найти все индексы, где максимальное значение (на строку) получено в кадре данных Pandas. Например, если у меня есть dataFrame, как это:

Задан 07 Feb 2014, 12:34 от RafG
  • 5 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Python: numpy / pandas изменяют значения при условии

Я хотел бы знать, существует ли более быстрый и более «питонический» способ сделать следующее, например, используя некоторые встроенные методы. Учитывая pand...

Задан 15 Aug 2014, 12:46 от tryptofame
  • 8 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Python: самый быстрый способ написать панду DataFrame в Excel на нескольких листах

Мне нужно экспортировать 24 кадра данных панд(140 столбцов х 400 строк) впревосходить, каждый на другой лист.я используюпанды встроенный

Задан 16 Sep 2014, 07:52 от Pythonista anonymous
  • 40 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Панды - сделать объект типа d столбца или фактор

В пандах, как я могу преобразовать столбец DataFrame в объект dtype? Или еще лучше, в фактор? (Для тех, кто говорит на R, в Python, как мнеas.factor()?) Кроме того, в чем разница междуpandas.Factor а такжеpandas.Categorical?

Задан 30 Mar 2013, 21:21 от N. McA.
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Попробуйте сбросить индекс:

от вопрос уже есть ответ здесь: Панды Слияния 101 [/questions/53645882/pandas-merging-101] 1 ответIn [88]: c Out[88]: Address Name CustomerID 10 Address for Mike Mike 11 Address for Marcia Marcia In [89]: c.index Out[89]: Int64Index([10, 11], ...

Задан 25 Aug 2017, 21:13 от DmitrySemenov
  • 30 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как получить количество групп в объекте groupby в пандах?

Это было бы полезно, так что я знаю, сколько уникальных групп я должен выполнить вычисления. Спасибо.Предположим, объект groupby называется

Задан 05 Jan 2015, 21:08 от wolfsatthedoor
  • 9 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Чтение нескольких CSV-файлов в Python Dataframe

Основной вариант использования этого вопроса заключается в считывании нескольких файлов журналов CSV из целевого каталога в один DataFrame Python Pandas для быстрого анализа статистики и составления графиков. Идея использования Pandas vs MySQL ...

Задан 05 Apr 2013, 20:40 от user892627
  • 8 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Сортировать индекс даты и времени панд

У меня есть индекс даты и времени панд, который я создаю. Может случиться так, что в процессе строительства отдельные члены не в порядке. Я хочу отсортироват...

Задан 10 Apr 2014, 16:21 от piRSquared
  • 20 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Создание больших фреймов данных Pandas: предварительное распределение против добавления против конкатата

Я смущен производительностью в Pandas при создании большого блока данных для блока. В Numpy мы (почти) всегда видим лучшую производительность, предварительно...

Задан 29 Jul 2015, 02:06 от andrew
  • 11 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Как обновить подмножество мультииндексированных панд DataFrame

Я использую MultiIndexed pandas DataFrame и хотел бы умножить подмножество DataFrame на определенное число. Это так же, какэто [https://stackoverflow.com/questions/12307099/modifying-a-subset-of-rows-in-a-pandas-dataframe] но с ...

Задан 09 Jul 2013, 16:05 от LondonRob
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

@ Л.Чу ты прав в своем понимании. Он считает размер каждой группы.

я есть следующий массив данных Pandas: Name | EventSignupNo | Attended | Points Smith | 0145 | Y | 20.24 Smith | 0174 | Y | 29.14 Smith | 0239 | N | 0 Adams | 0145 | N | 0 Adams | 0174 | Y | 33.43 Morgan | 0239 | Y | 31.23 Morgan | 0244 | Y | ...

Задан 18 Nov 2017, 23:29 от L. Chu
  • 1 голос
  • 2 ответа
  • 0 просмотров
2 ответа

 используя

то я прочитал несколько веток по этому вопросу, и все еще в тупике. Любая помощь будет искренне оценена. У меня есть столбец в кадре данных, который содержит строки дат или ничего. Строки в этом формате:2017-10-17т.е.YYYY-MM-DD. Я хочу ...

Задан 25 Oct 2017, 20:24 от Korzak
  • 0 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Хотя это выглядит не очень хорошо, так как мне нужно переименовать 10 столбцов.

ли способ игнорировать повторяющиеся имена столбцов после использования функции to_excel () панд? Скажи у меняold_wb.xlsx: >> df1 = pd.read_excel('wb1.xlsx') ---------------------merged header-------------------- col1 col2 col3 col1 col4 col1 ...

Задан 15 May 2018, 15:14 от Ricky Aguilar
  • 5 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Датафреймы Pandas для Seaborn Grouped Barchart

У меня есть следующий фрейм данных, который я получил из более крупного фрейма данных, в котором перечислены наихудшие 10 «контрольных возвратов» и соответст...

Задан 27 Jul 2016, 09:43 от Vladimir Nabokov
  • 69 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Преобразование столбца в кадре данных pandas из int в строку

У меня есть dataframe в пандах со смешанными столбцами данных int и str. Я хочу объединить сначала столбцы в рамках данных. Для этого мне нужно преобразоватьint столбец кstr, Я пытался сделать следующее: mtrx['X.3'] = mtrx.to_string(columns = ...

Задан 30 Jul 2013, 14:53 от Malfet
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Python (pandas): хранить фрейм данных в hdf5 с мультииндексом

Мне нужно работать с фреймом данных большого размера с мультииндексом, поэтому я попытался создать фрейм данных, чтобы научиться хранить его в файле hdf5. Фр...

Задан 22 Jul 2014, 16:31 от Davide
  • 2 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Выход:

тавляю таблицу топ-3 культур по округам. В некоторых округах одни и те же сорта культур в одинаковом порядке. Другие округа имеют одинаковые сорта культур в другом порядке. df1 = pd.DataFrame( { "County" : ["Harney", "Baker", "Wheeler", "Hood ...

Задан 17 Feb 2019, 20:21 от JamesMiller
  • 4 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Оптимизация SciPy с группированными границами

Я пытаюсь выполнить оптимизацию портфеля, которая возвращает веса, которые максимизируют мою функцию полезности. Я прекрасно справляюсь с этой частью, включая ограничение, что весовые коэффициенты равны единице, и что весовые коэффициенты также ...

Задан 13 Aug 2013, 20:12 от Brandon Ogle
  • 30 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как эффективно перебирать последовательные фрагменты кадра данных Pandas

У меня большой массив данных (несколько миллионов строк).Я хочу иметь возможность выполнять групповую операцию над ним, но просто группировать по произвольны...

Задан 06 Sep 2014, 10:46 от Andrew Clegg
  • 34 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Фильтр Pandas DataFrame по индексу времени

У меня есть датафрейм для панд с 6:36 до 17:31. Я хочу удалить все наблюдения, где время меньше 8:00:00. Вот моя попытка:

Задан 27 Nov 2013, 01:59 от user2113095
  • 2 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 с транспонировать

ел бы создать несколько круговых диаграмм для каждого континента, чтобы показать количество алкоголя с процентами на нем.Спасибо

Задан 29 May 2017, 07:11 от Penny Pang
  • 2 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Укладка Pandas для групповых боксов

Обычная команда matplotlib boxplot в Python возвращает словарь с ключами для блоков, медианы, усов, листовки и заглавных букв. Это делает укладку действительно легкой. import numpy as np import matplotlib.pyplot as plt import pandas as pd # ...

Задан 18 Oct 2013, 16:00 от Walton Jones
Page 1 of 66
1 2 3 4 5