Лучшие statistics вопросы ИТ разработчиков

  • 15 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Почему не желательно получать статистическую сводную информацию для коэффициентов регрессии из модели glmnet?

У меня есть модель регрессии с бинарным результатом. Я установил модель с помощью glmnet и получил выбранные переменные и их коэффициенты. Поскольку glmnet не рассчитывает важность переменных, я бы хотел передать точный вывод (выбранные ...

Задан 17 Oct 2012, 15:01 от TongZZZ
  • 7 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

@ Кристофф, если вы нашли этот ответ полезным и именно это вы и искали, рассмотрите возможность принять его как правильный ответ (маленькая серая галочка, которая становится зеленой, когда вы нажимаете на нее).

ководство по выборуВ частности, я имею в виду тот, что в "Виды ~." [http://cran.r-project.org/web/packages/FSelector/FSelector.pdf]: data(iris) subset <- cfs(Species~., iris) f <- as.simple.formula(subset, "Species") print(f)Сейчас Google ужасно ...

Задан 05 Aug 2011, 03:32 от Kristoff
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

Статистическое масштабирование автокорреляции с использованием numpy.fft

Вполне возможно, что я сейчас выгляжу очень глупо, но следующий ли правильный способ получить масштабированный вывод [1, -1] из автокорреляции на основе fft?...

Задан 16 Apr 2013, 16:30 от Skazarok
  • 178 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Рабочий процесс для статистического анализа и написания отчетов

Есть ли у кого-нибудь мудрость в рабочих процессах для анализа данных, связанных с написанием пользовательских отчетов? Вариант использования в основном тако...

Задан 15 Sep 2009, 20:14 от forkandwait
  • 14 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как разработка программного обеспечения сравнивается со статистическим программированием / анализом? [закрыто]

Статистический анализ / программирование, написание кода. Независимо от того, описательный или косвенный, вы пишете код для: импорта данных, их очистки, анализа и составления отчета. Анализ данных может включать в себя множество поворотов ...

Задан 19 Feb 2010, 10:02 от Tal Galili
  • 64 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Простая статистика - пакеты Java для вычисления среднего значения, стандартного отклонения и т. Д. [Закрыто]

Не могли бы вы предложить какие-нибудь простые пакеты статистики Java?Я неОбязательно нужен какой-нибудь продвинутый материал. Я был весьма удивлен, что, пох...

Задан 14 Nov 2009, 21:43 от Peter Perháč
  • 83 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Есть ли хорошая библиотека математики / статистики для Scala? [закрыто]

Я ищу хорошую библиотеку с открытым исходным кодом для Scala для математики и статистики. Надеюсь, что-то вроде Apache Math или Colt, но реализовано в Scala. Может кто-то указать мне верное направление?

Задан 06 Jan 2012, 16:21 от dave
  • 4 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как узнать температуру материнской платы ПК (и другую аппаратную статистику)?

Кто-нибудь знает, как получить текущую статистику температуры материнской платы, процессора или HD? В GNU / Linux я знаю, что могу использовать что-то вроде ...

Задан 23 Sep 2008, 20:15 от ramayac
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

ID3 и C4.5: как «коэффициент усиления» нормализует «коэффициент усиления»?

Алгоритм ID3 использует меру «информационного усиления». C4.5 использует показатель «Коэффициент усиления», который представляет собой Информационный коэффициент, деленный наSplitInfo, в то время какSplitInfo высокий для разделения, где записи ...

Задан 05 Nov 2012, 00:56 от yonih
  • 6 голосов
  • 5 ответов
  • 0 просмотров
5 ответов

Лучшая практика: как отслеживать исходящие ссылки?

Как вы отслеживаете исходящие ссылки для вашего веб-сайта, поскольку запрос регистрируется на конечном сервере, а не на вашем?

Задан 14 Oct 2008, 01:40 от flamingLogos
  • 60 голосов
  • 11 ответов
  • 0 просмотров
11 ответов

Здесь x_old - самый старый образец в окне, которое вы хотите удалить.

аюсь найти эффективный, численно устойчивый алгоритм для расчета скользящей дисперсии (например, дисперсия по 20-периодному скользящему окну). Я знаю о Алгоритм ...

Задан 28 Feb 2011, 20:46 от Abiel
  • 18 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Какой модуль статистики для python поддерживает односторонний ANOVA с тестами post hoc (Tukey, Scheffe или другие)?

Я пытался просмотреть несколько модулей статистики для Python, но не могу найти ни одного, который поддерживаетone-way ANOVA специальные тесты

Задан 17 Apr 2013, 00:41 от david_adler
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Как вывести список разрешенных конфликтов в коммите слияния?

При слиянии ветки может возникнуть конфликт, который мы должны решить, чтобы завершить слияние. Как мы можем перечислить ТОЛЬКО статистику разрешенных конфли...

Задан 18 Jul 2016, 13:24 от mxamin
  • 15 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

 без определения функции?

есть некоторые данные, которые представляют множество прогонов модели в разных сценариях. Для одного сценария мы хотели бы отобразить сглаженное среднее с за...

Задан 17 Nov 2010, 14:34 от mo-seph
  • 31 голос
  • 5 ответов
  • 0 просмотров
5 ответов

Подавление вывода «нулевого устройства» с помощью R в пакетном режиме

У меня есть ряд скриптов bash, которые вызывают R скрипты для построения графиков. Что-то вроде: #!/bin/bash R --vanilla --slave <<RSCRIPT cat("Plotting $1 to $2\n") input <- read.table("$1") png("$2") plot(as.numeric(input[1,])) dev.off() ...

Задан 15 Apr 2009, 07:55 от blahdiblah
  • 23 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Mysql, изменить данные от длинного / высокого к широкому

У меня есть данные в таблице mysql в длинном / высоком формате (описано ниже) и я хочу преобразовать их в широкий формат. Могу ли я сделать это, используя то...

Задан 12 Feb 2010, 22:46 от chongman
  • 2 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Менеджер игры: как рассчитать рыночную стоимость?

Обычно игроки в игре футбольного менеджера имеют рыночные значения. Менеджеры продают своих игроков в соответствии с этими рыночными ценностями. Они думают: ...

Задан 14 Aug 2009, 12:20 от caw
  • 23 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Как мне сделать F-тест в Python

Как мне сделать F-тест, чтобы проверить, эквивалентна ли дисперсия в двух векторах в Python? Например, если у меня есть a = [1,2,1,2,1,2,1,2,1,2] b = [1,3,-1,2,1,5,-1,6,-1,2]есть ли что-то похожее на scipy.stats.ttest_ind(a, b)я ...

Задан 01 Feb 2014, 04:39 от DrewH
  • 4 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Пожалуйста, суммируйте ссылку в вашем ответе; таким образом, если ссылка устареет, ответ не будет полностью бесполезным.

вопрос основан на замечательных ответах, которые я получил на предыдущий вопрос: Можно ли расширить функциональность PDF, CDF, FindDistributionParameters и т. Д. В ...

Задан 09 Jun 2011, 16:53 от Jagra
  • 3 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

KL-Дивергенция двух GMM

У меня есть два GMM, которые я использовал для размещения двух разных наборов данных в одном пространстве, и я хотел бы рассчитать KL-расхождение между ними....

Задан 27 Sep 2014, 22:44 от Andrew Latham
  • 25 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Как обнаружить значительные изменения / тенденции в данных временных рядов? [закрыто]

Итак, у меня есть массив, скажем, 25 выборок, и я бы хотел иметь возможность отмечать тенденции уменьшения или уменьшения n или увеличения от этого интервала времени 25 выборок (в основном массив из 25 выборок - это мой буфер, который заполняется ...

Задан 12 Oct 2012, 02:00 от as3rdaccount
  • 4 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Нахождение цифр PI с использованием Монте-Карло

Я пробовал много алгоритмов для нахождения π с помощью Монте-Карло. Одним из решений (в Python) является следующее: def calc_PI(): n_points = 1000000 hits = 0 for i in range(1, n_points): x, y = uniform(0.0, 1.0), uniform(0.0, 1.0) if (x**2 + ...

Задан 11 Jun 2009, 17:10 от Jon Romero
  • 6 голосов
  • 1 ответ
  • 0 просмотров
1 ответ

embeddedanalytics.com

которых наших страницах мы отображаем некоторую статистику, например, количество просмотров этой страницы за сегодня, количество просмотров за последнюю неделю и т. Д. Кроме того, у нас есть страница общей статистики, где мы перечисляем страницы ...

Задан 28 Jul 2011, 10:03 от at.
  • 24 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

, Копирование из примеров в

аюсь использовать ggplot2 / geom_boxplot для создания коробочного графика, в котором усы определяются как 5 и 95-й процентиль вместо 0,25 - 1,5 IQR / 0,75 + IQR, а выбросы из этих новых усов отображаются как обычно. Я вижу, что ...

Задан 22 Jan 2011, 01:09 от cswingle
  • 30 голосов
  • 3 ответа
  • 0 просмотров
3 ответа

Построение матрицы совмещения в пандах питона

Я знаю как это сделать в R, Но есть ли какая-либо функция в пандах, которая преобразует информационный кадр в матрицу совместного появления nxn, содержащую с...

Задан 13 Dec 2013, 18:15 от user3084006
  • 28 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

Пошаговая регрессия с использованием p-значений для отбрасывания переменных с незначимыми p-значениями

Я хочу выполнитьступенчатая линейная регрессия с помощьюр-значение в качестве критерия выбора, например: на каждом шаге отбрасывают переменные, которые имеют...

Задан 13 Sep 2010, 14:05 от DainisZ
  • 6 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Вы также можете построить гладкий график CDF, используя

x = [1 2 3 3 4] cdfplot(x) Googling я обнаружил, что приведенный выше код нарисует для меня накопительную функцию распределения в Matlab. Есть ли простой способ нарисовать функцию плотности вероятности? Уточнить. Мне нужен график, который имеет ...

Задан 22 Apr 2011, 16:08 от Haozhun
  • 5 голосов
  • 2 ответа
  • 0 просмотров
2 ответа

Использование scipy.stats.stats в django после развертывания

Я нахожусь в процессе создания django-powered (1.3) интерфейса для пакета, который сильно зависит от scipy.stats.stats (scipy версия 0.9.0), называемогоovl , На ранних этапах разработки, используя собственный сервер разработки djangos, это не ...

Задан 19 Oct 2011, 10:02 от koekiezorro
  • 92 голосов
  • 6 ответов
  • 0 просмотров
6 ответов

 ноль для значений, которые выше самого высокого значения в пуле.

НИЕ: У меня есть список из более чем 30 000 значений в диапазоне от 0 до 47, например [0,0,0,0, .., 1,1,1,1, ..., 2,2,2,2, ..., 47 и т. Д.], Который является непрерывным распределением. ПРОБЛЕМА. Исходя из моего распределения, я хотел бы ...

Задан 08 Jul 2011, 06:00 от s_sherly
  • 1 голос
  • 1 ответ
  • 0 просмотров
1 ответ

Z3 реальная арифметика и статистика

Учитывая проблему, которая закодирована с использованием действительных значений Z3, какая из статистических

Задан 06 Aug 2014, 19:54 от Bill the LizardMalte Schwerhoff
  • 11 голосов
  • 4 ответа
  • 0 просмотров
4 ответа

Вероятность столкновения 64-битного хеш-кода

В книге «Численные рецепты» предлагается метод вычисления 64-битных хеш-кодов с целью уменьшения количества коллизий.Алгоритм показан наhttp://www.javamex.co...

Задан 26 Feb 2014, 00:09 от isapir
Page 1 of 8
1 2 3 4 5