Вопрос по sql, sql-server-2008 – Найти недостающие интервалы времени в таблице

5

У меня есть следующая таблица, которая содержит значения, прочитанные каждые 15 минут с нескольких разных устройств:

ID   DeviceID   Date                    Value
----------------------------------------------
1    3          24.08.2011 00:00:00     0.51
2    3          24.08.2011 00:15:00     2.9
3    3          24.08.2011 00:30:00     0
4    3          24.08.2011 00:45:00     7.1
5    3          24.08.2011 01:00:00     1.05
6    3          24.08.2011 03:15:00     3.8

Я хотел бы найти все пропуски в таблице для каждого устройства, где нет записей, за данный месяц. Для приведенной выше таблицы результат должен быть примерно таким:

DeviceID    StartDate               EndDate
-------------------------------------------------------
3           24.08.2011 01:00:00     24.08.2011 03:15:00

Таблица содержит около 35000 устройств и 100 миллионов записей.

Это то, что я пытался; это довольно медленно, но возвращает то, что мне нужно. Однако, помимо его скорости, существует еще одна проблема: он находит только пропущенные интервалы до последней записи для устройства в данном месяце; все, что после этого будет игнорироваться, так что можно пропустить дополнительный интервал пропущенных значений.

SELECT
    t2.Date AS StartDate
    , t1.Date AS EndDate
FROM
    TestTable t1
    INNER JOIN TestTable t2 ON t1.DeviceID = t2.DeviceID
WHERE
    (t2.Date = (SELECT MAX(Date) FROM TestTable t3 WHERE t3.Date < t1.Date AND t3.DeviceID = t1.DeviceID)
        AND DATEDIFF(MINUTE, t2.Date, t1.Date) > 15)
    AND t1.DeviceID = @id
    AND DATEPART(YEAR, t1.Date) = @year AND DATEPART(MONTH, t1.Date) = @month
Error: User Rate Limit Exceeded alex
Error: User Rate Limit ExceededROW_NUMBER()Error: User Rate Limit Exceeded alex
Error: User Rate Limit Exceededat thisError: User Rate Limit Exceeded Conrad Frix

Ваш Ответ

1   ответ
6

Add a rownumber to each record, ordered by Date and restarting for each DeviceID. Join with self to create a result with rows consisting of the combination of two original rows. The relation between the columns of each row is the rownumber (+1) and the DeviceID. Only retain those rows where the related Date is more than 15 minutes.

SQL Statement

;WITH t AS (
  SELECT  *, rn = ROW_NUMBER() OVER (PARTITION BY DeviceID ORDER BY Date)
  FROM    TestTable
)  
SELECT  t1.DeviceID, t1.Date, t2.Date
FROM    t t1
        INNER JOIN t t2 ON t2.DeviceID = t1.DeviceID AND t2.rn = t1.rn + 1
WHERE   DATEDIFF(MINUTE, t1.Date, t2.Date) > 15        

Test script

;WITH TestTable (ID, DeviceID, Date, Value) AS (
  SELECT 1, 3, '2011-08-24 00:00:00', 0.51 UNION ALL
  SELECT 2, 3, '2011-08-24 00:15:00', 2.9 UNION ALL
  SELECT 3, 3, '2011-08-24 00:30:00', 0 UNION ALL
  SELECT 4, 3, '2011-08-24 00:45:00', 7.1 UNION ALL
  SELECT 5, 3, '2011-08-24 01:00:00', 1.05 UNION ALL
  SELECT 6, 3, '2011-08-24 03:15:00', 3.8 
)
, t AS (
  SELECT  *, rn = ROW_NUMBER() OVER (PARTITION BY DeviceID ORDER BY Date)
  FROM    TestTable
)  
SELECT  t1.DeviceID, t1.Date, t2.Date
FROM    t t1
        INNER JOIN t t2 ON t2.DeviceID = t1.DeviceID AND t2.rn = t1.rn + 1
WHERE   DATEDIFF(MINUTE, t1.Date, t2.Date) > 15        
Error: User Rate Limit Exceeded alex
Error: User Rate Limit Exceeded
Error: User Rate Limit Exceeded alex
Error: User Rate Limit Exceeded@id, @yearError: User Rate Limit Exceeded@month
Error: User Rate Limit Exceeded

Похожие вопросы