approx_top_sum
approx_top_sum
Введена в версии v1.1
Возвращает массив приблизительно самых частых значений и их количеств в указанном столбце. Полученный массив отсортирован в порядке убывания приблизительной частоты значений (не по самим значениям). Дополнительно учитывается вес значения.
Эта функция не гарантирует точный результат. В некоторых ситуациях могут возникать ошибки, и она может вернуть часто встречающиеся значения, которые не являются самыми частыми.
См. также
Синтаксис
Параметры
N— Количество элементов, которые нужно вернуть. Необязательный параметр. Значение по умолчанию: 10.UInt64reserved— Необязательный параметр. Определяет, сколько ячеек зарезервировано для значений. Еслиuniq(column) > reserved, результат функции topK будет приблизительным. Значение по умолчанию:N * 3. Максимальное значениеN = 65536.UInt64
Аргументы
column— Имя столбца, для которого нужно найти наиболее часто встречающиеся значения.Stringweight— Вес. Каждое значение учитываетсяweightраз при расчете частоты.UInt64
Возвращаемое значение
Возвращает массив приблизительно самых частых значений и соответствующих им количеств вхождений, отсортированный в порядке убывания приблизительной частоты. Array
Примеры
Пример использования
Смотрите также