Перейти к основному содержимому
Перейти к основному содержимому

cramersV

cramersV

Введено в версии v22.1

Cramer's V (иногда также называемая Cramer's phi) — это мера взаимосвязи между двумя столбцами в таблице. Результат функции cramersV лежит в диапазоне от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только тогда, когда каждое значение полностью определяется другим. Эту меру можно рассматривать как взаимосвязь между двумя переменными, выраженную в процентах от их максимально возможной вариации.

Примечание

Вариант Cramer's V с коррекцией смещения см.: cramersVBiasCorrected

Синтаксис

cramersV(column1, column2)

Аргументы

  • column1 — Первый столбец для сравнения. (U)Int* или Float* или Decimal
  • column2 — Второй столбец для сравнения. (U)Int* или Float* или Decimal

Возвращаемое значение

Возвращает значение от 0 (что соответствует отсутствию зависимости между значениями столбцов) до 1 (полная зависимость). Float64

Примеры

Отсутствие взаимосвязи между столбцами

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 3 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    )
┌─cramersV(a, b)─┐
│              0 │
└────────────────┘

Высокая взаимосвязь между столбцами

SELECT
    cramersV(a, b)
FROM
    (
        SELECT
            number % 10 AS a,
            number % 5 AS b
        FROM
            numbers(150)
    )
┌─────cramersV(a, b)─┐
│ 0.8944271909999159 │
└────────────────────┘