В более общей ситуации результаты наблюдений y1, ..., yn рассматриваются как независимые случайные величины с одинаковыми дисперсиями и математическими ожиданиями

Eyi, = b1x1i + ... + bkxki, i = 1, ..., n,

где значения xji, j = 1, ..., k предполагаются известными. Эта форма линейной модели регрессии является общей в том смысле, что к ней сводятся модели более высоких порядков по переменным x1, ..., xk. Кроме того, некоторые нелинейные относительно параметров bi; модели подходящим преобразованием также сводятся к указанной линейной форме.

  Р. а. является одним из наиболее распространённых методов обработки результатов наблюдений при изучении зависимостей в физике, биологии, экономике, технике и др. областях. На модели Р. а. основаны такие разделы математической статистики, как дисперсионный анализи планирование эксперимента; модели Р. а. широко используются в статистическом анализе многомерном.

  Лит.: Юл Дж. Э., Кендэл М. Дж., Теория статистики, пер. с англ., 14 изд., М., 1960; Смирнов Н. В., Дунин-Барковский И. В., Курс теории вероятностей и математической статистики для технических приложений, 3 изд., М., 1969; Айвазян С. А., Статистическое исследование зависимостей, М., 1968; Рао С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968. См. также лит. при ст. Регрессия.

  А. В. Прохоров.

Регрессия (математич.)

Регре'ссия в теории вероятностей и математической статистике, зависимость среднего значения какой-либо величины от некоторой другой величины или от нескольких величин. В отличие от чисто функциональной зависимости у = f(х), когда каждому значению независимой переменной х соответствует одно определённое значение величины у, при регрессионной связи одному и тому же значению х могут соответствовать в зависимости от случая различные значения величины у. Если при каждом значении х = xi наблюдается ni, значений yi1, ...,

Большая Советская Энциклопедия (РЕ) - i-images-110694324.png
 величины у, то зависимость средних арифметических
Большая Советская Энциклопедия (РЕ) - i-images-123817046.png
 от xi и является Р. в статистическом понимании этого термина. Примером такого рода зависимости служит, в частности, зависимость средних диаметров сосен от их высот; см. табл. в ст. Корреляция.

  Изучение Р. в теории вероятностей основано на том, что случайные величины Х и Y, имеющие совместное распределение вероятностей, связаны вероятностной зависимостью: при каждом фиксированном значении Х = х величина Y является случайной величиной с определённым (зависящим от значения х) условным распределением вероятностей. Р. величины Y по величине Х определяется условным математическим ожиданием Y, вычисленным при условии, что Х = х:

Е(Y êх) = u(х).

  Уравнение у = u(х), в котором х играет роль «независимой» переменной, называется уравнением регрессии, а соответствующий график — линией регрессии величины Y по X. Точность, с которой уравнение Р. Y по Х отражает изменение Y в среднем при изменении х, измеряется условной дисперсией величины Y, вычисленной для каждого значения Х = х:

D(Y êх) = s2(x).

  Если s2(х) = 0 при всех значениях х, то можно с достоверностью утверждать, что Y и Х связаны строгой функциональной зависимостью Y = u(X). Если s2(х) = 0 при всех значениях х и u(х) не зависит от х, то говорят, что Р. Y по Х отсутствует. Аналогичным образом определяется Р. Х по Y и в частности, уравнение Р. х = u(у), = Е(ХïY = у). Функции у = u(х) и х = u(у), вообще говоря, не являются взаимно обратными.

  Линии Р. обладают следующим замечательным свойством: среди всех действительных функций f (х) минимум математического ожидания Е[Yf(X)]2 достигается для функции f(x) = u(х), т. е. Р. Y по Х даёт наилучшее, в указанном смысле, представление величины Y по величине X. Это свойство используется для прогноза Y по X: если значение Y непосредственно не наблюдается и эксперимент позволяет регистрировать лишь компоненту Х вектора (X, Y), то в качестве прогнозируемого значения Y используют величину u (X).

  Наиболее простым является случай, когда Р. Y по Х линейна:

Е(Yïx) = b + b1x.

  Коэффициенты b и b1, называются коэффициентами регрессии, определяются равенствами

Большая Советская Энциклопедия (РЕ) - i-images-167916220.png
,
Большая Советская Энциклопедия (РЕ) - i-images-190507449.png

где mХ и mY математические ожидания Х и Y,

Большая Советская Энциклопедия (РЕ) - i-images-138060941.png
и
Большая Советская Энциклопедия (РЕ) - i-images-193901918.png
 — дисперсии Х и Y, а r — коэффициент корреляции между Х и Y. Уравнение Р. при этом выражается формулой

Большая Советская Энциклопедия (РЕ) - i-images-124632948.png

  В случае, когда совместное распределение Х и Y нормально, обе линии Р. у = u(х) и х = u(у) являются прямыми.

  Если Р. Y по Х отлична от линейной, то последнее уравнение есть линейная аппроксимация истинного уравнения Р.: математическое ожидание Е[Y b— b1X]2 достигает минимума b и b1 при b = b и b1 = b1. Особенно часто встречается случай уравнения Р., выражающегося линейной комбинацией тех или иных заданных функций:

у = u(Х) = bj(x) + b1j1(x) + ... + bmjm(x).

  Наиболее важное значение имеет параболическая (полиномиальная) Р., при которой j(x) = 1 , j1(x) = x, ..., jm(x) = xm.

  Понятие Р. применимо не только к случайным величинам, но и к случайным векторам. В частности, если Y — случайная величина, а Х = (X1, ..., Xk) случайный вектор, имеющие совместное распределение вероятностей, то Р. Y по X определяется уравнением

y = u ( x1, ..., xk),

где u( x1, ..., xk) = E{YïX = x1, ... , Xk = xk}.

  Если

u ( x1, ..., xk) = b + b1x1 + ... + bkxk,