Н. Н. Ряузов.
Статистические решения
Статисти'ческие реше'ния, общее название решений, принимаемых на основе результатов наблюдений какого-либо явления, подчиняющегося вероятностным закономерностям (см. Вероятность ), которые известны лишь частично. Например при обеззараживании воды хлорированием количество добавляемого хлора должно зависеть от среднего числа q бактерий в единице объёма. Однако само q неизвестно и оценивается по результатам X1 , X2 ,..., Xn подсчёта численности бактерий в n независимо выбранных единицах объёма воды, при допущении (в простейшей модели) что Xi , при i =1,... n имеют Пуассона распределение с неизвестным средним значением (математическим ожиданием ) q. Поэтому С. р. решение о количестве добавляемого хлора — будет функцией от какой-либо статистической оценки q* параметра q. Последняя должна выбираться с учётом нежелательных последствий как недооценки q (недостаточное обеззараживание воды), так и завышенной оценки q (ухудшение вкуса воды от чрезмерного добавления хлора). Точную математическую формулировку понятий, касающихся С. р. и способов их сравнения, рассматривает статистических решений теория .
Ю. В. Прохоров.
Статистические сборники
Статисти'ческие сбо'рники, справочные издания, содержащие цифровую информацию о развитии народного хозяйства, его отраслей и подразделений. Различаются по назначению (ежегодники, справочники, юбилейные издания, бюллетени и т.п.), объёму (полные и краткие), охвату данных (общеэкономические и отраслевые, по всей стране или по республикам, районам), ведомственной принадлежности, форме (книги и журналы) и периодичности издания (десятилетние, годовые, квартальные, месячные, разовые и др.). Независимо от назначения С. с. охватывают характеристику (состояние и развитие) территории и населения, науки и научно-технического прогресса, промышленности и её отраслей, сельского хозяйства, строительства, транспорта и связи, торговли, финансов и кредита, внешних связей, образования и культуры, здравоохранения, труда и быта, материального благосостояния и развития народного хозяйства в целом. Разработка схем и методологии С. с. — неотъемлемая часть статистики как науки, а их составление и публикация — важный раздел в деятельности (в странах социализма — плановой) статистических организаций (в СССР — ЦСУ СССР и его органов в республиках и на местах). В России систематические издания С. с. осуществлялись с 19 в. («Статистический Временник Российской империи», 1866—94, и «Ежегодник России», 1905—18). В 1924 в СССР вышел первый С. с. по народному хозяйству. В 1925 он был дополнен новым материалом и издан под названием «Народное хозяйство Союза ССР в цифрах». Это был первый опыт отражения в статистических публикациях системы показателей развития народного хозяйства СССР. С 1956 ежегодно (кроме 1958) выпускается С. с. «Народное хозяйство СССР», а с 1957 — С. с. о развитии народного хозяйства отдельно по каждой союзной республике, по краям и областям. Ежегодники являются основной разновидностью С. с. и в др. странах (издаются в 126 странах, в том числе во всех странах СЭВ). Важнейшими С. с. ООН и её специализированных учреждений с 1946 являются: «Статистический ежегодник» («Statistical yearbook»), «Демографический ежегодник» («Demografic yearbook»), «Ежегодник по статистике международной торговли» («Yearbook of international trade statistics»), «Ежегодник ООН» («Yearbook of the United Nations») и др. Продовольственная и с.-х. организация ООН (ФАО) издаёт «Ежегодник по статистике продовольствия и сельского хозяйства» («Yearbook of food and agricultural statistics»), а также ежегодники по статистике рыболовства и лесного хозяйства; Организация Объединённых Наций по вопросам образования, науки и культуры (ЮНЕСКО) издаёт «Международный ежегодник по образованию» («International yearbook of education») и общий статистический ежегодник («Statistical yearbook»). Свои ежегодники издают и многие др. международные организации.
В. М. Симчера.
Статистический анализ многомерный
Статисти'ческий ана'лиз многоме'рный, в широком смысле — раздел математической статистики , объединяющий методы изучения статистических данных, относящихся к объектам, которые характеризуются несколькими качественными или количественными признаками. Наиболее разработана часть С. а. м., основанная на допущении, что результаты отдельных наблюдений независимы и подчинены одному и тому же многомерному нормальному распределению (обычно именно к этой части применяют термин С. а. м. в узком смысле). Иными словами, результат Xj наблюдения с номером j можно представить вектором
Xj = (Xj1 , Xj2 ,..., Xjs ),
где случайные величины Xjk имеют математическое ожидание mk , дисперсию s2k , а коэффициент корреляции между Xjk и Xjl равен rkl . Вектор математических ожиданий m = (m1 ,..., ms ) и ковариационная матрица S с элементами sk sl rkl , k, l = 1,..., s , являются основными параметрами, полностью определяющими распределение векторов X1 ,..., Xn — результатов п независимых наблюдений. Выбор многомерного нормального распределения в качестве основной математической модели С. а. м. отчасти может быть оправдан следующими соображениями: с одной стороны, эта модель приемлема для большого числа приложений, с другой — только в рамках этой модели удаётся вычислить точные распределения выборочных характеристик. Выборочное среднее
и выборочная ковариационная матрица
[где
обозначает транспонированный вектор , см. Матрица ] суть оценки максимального правдоподобия соответствующих параметров совокупности. Распределение нормально , а совместное распределение элементов ковариационной матрицы S , т. н. распределение Уишарта, является естественным обобщением «хи-квадрат» распределения и играет значительную роль в С. а. м.Ряд задач С. а. м. более или менее аналогичен соответствующим одномерным задачам (например, задача проверки гипотез о равенстве средних значений в двух независимых выборках). Другого типа задачи связаны с проверкой гипотез о независимости тех или иных групп компонент векторов Xj, проверкой таких специальных гипотез, как гипотеза сферической симметрии распределения Xj и т.д. Необходимость разобраться в сложных взаимосвязях между компонентами случайных векторов Xj ставит новые проблемы. В целях сокращения числа рассматриваемых случайных признаков (уменьшения размерности) или сведения их к независимым случайным величинам применяются метод главных компонент и метод канонических корреляций. В теории главных компонент осуществляется переход от векторов Xj к векторам Yj = (Yj1 ,..., Yjr ). При этом, например, Yj1 выделяется максимальной дисперсией среди всех нормированных линейных комбинаций компонент X1 ; Yj2 имеет наибольшую дисперсию среди всех линейных функций компонент X1 , не коррелированных с Yj1 и т.д. В теории канонических корреляций каждое из двух множеств случайных величин (компонент Xj ) линейно преобразуется в новое множество т. н. канонических величин так, что внутри каждого множества коэффициенты корреляции между величинами равны 0, первые координаты каждого множества имеют максимальную корреляцию, вторые координаты имеют наибольшую корреляцию из оставшихся координат и т.д. (упорядоченные т. о. корреляции называются каноническими). Последний метод указывает максимальную корреляцию линейных функций от двух групп случайных компонент вектора наблюдения. Выводы методов главных компонент и канонических корреляций помогают понять структуру изучаемой многомерной совокупности. Сходным целям служит и факторный анализ , в схеме которого предполагается, что компоненты случайных векторов Xj явлются линейными функциями от некоторых ненаблюдаемых факторов, подлежащих изучению. В рамках С. а. м. рассматривается и проблема дифференциации двух или большего числа совокупностей по результатам наблюдений. Одна часть проблемы заключается в том, чтобы на основе анализа выборок из нескольких совокупностей отнести новый элемент к одной из них (дискриминация), другая — в том, чтобы внутри совокупности разделить элементы на группы, в определённом смысле максимально отличающиеся друг от друга.