Большая Советская энциклопедия

    совокупность способов, употребляемых в математической статистике (См. Математическая статистика) для приближённого определения неизвестных распределений вероятностей (или каких-либо их характеристик) по результатам наблюдений. В наиболее распространённом случае независимых наблюдений их результаты образуют последовательность

    X1, X2,..., Xn,... (1)

    независимых случайных величин (См. Случайная величина) (или векторов), имеющих одно и то же (неизвестное) Распределение вероятностей с функцией распределения F(x). Часто предполагают, что функция F(x) зависит неизвестным образом от одного или нескольких параметров и определению подлежат лишь значения самих этих параметров [например, значительная часть теории, особенно в многомерном случае, развита в предположении, что неизвестное распределение является нормальным распределением (См. Нормальное распределение), у которого все параметры или какая-либо часть их неизвестны (см. Статистический анализ многомерный)]. Два основных вида С. о. — т. н. точечное оценивание и оценивание с помощью доверительных границ (См. Доверительные границы). В первом случае в качестве приближённого значения для неизвестной характеристики выбирают какую-либо одну функцию от результатов наблюдений, во втором — указывают интервал значений, с высокой вероятностью «накрывающий» неизвестное значение этой характеристики. В более общих случаях интервалы, образуемые доверительными границами (доверительные интервалы), заменяются более сложными доверительными множествами.

    О С. о. функции распределения F(x) см. Непараметрические методы в математической статистике; о С. о. параметров см. Статистические оценки.

    Разработаны также методы С. о. и для случая, когда результаты наблюдений (1) зависимы, и для случая, когда индекс nзаменяется непрерывно меняющимся аргументом t, т. е. для случайных процессов (См. Случайный процесс).В частности, широко используется С. о. таких характеристик случайных процессов, как корреляционная функция и спектральная функция. В связи с задачами регрессионного анализа (См. Регрессионный анализ) был развит новый метод С. о. — Стохастическая аппроксимация. При классификации и сравнении способов С. о. исходят из ряда принципов (таких, как состоятельность, несмещенность, инвариантность и др.), которые в их наиболее общей форме рассматривают в Статистических решений теории (См. Статистических решений теория).

    Лит.: Крамер Г., Математические методы статистики, пер. с англ., 2 изд., М., 1975; Рао С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968.

    Ю. В. Прохоров.

  1. Источник: Большая советская энциклопедия. — М.: Советская энциклопедия. 1969—1978.



  2. Большой англо-русский и русско-английский словарь

    statistical estimation

  3. Источник: Большой англо-русский и русско-английский словарь



  4. Англо-русский словарь технических терминов

    statistical estimation

  5. Источник: Англо-русский словарь технических терминов



  6. Физическая энциклопедия

    СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

    - один из осн. разделов матем. статистики, <посвящённый оцениванию параметров теоретич. моделей по косвенным измерениямили распределений случайной величины х по наблюдению её реализаций. <Если предполагается, что распределение является элементом параметрич. семейства 8067-93.jpg, то возникает задача параметрического оценивания. Когда вид распределениянеизвестен, говорят о задаче непараметрического оценивания. При параметрич. <оценивании различают два подхода: точечное оценивание и интервальноеоценивание.

    Точечное оценивание. Пусть распределение случайной величины х - заданнаяф-ция 8067-94.jpgс неизвестными параметрами а, а x = (x1,x2,...,xN)- вектор возможных значений х. Точечное оценивание заключаетсяв выборе ф-ции 8067-95.jpg,значение к-рой при заданном аг можно использовать вместо параметра . в качестве его приближённого значения. Ф-цию 8067-96.jpgназ. оценкой параметра а, принцип выбора ф-ции - методом оценивания. <Очевидно, что можно предложить много оценок, поэтому необходимо изучитьследующие осн. свойства оценок.

    Состоятельность. При увеличении объёма N наблюдений (измерений)оценка должна приближаться к истинному значению параметра. Оценку 8067-97.jpgназывают состоятельной по вероятности, если для любых 8067-98.jpg,
    8067-99.jpgсуществует такое N, что вероятность реализации неравенства 8067-100.jpgбудет меньше 8067-101.jpgПримером состоятельной оценки служит выборочное среднее 8067-102.jpg,к-рое является оценкой ср. значения величины 8067-103.jpg,если ф-ция ллотности вероятности р(х )имеет конечную дисперсию.

    Смещение. Под смещением оценки 8067-104.jpgпринято понимать отклонение её ср. значения 8067-105.jpgот истинного значения 8067-106.jpg.Оценку 8067-107.jpg наз. <несмещённой, если при любых N и а имеем 8067-108.jpg, или 8067-109.jpg. Несмещённая оценка обычно предпочтительнее смещённой, т. к. смещениеявляется систематич. ошибкой в оценке, к-рая зависит от истинного значенияпараметра а и поэтому редко поддаётся вычислению. Выборочное среднееявляется несмещённой оценкой, тогда как выборочная дисперсия

    8067-110.jpg являетсясмещённой оценкой дисперсии 8067-111.jpg

    Эффективность. Простейшей характеристикой точности оценки является ср. <значение квадрата её расстояния от истинного значения:

    8067-112.jpg

    где 8067-113.jpg- дисперсия оценки 8067-114.jpg,равная

    8067-115.jpg

    Дисперсия характеризует «ширину» распределения, т. е. «шумовую» составляющуюошибки 8067-116.jpgоценки 8067-117.jpg. Поэтому в классе оценок с данным смещением 8067-118.jpgпредпочтительнее оценка с мин. дисперсией. Справедливо неравенство Крамера- Рао:

    8067-119.jpg

    к-рое и определяет максимально достижимую точность (в смысле 8067-120.jpgв классе оценок с данным смещением 8067-121.jpgпо выборке х. Величину

    8067-122.jpg

    где 8067-123.jpg- ф-ция плотности распределения 8067-124.jpg,называют количеством информации по Р. Фишеру (R. Fisher) о параметре ав оценке Величину 8067-125.jpg

    8067-126.jpg

    где 8067-127.jpg- ф-ция правдоподобия, а 8067-128.jpg- плотность ф-ции распределения х, называют количеством информациипо Р. Фишеру о параметре в выборке х. В классе несмещённых оценок

    8067-129.jpg

    и информац. смысл величин 8067-130.jpgи 8067-131.jpg становитсяочевидным: их значение определяет минимально достижимое расстояние 8067-132.jpgот а. Первое неравенство в (1), (3) превращается в равенство лишь тогда, <когда ф-ция плотности распределения оценки имеет экспоненц. форму:

    8067-133.jpg

    то и второе неравенство в (1), (3) превращается в равенство. Такую оценкуназывают эффективной в смысле Крамера - Рао. Оценку, для к-рой выполняетсяравенство (5), т. е. такую, в к-рой количество информации о параметре . такое же, как в самой выборке х, называют достаточной статистикой. <Условием существования достаточной статистики 8067-134.jpgявляется факторизация ф-ции правдоподобия:8067-135.jpg.Неравенство Крамера - Рао полезно тем, что позволяет ещё на стадии планированияэксперимента оценить максимально достижимую точность «измерения» параметровизучаемых распределений.

    Требования (3) и (4) являются достаточно жёсткими, поэтому при конечных N эфф. оценки редки. В связи с этим рассматривают поведение 8067-136.jpgпри 8067-137.jpg и наз. <оценку асимптотически эффективной, если при 8067-138.jpg.Заметим, что асимптотич. несмещённость следует из состоятельности оценки. <Рассмотрим наиб. общие и распространённые методы получения точечных оценок.

    Метод максимума правдоподобия (подробнее см. Максимального правдоподобияметод).

    В этом методе вероятность реализации вектора наблюдений х,8068-1.jpg, после подстановки в неё реализовавшихся значений х рассматриваюткак ф-цию параметров а и называют ф-цией правдоподобия:8068-2.jpg. В качестве оценки в методе макс. правдоподобия для вектора параметров а берут то значение 8068-3.jpg,к-рое соответствует макс. значению ф-ции правдоподобия. При нек-рых общихпредположениях оценки в методе макс. правдоподобия состоятельны, асимптотическиэффективны и асимптотически нормально распределены. При конечных N оценкав методе макс. правдоподобия имеет оптим. свойства только в том случае, <когда существует достаточная статистика. Метод наименьших квадратов (подробнеесм. Наименьших квадратов метод), В этом методе в качестве оценкивектора параметров а берут то значение 8068-4.jpg,к-рое соответствует минимуму квадратичной формы.

    8068-5.jpg

    где D - матрица ошибок измерений х п. При нек-рыхобщих предположениях оценка в методе наим. квадратов состоятельна и асимптотическинормально распределена, но не является асимптотически эффективной. Если 8068-6.jpg- линейные ф-ции параметров а, то в классе линейных несмещённыхоценок оценки 8068-7.jpgв методе наим. квадратов имеют наим. дисперсии.

    Метод моментов. Пусть mi - выборочные моменты,8068-8.jpg- моменты ф-ции плотности распределения,. В методе моментов выбирают в 8068-9.jpgкачестве оценки параметров а решение 8068-10.jpgсистемы ур-ний 8068-11.jpg.Оценки в методе моментов состоятельны, асимптотически несмещены, но неявляются асимптотически эффективными,8068-12.jpg -метод. Если объём выборки х велик и данные х п сгруппированыв гистограмму, то для оценки параметров а используют 8068-13.jpg -метод, <являющийся частным случаем метода наим. квадратов. Пусть У; - число наблюдений, <попавших в Z-канал гистограммы, а 8068-14.jpg- их ожидаемое число:

    8068-15.jpg

    В качестве оценки параметров а берут значение 8068-16.jpg,соответствующее минимуму квадратичной формы

    8068-17.jpg

    либо модифицированный 8068-18.jpg -метод

    8068-19.jpg

    Оценки в 8068-20.jpg -методеи модифицированном 8068-21.jpg -методесостоятельны, асимптотически нормально распределены и асимптотически эффективны. <Своё название эти методы получили по той причине, что при больших Yl (приближение нормального распределения)8068-22.jpgраспределено по 8068-23.jpg -распределениюс числом степеней свободы k = L - I -1, где L - число каналовгистограммы, I - число параметров.

    Интервальное оценивание состоит в отыскании интервала [a1,a2],к-рый с заданной вероятностью 8068-24.jpgсодержит истинное значение параметра а. Др. словами, нужно найтитакой интервал [a1,a2] (как ф-цию вектора наблюдений х), к-рый «накроет» с вероятностью В истинное значение а приданном значении х. Это т. н. доверительный интервал с вероятностнымсодержанием 8068-25.jpg (или коэф. доверия 8068-26.jpg).Такое определение неоднозначно, его обычно доопределяют требованием минимальностидлины среди всех интервалов с коэф. доверия 8068-27.jpg

    Пусть распределение 8068-28.jpgзависит от одного параметра а и 8068-29.jpg- к.-л. точечная оценка а, ф-ция плотности вероятности к-рой равна 8068-30.jpg.Тогда центр. доверит. интервал определяется как решение ур-ний

    8068-31.jpg

    Такой доверит. интервал может и не быть минимальным. Однако, если точечнаяоценка 8068-32.jpgасимптотически эффективна, то при больших N этот интервал будетблизок к минимальному.

    Более общий подход к получению доверит. интервалов заключается в поискетакой ф-ции от оценки и параметра, распределение к-рой не зависит от искомогопараметра. Напр., пусть вектор оценок 8068-33.jpgраспределён по многомерному Гаусса распределению со средним . и матрицей вторых моментов D. Тогда квадратичная форма 8068-34.jpgраспределена по закону 8068-35.jpg (см. Распределение), к-рое не зависит от а. Задаваясь вероятностью 8068-36.jpgтого, что 8068-37.jpg,находим 8068-38.jpgи доверит. область для а:8068-39.jpg, имеющую вид гиперэллипсоида с центром в точке 8068-40.jpg Этот пример имеет практич. применение, т. к. асимптотически, при больших N, мн. методы оценивания дают нормально распределённые оценки параметров.

    Непараметрическое оценивание. В этом случае не делают к.-л. предположенийо плотности ф-ции распределения. В качестве точечной оценки часто используютгистограмму. В этом методе оценивания числовую ось, на к-рой определены х п, делят на ряд областей rj (j =1,2,...,k), называемых каналами гистограммы. Тогда 8068-41.jpgзадают константами 8068-42.jpgв каждой области rj, причём 8068-43.jpg.Здесь C(N) - коэф. нормировки, gj(x) - индикаторная ф-цияобласти rj:

    8068-44.jpg

    Более формально оценки ф-ции плотности вероятности записывают в виде

    8068-45.jpg

    Гистограмма является простой в вычислит. плане, но смещённой и несостоятельнойоценкой. Поэтому используют более сложные, но состоятельные оценки, напр. <метод ближайших соседей (см. Непараметрические методы статистики).В качестве точечной оценки ф-ции распределения можно взять выборочную ф-циюраспределения:

    8068-46.jpg

    где подразумевается, что х 1,..., х N расположеныв порядке их возрастания. Эта оценка оказывается несмещённой и состоятельной. <Ф-ция распределения Р(х )допускает и интервальную оценку. Рассмотримстатистику 8068-47.jpg, для к-рой асимптотич. распределением является 8068-48.jpg=8068-49.jpg. Т. к. это распределение не зависит от Р(х), можно вычислить 8068-50.jpg, для к-рого вероятность 8068-51.jpgравна 8068-52.jpg, и задать доверит. зону для Р(х):8068-53.jpg

    Считается, что асимптотич. распределение справедливо при N8068-54.jpg80.

    Лит.: Митропольский А. К., Техника статистических вычислений,2 изд., М., 1971; Р а о С. Р., Линейные статистические методы и их применения, <пер. с англ., М., 1968; Кендалл М., Стьюрт А., Статистические выводы исвязи, пер. с англ., М., 1973; Статистические методы в экспериментальнойфизике, пер. с англ., М., 1976. В. П. Жигунов, С. В. Клименко.

  7. Источник: Физическая энциклопедия



  8. Математическая энциклопедия

    один из основных разделов математич. статистики, посвященный оцениванию по случайным наблюдениям тех или иных характеристик их распределения.

    Пример 1. Пусть X1,..., Х n - независимые случайные величины (наблюдения) с общим распределением на прямой, неизвестным наблюдателю. Эмпирическое (выборочное) распределение приписывающее нагрузку каждой случайной точке X1, является оценкой для Эмпирич. моменты

    служат оценками для моментов В частности,

    - оценка средней,

    - оценка дисперсии.

    Основные понятия. В общей теории оценивания наблюдение Xесть случайный элемент со значениями в измеримом пространстве неизвестное распределение к-рого принадлежит заданному семейству распределений Р. Семейство распределений всегда можно параметризовать и записать в виде Здесь форма зависимости от параметра и множество предполагаются известными. Задача оценивания по наблюдению X неизвестного параметра или значения функции gв точке заключается в том, чтобы построить функцию от наблюдений, достаточно хорошо аппроксимирующую

    Сравнение оценок производится следующим образом. Пусть на множестве задана неотрицательная функция потерь w(y1; y2), смысл к-рой состоит в том, что употребление оценки при фактическом значении параметра приводит к потерям Средние потери, функцию риска принимают за меру качества статистики как оценки при функции потерь w. Тем самым на множество оценок вводится отношение частичного упорядочения: оценка Т 1 предпочтительнее оценки T2, если В частности, оценка Тпараметра наз. недопустимой (по oтношению к функции потерь w), если найдется оценка T' такая, что для всех причем для какого-нибудь имеет место знак строгого неравенства. При таком способе сравнения качества оценивания многие оценки оказываются несравнимыми, кроме того, выбор функции потерь в значительной степени произволен.

    Иногда удается найти оценки, оптимальные внутри нек-рого более узкого класса оценок. Важный класс образуют несмещенные оценки. Если исходный эксперимент инвариантен относительно нек-рой группы преобразований, естественно ограничиться оценками, не нарушающими симметрию задачи (см. Эквивариантная оценка).

    Оценки можно сравнивать по их поведению в лхудших

  9. Источник: Математическая энциклопедия



  10. Русско-английский политехнический словарь

    statistical estimation

  11. Источник: Русско-английский политехнический словарь



  12. Социология: Энциклопедия

    - раздел статистического вывода, предназначенный для оценивания характеристик (параметров) генеральной совокупности по результатам выборочного исследования. С.О. параметров генеральной совокупности возможно, если выборка извлечена с использованием вероятностных (случайных) процедур.

    Неизвестные параметры генеральной совокупности (популярность политического лидера, рейтинг телевизионного канала, поддержка принимаемых решений со стороны населения и т.п.) чаще всего оценивают по результатам выборочного исследования. Поскольку ни одна выборочная процедура не может гарантировать отсутствие случайных ошибок, выборочный метод не позволяет определить точное (истинное) значение параметра; речь может идти только о приблизительной его оценке.

    Различают точечное и интервальное оценивание параметров генеральной совокупности.

    Интервальное оценивание предполагает построение доверительного интервала, в котором предположительно находится истинное значение параметра генеральной совокупности.

    Точечное оценивание предполагает получение приблизительного значения параметра в виде одного числа. Например, средний доход респондентов из выборки рассматривается в качестве оценки среднего дохода лиц, составляющих генеральную совокупность. Основными методами точечного оценивания являются метод моментов, метод максимального правдоподобия, метод оценивания по минимуму Х2, метод наименьших квадратов. Например, если для переменной "время, затрачиваемое на дорогу от дома до работы" среднее арифметическое по выборке составило 40 минут, то точечная оценка методом моментов будет заключаться в утверждении, что по генеральной совокупности среднее время на дорогу также составляет приблизительно 40 минут.

    Поскольку точечные оценки заведомо не являются точными, их желательными качествами являются несмещенность, эффективность, состоятельность, робастность.

    Несмещенность предполагает отсутствие систематического смещения значения выборочной статистики по отношению к истинному значению параметра генеральной совокупности, которое могло бы привести к завышению или занижению оценки этого параметра.

    Понятие эффективности связано с тем, что иногда для параметра можно найти несколько несмещенных оценок. Лучшей из них представляется та, которая при использовании разных выборок дала бы наименьший разброс значений или, другими словами, обладала бы наименьшей дисперсией ( Статистика выборочная): чем меньше дисперсия, тем выше эффективность оценки. Эффективной называется несмещенная оценка с минимальной дисперсией.

    Состоятельной называется оценка, значение которой с увеличением объема выборки приближается к истинному значению параметра генеральной совокупности.

    Робастность оценки означает ее устойчивость к наличию резко выделяющихся значений ("выбросов") или к нарушению предположений, ограничивающих применение соответствующего статистического метода.

    Исследованиями несмещенности, эффективности, состоятельности, робастности и других свойств статистических оценок занимается математическая статистика.

    О.В. Терещенко

  13. Источник: Социология: Энциклопедия