Большая Советская энциклопедия

    (от греч. stochastikos — умеющий угадывать, проницательный и лат. approximo — приближаюсь)

    метод решения широкого класса задач статистического оценивания (См. Статистическое оценивание), при котором каждое следующее значение оценки получается в виде основанной лишь на новом наблюдении поправки к уже построенной оценке. Основными чертами, обусловившими популярность С. а. в теоретических и прикладных работах, явились её непараметричность (применимость при весьма скудной информации об объекте наблюдения) и рекуррентность (простота пересчёта оценки при поступлении нового результата наблюдений). С. а. Применяется во многих прикладных задачах теории управления, обучения, в задачах техники, биологии, медицины. С. а. описана в 1951 американскими статистиками Г. Роббинсом и С. Монро, которые предложили рекуррентный план отыскания корня уравнения регрессии (См. Регрессия), т. е. корня θ уравнения r (x) =α в ситуации, когда каждое измеренное значение ук функции R(x) в точке Xk содержит случайную ошибку. Процедура Роббинса — Монро даётся формулой xK+i = Xkк(ук α). При некоторых условиях на функцию R (x), последовательность ak, стремящуюся к нулю, и на характер случайных ошибок доказано, что Xk →∞ при увеличении к.Позже метод С. а. был применен и для решения др. задач: отыскания максимума функции регрессии, оценки неизвестных параметров распределения по наблюдениям и др. На основе изучения предельного распределения нормированной разности xkθ построены асимптотически наилучшие процедуры С. а., в которых последовательность ак нужно выбирать зависящей от наблюдений.

    Лит.: Вазан М., Стохастическая аппроксимация. пер. с англ., М., 1972; Невельсон М. Б., Хасьминский Р. З., Стохастическая аппроксимация и рекуррентное оценивание, М., 1972.

    Р. З. Хасьминский.

  1. Источник: Большая советская энциклопедия. — М.: Советская энциклопедия. 1969—1978.



  2. Большой англо-русский и русско-английский словарь

    мат. stochastic approximation

  3. Источник: Большой англо-русский и русско-английский словарь



  4. Математическая энциклопедия

    метод решения класса задач статистич. оценивания, в к-ром новое значение оценки представляет собой поправку к уже имеющейся оценке, основанную на новом наблюдении. Первая процедура С. а. была предложена в 1951 X. Роббинсом(Н. Robbins) и С. Монро (S. Мопге).

    Пусть каждое измерение Yn(Xn) функции R(х), в точке Х n содержит случайную ошибку с нулевым средним. Процедура С. а. Роббинса- Монро для нахождения корня уравнения имеет вид

    Если функция R(x), напр., убывает,|R(х)|растет не быстрее, чем линейная функция, а случайные ошибки независимы, то Х п стремится к корню х 0 уравнения с вероятностью 1 и в среднем квадратическом (см. [1], [2]). Из (1) видно, что процедура С. а. рекуррентна, т. е. получение нового значения оценки возможно без запоминания старых измерений Yn, и удобна, когда неизвестно заранее, в какой момент потребуется представление оценки - она формируется непрерывно на основании наблюдений, имеющихся к данному моменту. Эти черты сближают С. а. с рекуррентными фильтрами и обусловливают популярность С. а. в теоретических и прикладных работах. Процедура (1) непосредственно обобщается на многомерный случай.

    Другая процедура С. а., применимая для нахождения точки максимума функции регрессии R(x), принадлежит Дж. Киферу (J. Kiefer) и Дж. Вольфовицу (J. Wolfowitz). Пусть Yn(x) - наблюдение в точке х. Тогда процедура С. а. Кифера - Вольфовица имеет вид

    Доказывается, что Х п сходится к точке максимума xmax функции R(x), если, напр., R'(x)(x-xmax)<0при функция регрессии и дисперсия случайных ошибок растут не слишком быстро при и выполнены условия

    Процедура С. а. Кифера - Вольфовица также допускает многомерное обобщение: вместо правой части в (2) следует подставить приближенное значение градиента функции Yn(x).

    Процедуры С. а. естественным образом обобщаются на непрерывный процесс наблюдений. Напр., если процесс наблюдений возмущается гауссовским белым шумом, то аналог процедуры (1) имеет вид dX(t) = a(t)dY(t). где

    - дифференциал наблюдаемого процесса, w(t) -винеровский процесс. Условия сходимости непрерывных процедур аналогичны приведенным выше условиям для дискретного времени (см. [2]). Основным инструментом доказательства сходимости процедур С. а. является теорема о сходимости неотрицательных супермартингалов (см. Мартингал).

    Изучалось предельное поведение при соответствующей нормировке разности Х п0 при Пусть в (1)

    и почти наверное при При нек-рых ограничениях, основными из к-рых являются требования

    при доказывается асимптотич. нормальность с параметрами величины Наименьшая дисперсия предельного распределения достигается при Такой выбор аневозможен, т. к. функция R(х)и ее производная неизвестны наблюдателю. Однако в ряде работ построены адаптивные процедуры, в к-рых а=а (п)зависит от наблюдений и приближается к a0 при Эти процедуры обладают асимптотически оптимальными в смысле асимптотич. дисперсии свойствами.

    Результаты об асимптотич. нормальности известны и в многомерном случае. Пусть все корни матрицы

    имеют отрицательные действительные части (I - единичная матрица),

    при почти наверное, и выполнены нек-рые другие не слишком ограничительные условия. Тогда вектор асимптотически нормален с нулевым средним и ковариационной матрицей

    Приведенный выше результат об асимптотически оптимальной процедуре Роббинса - Монро также обобщен на многомерный случай. Доказано, что случайный процесс Z п сходится к гауссовскому марковскому процессу в логарифмич. масштабе. При нек-рых условиях доказана сходимость моментов случайной величины Х п к моментам предельного закона.

    Процедуры типа С. а. удобны в непараметрич. ситуации, т. к. они применимы при наличии скудной априорной информации о функции регрессии. Однако они применимы и для оценки параметра плотности по независимым наблюдениям X1,..., Х п с этой плотностью. При нек-рых ограничениях рекуррентная процедура

    - информационная матрица Фишера плотности f) является состоятельной и асимптотически эффективной рекуррентной оценкой параметра Аналогичная процедура возможна и в случае непрерывного времени.

    Изучалось поведение процедур С. а. в случае, когда функция регрессии имеет несколько нулей (несколько точек экстремума), различные модификации и обобщения процедур С. а.

    Лит.:[1] Вазан М., Стохастическая аппроксимация, пер. с англ., М., 1972; [2] Невельсон М. Б., Xасьминский Р. 3., Стохастическая аппроксимация и рекуррентное оценивание, М., 1972; [3] Цыпкин Я. 3., Адаптация и обучение в автоматических системах, М., 1968; [4] его же, Основы теории обучающих систем, М., 1970.

    Р. 3. Хасъминский.

  5. Источник: Математическая энциклопедия



  6. Энциклопедия социологии

    (от греч. stochastikos - угадывающий и лат. approximo - приближаюсь) - англ. approximation, stochastic; нем. Approximation, sto-chastische. Метод решения задач статистического оценивания, в к-ром новое значение оценки представляет собой поправку к уже имеющейся оценке, основанной на новом наблюдении. С. а. используется в статист, прогнозировании и теории статист, решений.

  7. Источник: Энциклопедия социологии



  8. Толковый словарь по социологии

    (от греч. stochastikos - угадывающий и лат. approximo - приближаюсь) - англ. approximation, stochastic; нем. Approximation, sto-chastische. Метод решения задач статистического оценивания, в к-ром новое значение оценки представляет собой поправку к уже имеющейся оценке, основанной на новом наблюдении. С. а. используется в статист, прогнозировании и теории статист, решений.

  9. Источник: Толковый словарь по социологии