bugorwiki.info
на главную

Параметрическая статистика

Параметрическая статистика - это ветвь статистики, которая предполагает, что выборочные данные поступают из совокупности, которая следует распределению вероятностей на основе фиксированного набора параметров. Наиболее известные элементарные статистические методы являются параметрическими. Наоборот, непараметрическая модель отличается именно тем, что набор параметров (или набор функций в машинном обучении) не является фиксированным и может увеличиваться или даже уменьшаться, если собирается новая релевантная информация.

Поскольку параметрическая модель опирается на фиксированный набор параметров, она предполагает больше о заданной совокупности, чем непараметрические методы. Когда предположения верны, параметрические методы будут давать более точные и точные оценки, чем непараметрические методы, то есть обладают большей статистической силой. Однако, поскольку параметрические методы предполагают больше, когда допущения не верны, у них больше шансов на провал, и по этой причине они не являются надежными статистическими методами. С другой стороны, параметрические формулы часто проще записать и быстрее вычислить. По этой причине их простота может восполнить их недостаточную надежность, особенно если принять меры для изучения диагностической статистики.

пример

Все нормальные семейства распределений имеют одинаковую общую форму и параметризованы средним и стандартным отклонением. Это означает, что если известно среднее значение и стандартное отклонение и если распределение нормальное, то вероятность любого будущего наблюдения, лежащего в заданном диапазоне, известна. Предположим, у нас есть выборка из 99 тестовых оценок со средним значением 100 и стандартным отклонением 1. Если мы предположим, что все 99 тестовых оценок являются случайными наблюдениями из нормального распределения, то мы прогнозируем, что есть вероятность 1%, что 100-й тестовый результат будет выше, чем 102.365 (то есть среднее значение плюс 2.365 стандартных отклонений), при условии, что 100-й результат теста будет из того же распределения, что и остальные. Параметрические статистические методы используются для вычисления значения 2.365 выше, учитывая 99 независимых наблюдений из того же нормального распределения.

Непараметрическая оценка одной и той же вещи - это максимум первых 99 баллов. Нам не нужно ничего предполагать в отношении распределения результатов теста, чтобы доказать, что до того, как мы дали тест, была одинаково вероятна, что наивысшая оценка будет любой из первых 100. Таким образом, есть вероятность 1%, что 100-е выше чем любой из 99, которые предшествовали этому.

история

Параметрические функции были упомянуты Р. Фишером в его работе « Статистические методы для научных работников» в 1925 году, которая создала основу для современной статистики.


просмотров: 19