WinNavigator

Frigate

Norton Commander

WinNC

Dos Navigator

Servant Salamander

Turbo Browser

Winamp, Skins, Plugins

Необходимые Утилиты

Текстовые редакторы

Юмор

File managers and best utilites

Ошибки первого и второго рода. Реферат ошибки первого и второго рода

Реферат Ошибки первого и второго рода

скачать

Реферат на тему:

План:

1 Определения
2 О смысле ошибок первого и второго рода
3 Вероятности ошибок (уровень значимости и мощность)
4 Примеры использования
- 4.1 Радиолокация
- 4.2 Компьютеры
  - 4.2.1 Компьютерная безопасность
  - 4.2.2 Фильтрация спама
  - 4.2.3 Вредоносное программное обеспечение
  - 4.2.4 Поиск в компьютерных базах данных
  - 4.2.5 Оптическое распознавание текстов (OCR)
  - 4.2.6 Досмотр пассажиров и багажа
  - 4.2.7 Биометрия
- 4.3 Массовая медицинская диагностика (скрининг)
- 4.4 Медицинское тестирование
- 4.5 Исследования сверхъестественных явлений

Введение

Ошибки первого рода (англ. type I errors, α errors, false positives) и ошибки второго рода (англ. type II errors, β errors, false negatives) в математической статистике — это ключевые понятия задач проверки статистических гипотез. Тем не менее, данные понятия часто используются и в других областях, когда речь идёт о принятии «бинарного» решения (да/нет) на основе некоего критерия (теста, проверки, измерения), который с некоторой вероятностью может давать ложный результат.

1. Определения

Пусть дана выборка $\mathbf{X} = (X_1,\ldots,X_n)^{\top}$ из неизвестного совместного распределения $\mathbb{P}^{\mathbf{X}}$ , и поставлена бинарная задача проверки статистических гипотез:

$\begin{matrix} H_0 \\ H_1, \end{matrix}$

где H0 — нулевая гипотеза, а h2 — альтернативная гипотеза. Предположим, что задан статистический критерий

$f:\mathbb{R}^n \to \{H_0,H_1\}$ ,

сопоставляющий каждой реализации выборки $\mathbf{X} = \mathbf{x}$ одну из имеющихся гипотез. Тогда возможны следующие четыре ситуации:

Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .

Во втором и четвертом случае говорят, что произошла статистическая ошибка, и её называют ошибкой первого и второго рода соответственно. [1][2]

Верная гипотеза H0 h2 Результат применения критерия H0 h2

H0 верно принята	H0 неверно принята (Ошибка второго рода)
H0 неверно отвергнута (Ошибка первого рода)	H0 верно отвергнута

2. О смысле ошибок первого и второго рода

Как видно из вышеприведённого определения, ошибки первого и второго рода являются взаимно-симметричными, то есть если поменять местами гипотезы H0 и h2, то ошибки первого рода превратятся в ошибки второго рода и наоборот. Тем не менее, в большинстве практических ситуаций путаницы не происходит, поскольку принято считать, что нулевая гипотеза H0 соответствует состоянию «по умолчанию» (естественному, наиболее ожидаемому положению вещей) — например, что обследумый человек здоров, или что проходящий через рамку металлодетектора пассажир не имеет запрещённых металлических предметов. Соответственно, альтернативная гипотеза h2 обозначает противоположную ситуацию, которая обычно трактуется как менее вероятная, неординарная, требующая какой-либо реакции.

С учётом этого ошибку первого рода часто называют ложной тревогой, ложным срабатыванием или ложноположительным срабатыванием — например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Из-за возможности ложных срабатываний не удаётся полностью автоматизировать борьбу со многими видами угроз. Как правило, вероятность ложного срабатывания коррелирует с вероятностью пропуска события (ошибки второго рода). То есть, чем более чувствительна система, тем больше опасных событий она детектирует и, следовательно, предотвращает. Но при повышении чувствительности неизбежно вырастает и вероятность ложных срабатываний. Поэтому чересчур чувствительно (параноидально) настроенная система защиты может выродиться в свою противоположность и привести к тому, что побочный вред от неё будет превышать пользу.

Соответственно, ошибку второго рода иногда называют пропуском события или ложноотрицательным срабатыванием — человек болен, но анализ крови этого не показал, или у пассажира имеется холодное оружие, но рамка металлодетектора его не обнаружила (например, из-за того, что чувствительность рамки отрегулирована на обнаружение только очень массивных металлических предметов).

Степень чувствительности системы защиты должна представлять собой компромисс между вероятностью ошибок первого и второго рода. Где именно находится точка баланса, зависит от оценки рисков обоих видов ошибок.

3. Вероятности ошибок (уровень значимости и мощность)

Вероятность ошибки первого рода при проверке статистических гипотез называют уровнем значимости и обычно обозначают греческой буквой α (отсюда название α-errors).

Вероятность ошибки второго рода не имеет какого-то особого общепринятого названия, на письме обозначается греческой буквой β (отсюда β-errors). Однако с этой величиной тесно связана другая, имеющая большое статистическое значение — мощность критерия. Она вычисляется по формуле (1 − β). Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

Обе эти характеристики обычно вычисляются с помощью так называемой функции мощности критерия. В частности, вероятность ошибки первого рода есть функция мощности, вычисленная при нулевой гипотезе. Для критериев, основанных на выборке фиксированного объема, вероятность ошибки второго рода есть единица минус функция мощности, вычисленная в предположении, что распределение наблюдений соответствует альтернативной гипотезе. Для последовательных критериев это также верно, если критерий останавливается с вероятностью единица (при данном распределении из альтернативы).

В статистических тестах обычно приходится идти на компромисс между приемлемым уровнем ошибок первого и второго рода. Зачастую для принятия решения используется пороговое значение, которое может варьироваться с целью сделать тест более строгим или, наоборот, более мягким. Этим пороговым значением является уровень значимости, которым задаются при проверке статистических гипотез. Например, в случае металлодетектора повышение чувствительности прибора приведёт к увеличению риска ошибки первого рода (ложная тревога), а понижение чувствительности — к увеличению риска ошибки второго рода (пропуск запрещённого предмета).

4. Примеры использования

4.1. Радиолокация

В задаче радилокационного обнаружения воздушных целей, прежде всего в системе ПВО ошибки первого и второго рода, с формулировкой «ложная тревога» и «пропуск цели» являются одним из основных элементов как теории, так и практики построения радилокационных станций. Вероятно, это первый пример последовательного применения статистических методов в целой технической области.

4.2. Компьютеры

Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.

4.2.1. Компьютерная безопасность

Наличие уязвимостей в вычислительных системах приводит к тому, что приходится, с одной стороны, решать задачу сохранения целостности компьютерных данных, а с другой стороны — обеспечивать нормальный доступ легальных пользователей к этим данным (см. компьютерная безопасность). Moulton (1983, с.125) отмечает, что в данном контексте возможны следующие нежелательные ситуации:

когда авторизованные пользователи классифицируются как нарушители (ошибки первого рода)
когда нарушители классифицируются как авторизованные пользователи (ошибки второго рода)

4.2.2. Фильтрация спама

Ошибка первого рода происходит, когда механизм блокировки/фильтрации спама ошибочно классифицирует легитимное email-сообщение как спам и препятствует его нормальной доставке. В то время как большинство «анти-спам» алгоритмов способны блокировать/фильтровать большой процент нежелательных email-сообщений, гораздо более важной задачей является минимизировать число «ложных тревог» (ошибочных блокировок нужных сообщений).

Ошибка второго рода происходит, когда анти-спам система ошибочно пропускает нежелательное сообщение, классифицируя его как «не спам». Низкий уровень таких ошибок является индикатором эффективности анти-спам алгоритма.

Пока не удалось создать антиспамовую систему без корреляции между вероятностью ошибок первого и второго рода. Вероятность пропустить спам у современных систем колеблется в пределах от 1 % до 30 %. Вероятность ошибочно отвергнуть валидное сообщение — от 0,001 % до 3 %. Выбор системы и её настроек зависит от условий конкретного получателя: для одних получателей риск потерять 1 % хорошей почты оценивается как незначительный, для других же потеря даже 0,1 % является недопустимой.

4.2.3. Вредоносное программное обеспечение

Понятие ошибки первого рода также используется, когда антивирусное программное обеспечение ошибочно классифицирует безвредный файл как вирус. Неверное обнаружение может быть вызвано особенностями эвристики, либо неправильной сигнатурой вируса в базе данных. Подобные проблемы могут происходить также и с анти-троянскими и анти-шпионскими программами.

4.2.4. Поиск в компьютерных базах данных

При поиске в базе данных, к ошибкам первого рода можно отнести документы, которые выдаются поиском, несмотря на их иррелевантность (несоответствие) поисковому запросу. Ошибочные срабатывания характерны для полнотекстового поиска, когда поисковый алгоритм анализирует полные тексты всех хранимых в базе данных документов и пытается найти соответствия одному или нескольким терминам, заданным пользователем в запросе.

Большинство ложных срабатываний обусловлены сложностью естественных языков, многозначностью слов: например, «home» может обозначать как «место проживания человека», так и «корневую страницу веб-сайта». Число подобных ошибок может быть снижено за счёт использования специального словаря. Однако, это решение относительно дорогое, поскольку подобный словарь и разметка документов (индексирование) должны создаваться экспертом.

4.2.5. Оптическое распознавание текстов (OCR)

Разнообразные детектирующие алгоритмы нередко выдают ошибки первого рода. Программное обеспечение оптического распознавания текстов может распознать букву «a» в ситуации, когда на самом деле изображены несколько точек, которые используемый алгоритм расценил как «a».

4.2.6. Досмотр пассажиров и багажа

Ошибки первого рода регулярно встречаются каждый день в компьютерных системах предварительного досмотра пассажиров в аэропортах. Установленные в них детекторы предназначены для предотвращения проноса оружия на борт самолёта; тем не менее, уровень чувствительности в них зачастую настраивается настолько высоко, что много раз за день они срабатывают на незначительные предметы, такие как ключи, пряжки ремней, монеты, мобильные телефоны, гвозди в подошвах обуви и т. п. (см. обнаружение взрывчатых веществ, металлодетекторы).

Таким образом, соотношение числа ложных тревог (идентифицикация благопристойного пассажира как правонарушителя) к числу правильных срабатываний (обнаружение действительно запрещённых предметов) очень велико.

4.2.7. Биометрия

Ошибки первого и второго рода являются большой проблемой в системах биометрического сканирования, использующих распознавание радужной оболочки или сетчатки глаза, черт лица и т. д. Такие сканирующие системы могут ошибочно отождествить кого-то с другим, «известным» системе человеком, информация о котором хранится в базе данных (к примеру, это может быть лицо, имеющее право входа в систему, или подозреваемый преступник и т. п.). Противоположной ошибкой будет неспособность системы распознать легитимного зарегистрированного пользователя, или опознать подозреваемого в преступлении.[3]

4.3. Массовая медицинская диагностика (скрининг)

В медицинской практике есть существенное различие между скринингом и тестированием:

Скрининг включает в себя относительно дешёвые тесты, которые проводятся для большой группы людей при отсутствии каких-либо клинических признаков болезни (например, мазок Папаниколау).
Тестирование подразумевает гораздо более дорогие, зачастую инвазивные, процедуры, которые проводятся только для тех, у кого проявляются клинические признаки заболевания, и которые в основном применяются для подтверждения предполагаемого диагноза.

К примеру, в большинстве штатов в США обязательно прохождение новорожденными процедуры скрининга на оксифенилкетонурию и гипотиреоз, помимо других врождённых аномалий. Несмотря на высокий уровень ошибок первого рода, эти процедуры скрининга считаются целесообразными, поскольку они существенно увеличивают вероятность обнаружения этих расстройств на самой ранней стадии.[4]

Простые анализы крови, используемые для скрининга потенциальных доноров на ВИЧ и гепатит, имеют существенный уровень ошибок первого рода; однако в арсенале врачей есть гораздо более точные (и, соответственно, дорогие) тесты для проверки, действительно ли человек инфицирован каким-либо из этих вирусов.

Возможно, наиболее широкие дискуссии вызывают ошибки первого рода в процедурах скрининга на рак груди (маммография). В США уровень ошибок первого рода в маммограммах достигает 15 %, это самый высокий показатель в мире.[5] Самый низкий уровень наблюдается в Нидерландах, 1 %.[6]

4.4. Медицинское тестирование

Ошибки второго рода являются существенной проблемой в медицинском тестировании. Они дают пациенту и врачу ложное убеждение, что заболевание отсутствует, в то время как в действительности оно есть. Это зачастую приводит к неуместному или неадекватному лечению. Типичным примером является доверие результатам кардиотестирования при выявлении коронарного атеросклероза, хотя известно, что кардиотестирование выявляет только те затруднения кровотока в коронарной артерии, которые вызваны стенозом.

Ошибки второго рода вызывают серьёзные и трудные для понимания проблемы, особенно когда искомое условие является широкораспространённым. Если тест с 10%-ным уровнем ошибок второго рода используется для обследования группы, где вероятность «истинно-положительных» случаев составляет 70 %, то многие отрицательные результаты теста окажутся ложными. (См. Теорему Байеса).

Ошибки первого рода также могут вызывать серьёзные и трудные для понимания проблемы. Это происходит, когда искомое условие является редким. Если уровень ошибок первого рода у теста составляет один случай на десять тысяч, но в тестируемой группе образцов (или людей) вероятность «истинно-положительных» случаев составляет в среднем один случай на миллион, то большинство положительных результатов этого теста будут ложными.[7]

4.5. Исследования сверхъестественных явлений

Термин ошибка первого рода был взят на вооружение исследователями в области паранормальных явлений и привидений для описания фотографии или записи или какого-либо другого свидетельства, которое ошибочно трактуется как имеющее паранормальное происхождение — в данном контексте ошибка первого рода — это какое-либо несостоятельное «медиасвидетельство» (изображение, видеозапись, аудиозапись и т. д.), которое имеет обычное объяснение.[8]

Примечания

ГОСТ Р 50779.10-2000. «Статистические методы. Вероятность и основы статистики. Термины и определения.». Стр. 26 - protect.gost.ru/v.aspx?control=8&baseC=-1&page=0&month=-1&year=-1&search=&RegNum=1&DocOnPageCount=15&id=130411&pageK=A982F469-855A-4B0B-9443-710141B75665
Valerie J. Easton, John H. McColl. Statistics Glossary: Hypothesis Testing. - www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html
Данный пример как раз характеризует случай, когда классификация ошибок будет зависеть от назначения системы: если биометрическое сканирование используется для допуска сотрудников (нулевая гипотеза: «проходящий сканирование человек действительно является сотрудником»), то ошибочное отождествление будет ошибкой второго рода, а «неузнавание» — ошибкой первого рода; если же сканирование используется для опознания преступников (нулевая гипотеза: «проходящий сканирование человек не является преступником»), то ошибочное отождествление будет ошибкой первого рода, а «неузнавание» — ошибкой второго рода.
Относительно скрининга новорожденных, последние исследования показали, что количество ошибок первого рода в 12 раз больше, чем количество верных обнаружений (Gambrill, 2006. [1] - www.nlm.nih.gov/medlineplus/news/fullstory_34471.html)
Одним из последствий такого высокого уровня ошибок первого рода в США является то, что за произвольный 10-летний период половина обследуемых американских женщин получают как минимум одну ложноположительную маммограмму. Такие ошибочные маммограммы обходятся дорого, приводя к ежегодным расходам в 100 миллионов долларов на последующее (ненужное) лечение. Кроме того, они вызывают излишнюю тревогу у женщин. В результате высокого уровня подобных ошибок первого рода в США, примерно у 90-95 % женщин, получивших хотя бы раз в жизни положительную маммограмму, на самом деле заболевание отсутствует.
Наиболее низкие уровни этих ошибок наблюдаются в северной Европе, где маммографические плёнки считываются дважды, и для дополнительного тестирования устанавливается повышенное пороговое значение (высокий порог снижает статистическую эффективность теста).
Вероятность того, что выдаваемый тестом результат окажется ошибкой первого рода, может быть вычислена при помощи Теоремы Байеса.
На некоторых сайтах приведены примеры ошибок первого рода, например: Атлантическое Сообщество Паранормальных явлений (The Atlantic Paranormal Society, TAPS) - the-atlantic-paranormal-society.com/images/tapspics/index.html и Морстаунская организация по Исследованию Привидений (Moorestown Ghost Research) - www.moorestownghostresearch.com/FalsePositives.html.

wreferat.baza-referat.ru

Реферат Ошибки первого и второго рода

скачать

Реферат на тему:

План:

1 Определения
2 О смысле ошибок первого и второго рода
3 Вероятности ошибок (уровень значимости и мощность)
4 Примеры использования
- 4.1 Радиолокация
- 4.2 Компьютеры
  - 4.2.1 Компьютерная безопасность
  - 4.2.2 Фильтрация спама
  - 4.2.3 Вредоносное программное обеспечение
  - 4.2.4 Поиск в компьютерных базах данных
  - 4.2.5 Оптическое распознавание текстов (OCR)
  - 4.2.6 Досмотр пассажиров и багажа
  - 4.2.7 Биометрия
- 4.3 Массовая медицинская диагностика (скрининг)
- 4.4 Медицинское тестирование
- 4.5 Исследования сверхъестественных явлений

Введение

1. Определения

$\begin{matrix} H_0 \\ H_1, \end{matrix}$

где H0 — нулевая гипотеза, а h2 — альтернативная гипотеза. Предположим, что задан статистический критерий

$f:\mathbb{R}^n \to \{H_0,H_1\}$ ,

Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .

Верная гипотеза H0 h2 Результат применения критерия H0 h2

H0 верно принята	H0 неверно принята (Ошибка второго рода)
H0 неверно отвергнута (Ошибка первого рода)	H0 верно отвергнута

2. О смысле ошибок первого и второго рода

3. Вероятности ошибок (уровень значимости и мощность)

4. Примеры использования

4.1. Радиолокация

4.2. Компьютеры

Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.

4.2.1. Компьютерная безопасность

когда авторизованные пользователи классифицируются как нарушители (ошибки первого рода)
когда нарушители классифицируются как авторизованные пользователи (ошибки второго рода)

4.2.2. Фильтрация спама

4.2.3. Вредоносное программное обеспечение

4.2.4. Поиск в компьютерных базах данных

4.2.5. Оптическое распознавание текстов (OCR)

4.2.6. Досмотр пассажиров и багажа

4.2.7. Биометрия

4.3. Массовая медицинская диагностика (скрининг)

В медицинской практике есть существенное различие между скринингом и тестированием:

Скрининг включает в себя относительно дешёвые тесты, которые проводятся для большой группы людей при отсутствии каких-либо клинических признаков болезни (например, мазок Папаниколау).
Тестирование подразумевает гораздо более дорогие, зачастую инвазивные, процедуры, которые проводятся только для тех, у кого проявляются клинические признаки заболевания, и которые в основном применяются для подтверждения предполагаемого диагноза.

4.4. Медицинское тестирование

4.5. Исследования сверхъестественных явлений

Примечания

ГОСТ Р 50779.10-2000. «Статистические методы. Вероятность и основы статистики. Термины и определения.». Стр. 26 - protect.gost.ru/v.aspx?control=8&baseC=-1&page=0&month=-1&year=-1&search=&RegNum=1&DocOnPageCount=15&id=130411&pageK=A982F469-855A-4B0B-9443-710141B75665
Valerie J. Easton, John H. McColl. Statistics Glossary: Hypothesis Testing. - www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html
Данный пример как раз характеризует случай, когда классификация ошибок будет зависеть от назначения системы: если биометрическое сканирование используется для допуска сотрудников (нулевая гипотеза: «проходящий сканирование человек действительно является сотрудником»), то ошибочное отождествление будет ошибкой второго рода, а «неузнавание» — ошибкой первого рода; если же сканирование используется для опознания преступников (нулевая гипотеза: «проходящий сканирование человек не является преступником»), то ошибочное отождествление будет ошибкой первого рода, а «неузнавание» — ошибкой второго рода.
Относительно скрининга новорожденных, последние исследования показали, что количество ошибок первого рода в 12 раз больше, чем количество верных обнаружений (Gambrill, 2006. [1] - www.nlm.nih.gov/medlineplus/news/fullstory_34471.html)
Одним из последствий такого высокого уровня ошибок первого рода в США является то, что за произвольный 10-летний период половина обследуемых американских женщин получают как минимум одну ложноположительную маммограмму. Такие ошибочные маммограммы обходятся дорого, приводя к ежегодным расходам в 100 миллионов долларов на последующее (ненужное) лечение. Кроме того, они вызывают излишнюю тревогу у женщин. В результате высокого уровня подобных ошибок первого рода в США, примерно у 90-95 % женщин, получивших хотя бы раз в жизни положительную маммограмму, на самом деле заболевание отсутствует.
Наиболее низкие уровни этих ошибок наблюдаются в северной Европе, где маммографические плёнки считываются дважды, и для дополнительного тестирования устанавливается повышенное пороговое значение (высокий порог снижает статистическую эффективность теста).
Вероятность того, что выдаваемый тестом результат окажется ошибкой первого рода, может быть вычислена при помощи Теоремы Байеса.
На некоторых сайтах приведены примеры ошибок первого рода, например: Атлантическое Сообщество Паранормальных явлений (The Atlantic Paranormal Society, TAPS) - the-atlantic-paranormal-society.com/images/tapspics/index.html и Морстаунская организация по Исследованию Привидений (Moorestown Ghost Research) - www.moorestownghostresearch.com/FalsePositives.html.

www.wreferat.baza-referat.ru

ошибки 1 2 рода

ГБОУ СПО ТПСК № 57

Реферат по Теории вероятности и математической статистики на тему : « Ошибка 1 и 2 рода статических гипотез »

Выполнила студентка группы 2ИС-01

Ткаченко Ирина

Статистическая гипотеза представляет собой некоторое предположение о законе распределения случайной величины или о параметрах этого закона, формулируемое на основе выборки [3, 5, 11]. Примерами статистических гипотез являются предположения: генеральная совокупность распределена по экспоненциальному закону; математические ожидания двух экспоненциально распределенных выборок равны друг другу. В первой из них высказано предположение о виде закона распределения, а во второй – о параметрах двух распределений. Гипотезы, в основе которых нет никаких допущений о конкретном виде закона распределения, называют непараметрическими, в противном случае – параметрическими.

Гипотезу, утверждающую, что различие между сравниваемыми характеристиками отсутствует, а наблюдаемые отклонения объясняются лишь случайными колебаниями в выборках, на основании которых производится сравнение, называют нулевой (основной) гипотезой и обозначают Но .Наряду с основной гипотезой рассматривают и альтернативную (конкурирующую, противоречащую) ей гипотезу Н1.

И если нулевая гипотеза будет отвергнута, то будет иметь место альтернативная гипотеза.Различают простые и сложные гипотезы. Гипотезу называют простой, если она однозначно характеризует параметр распределения случайной величины. Например, если l является параметром экспоненциального распределения, то гипотеза Н0 о равенстве l =10 – простая гипотеза. Сложной называют гипотезу, которая состоит из конечного или бесконечного множества простых гипотез. Сложная гипотеза Н0 о неравенстве l >10 состоит из бесконечного множества простых гипотез Н0 о равенстве l =bi, где bi– любое число, большее 10. Гипотеза Н0 о том, что математическое ожидание нормального распределения равно двум при неизвестной дисперсии, тоже является сложной. Сложной гипотезой будет предположение о распределении случайной величины Х по нормальному закону, если не фиксируются конкретные значения математического ожидания и дисперсии.

Проверка гипотезы основывается на вычислении некоторой случайной величины – критерия, точное или приближенное распределение которого известно. Обозначим эту величину через z, ее значение является функцией от элементов выборки z=z(x1, x2, …, xn).Процедура проверки гипотезы предписывает каждому значению критерия одно из двух решений – принять или отвергнуть гипотезу. Тем самым все выборочное пространство и соответственно множество значений критерия делятся на два непересекающихся подмножества S0 и S1.Если значение критерия z попадает в область S0, то гипотеза принимается, а если в область S1, – гипотеза отклоняется. Множество S0 называется областью принятия гипотезы или областью допустимых значений, а множество S1– областью отклонения гипотезы или критической областью. Выбор одной области однозначно определяет и другую область. Принятие или отклонение гипотезы Н0

по случайной выборке соответствует истине с некоторой вероятностью и, соответственно, возможны два рода ошибок. Ошибка первого рода возникает с вероятностью a тогда, когда отвергается верная гипотеза Н0 и принимается конкурирующая гипотеза Н1.Ошибка второго рода возникает с вероятностью b в том случае, когда принимается неверная гипотеза Н0, в то время как справедлива конкурирующая гипотеза Н1. Доверительная вероятность – это вероятность не совершить ошибку первого рода и принять верную гипотезу Н0. Вероятность отвергнуть ложную гипотезу Н0 называется мощностью критерия. Следовательно, при проверке гипотезы возможны четыре варианта исходов, табл. 3.1.

Гипотеза Н0	Решение	Вероятность	Примечание
Верна	Принимается	1–a	Доверительная вероятность
Верна	Отвергается	a	Вероятность ошибки первого рода
Неверна	Принимается	b	Вероятность ошибки второго рода
Неверна	Отвергается	1-b	Мощность критерия

Например, рассмотрим случай, когда некоторая несмещенная оценка параметра q вычислена по выборке объема n, и эта оценка имеет плотность распределения f(q ), рис. 3.1.

Предположим, что истинное значение оцениваемого параметра равно Т. Если рассматривать гипотезу Н0 о равенстве q =Т, то насколько велико должно быть различие между q и Т, чтобы эту гипотезу отвергнуть. Ответить на данный вопрос можно в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между q и Т на основе выборочного распределения параметра q .

Целесообразно полагать одинаковыми значения вероятности выхода параметра q за нижний и верхний пределы интервала. Такое допущение во многих случаях позволяет минимизировать доверительный интервал, т.е. повысить мощность критерия проверки. Суммарная вероятность того, что параметр q выйдет за пределы интервала с границами q 1–a /2 и q a /2, составляет величину a . Эту величину следует выбрать настолько малой, чтобы выход за пределы интервала был маловероятен. Если оценка параметра попала в заданный интервал, то в таком случае нет оснований подвергать сомнению проверяемую гипотезу, следовательно, гипотезу равенства q =Т можно принять. Но если после получения выборки окажется, что оценка выходит за установленные пределы, то в этом случае есть серьезные основания отвергнуть гипотезу Н0. Отсюда следует, что вероятность допустить ошибку первого рода равна a (равна уровню значимости критерия).

Если предположить, например, что истинное значение параметра в действительности равно Т+d, то согласно гипотезе Н0 о равенстве q =Т – вероятность того, что оценка параметра q попадет в область принятия гипотезы, составит b , рис. 3.2.

При заданном объеме выборки вероятность совершения ошибки первого рода можно уменьшить, снижая уровень значимости a . Однако при этом увеличивается вероятность ошибки второго рода b (снижается мощность критерия). Аналогичные рассуждения можно провести для случая, когда истинное значение параметра равно Т – d.

Единственный способ уменьшить обе вероятности состоит в увеличении объема выборки (плотность распределения оценки параметра при этом становится более "узкой"). При выборе критической области руководствуются правилом Неймана – Пирсона: следует так выбирать критическую область, чтобы вероятность a была мала, если гипотеза верна, и велика в противном случае. Однако выбор конкретного значения a относительно произволен. Употребительные значения лежат в пределах от 0,001 до 0,2. В целях упрощения ручных расчетов составлены таблицы интервалов с границами q 1–a /2 и q a /2 для типовых значений a и различных способов построения критерия.

При выборе уровня значимости необходимо учитывать мощность критерия при альтернативной гипотезе. Иногда большая мощность критерия оказывается существеннее малого уровня значимости, и его значение выбирают относительно большим, например 0,2. Такой выбор оправдан, если последствия ошибок второго рода более существенны, чем ошибок первого рода. Например, если отвергнуто правильное решение "продолжить работу пользователей с текущими паролями", то ошибка первого рода приведет к некоторой задержке в нормальном функционировании системы, связанной со сменой паролей. Если же принято решения не менять пароли, несмотря на опасность несанкционированного доступа посторонних лиц к информации, то эта ошибка повлечет более серьезные последствия.

В зависимости от сущности проверяемой гипотезы и используемых мер расхождения оценки характеристики от ее теоретического значения применяют различные критерии. К числу наиболее часто применяемых критериев для проверки гипотез о законах распределения относят критерии хи-квадрат Пирсона, Колмогорова, Мизеса, Вилкоксона, о значениях параметров – критерии Фишера, Стьюдента.

Список использованной литературы :

http://dvo.sut.ru/libr/opds/i130hodo_part1/3.htm

studfiles.net

Ошибки первого и второго рода

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость её проверки. Поскольку проверку производят статистическими методами, её называют статистической. В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Подчеркнём, что последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода повлечёт материальный ущерб: если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечёт более тяжёлые последствия, чем ошибка второго рода.

Замечание 1. Правильное решение может быть принято также в двух случаях:

гипотеза принимается, причём и в действительности она правильная;
гипотеза отвергается, причём и в действительности она неверна.

Замечание 2. Вероятность совершить ошибку первого рода принято обозначать через ; её называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).

Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия

Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближённое распределение которой известно. Обозначим эту величину в целях общности через .

Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.

Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия принимают отношение исправленных выборочных дисперсий:.

Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперёд неизвестные значения, и распределена по закону Фишера – Снедекора.

Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.

Наблюдаемым значением называют значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсиии, то наблюдаемое значение критерия.

Критическая область. Область принятия гипотезы. Критические точки

После выбора определённого критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.

Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.

Поскольку критерий - одномерная случайная величина, все её возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.

Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством >, где- положительное число.

Левосторонней называют критическую область, определяемую неравенством <, где- отрицательное число.

Односторонней называют правостороннюю или левостороннюю критическую область.

Двусторонней называют критическую область, определяемую неравенствами где.

В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами ( в предположении, что >0):

, или равносильным неравенством .

Отыскание правосторонней критической области

Как найти критическую область? Обоснованный ответ на этот вопрос требует привлечения довольно сложной теории. Ограничимся её элементами. Для определённости начнём с нахождения правосторонней критической области, которая определяется неравенством >, где>0. Видим, что для отыскания правосторонней критической области достаточно найти критическую точку. Следовательно, возникает новый вопрос: как её найти?

Для её нахождения задаются достаточной малой вероятностью – уровнем значимости . Затем ищут критическую точку, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, критерийпримет значение, большее, была равна принятому уровню значимости: Р(>)=.

Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.

Замечание 1. Когда критическая точка уже найдена, вычисляют по данным выборок наблюдаемое значение критерия и, если окажется, что >, то нулевую гипотезу отвергают; если же<, то нет оснований, чтобы отвергнуть нулевую гипотезу.

Пояснение. Почему правосторонняя критическая область была определена, исходя из требования, чтобы при справедливости нулевой гипотезы выполнялось соотношение

Р(>)=? (*)

Поскольку вероятность события >мала (- малая вероятность), такое событие при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить. Если всё же оно произошло, т.е. наблюдаемое значение критерия оказалось больше, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование (*) определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область.

Замечание 2. Наблюдаемое значение критерия может оказаться большим не потому, что нулевая гипотеза ложна, а по другим причинам (малый объём выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости. Итак, пользуясь требованием (*), мы с вероятностьюрискуем совершить ошибку первого рода.

Замечание 3. Пусть нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения, ещё не доказывает его. Поэтому более правильно говорить, «данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований её отвергнуть».

На практике для большей уверенности принятия гипотезы её проверяют другими способами или повторяют эксперимент, увеличив объём выборки.

Отвергают гипотезу более категорично, чем принимают. Действительно, известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим нулевой гипотезе, что позволяет её отклонить.

Отыскание левосторонней и двусторонней критических областей***

Отыскание левосторонней и двусторонней критических областей сводится (так же, как и для правосторонней) к нахождению соответствующих критических точек. Левосторонняя критическая область определяется неравенством <(<0). Критическую точку находят, исходя из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее, была равна принятому уровню значимости: Р(<)=.

Двусторонняя критическая область определяется неравенствами Критические точки находят, исходя из требования, чтобы при справедливости нулевой гипотезы сумма вероятностей того, что критерий примет значение, меньшееили большее, была равна принятому уровню значимости:

. (*)

Ясно, что критические точки могут быть выбраны бесчисленным множеством способов. Если же распределение критерия симметрично относительно нуля и имеются основания (например, для увеличения мощности) выбрать симметричные относительно нуля точки (- )и(>0), то

Учитывая (*), получим .

Это соотношение и служит для отыскания критических точек двусторонней критической области. Критические точки находят по соответствующим таблицам.

Дополнительные сведения о выборе критической области. Мощность критерия

Мы строили критическую область, исходя из требования, чтобы вероятность попадания в неё критерия была равна при условии, что нулевая гипотеза справедлива. Оказывается целесообразным ввести в рассмотрение вероятность попадания критерия в критическую область при условии, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.

Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.

Пусть для проверки гипотезы принят определённый уровень значимости и выборка имеет фиксированный объём. Остаётся произвол в выборе критической области. Покажем, что её целесообразно построить так, чтобы мощность критерия была максимальной. Предварительно убедимся, что если вероятность ошибки второго рода (принять неправильную гипотезу) равна , то мощность равна 1-. Действительно, если- вероятность ошибки второго рода, т.е. события «принята нулевая гипотеза, причём справедливо конкурирующая», то мощность критерия равна 1 -.

Пусть мощность 1 - возрастает; следовательно, уменьшается вероятностьсовершить ошибку второго рода. Таким образом, чем мощность больше, тем вероятность ошибки второго рода меньше.

Итак, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования должно обеспечить минимальную ошибку второго рода, что, конечно, желательно.

Замечание 1. Поскольку вероятность события «ошибка второго рода допущена» равна , то вероятность противоположного события «ошибка второго рода не допущена» равна 1 -, т.е. мощности критерия. Отсюда следует, что мощность критерия есть вероятность того, что не будет допущена ошибка второго рода.

Замечание 2. Ясно, что чем меньше вероятности ошибок первого и второго рода, тем критическая область «лучше». Однако при заданном объёме выборки уменьшить одновременно иневозможно; если уменьшить, тобудет возрастать. Например, если принять=0, то будут приниматься все гипотезы, в том числе и неправильные, т.е. возрастает вероятностьошибки второго рода.

Как же выбрать наиболее целесообразно? Ответ на этот вопрос зависит от «тяжести последствий» ошибок для каждой конкретной задачи. Например, если ошибка первого рода повлечёт большие потери, а второго рода – малые, то следует принять возможно меньшее.

Если уже выбрано, то, пользуясь теоремой Ю. Неймана и Э.Пирсона, можно построить критическую область, для которойбудет минимальным и, следовательно, мощность критерия максимальной.

Замечание 3. Единственный способ одновременного уменьшения вероятностей ошибок первого и второго рода состоит в увеличении объёма выборок.

studfiles.net

Ошибки первого и второго рода. Мощность критерия — реферат

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

ИНСТИТУТ СОЦИОЛОГИИ И РЕГИОНОВЕДЕНИЯ

ЗАРУБЕЖНОЕ РЕГИОНОВЕДЕНИЕ

Реферат по учебной дисциплине

ВВЕДЕНИЕ В МАТЕМАТИЧЕСКУЮ СТАТИСТИКУ И ТЕОРИЮ ВЕРОЯТНОСТЕЙ

«Ошибки первого и второго рода. Мощность критерия»

Выполнила:

Ахкямова Ирина Витальевна, студентка 1-го курса

Преподаватель:

Дятлов Александр Викторович

Ростов – на – Дону

2015

План

Введение

Глава 1. Ошибки первого и второго рода

1.1 Ошибки первого и второго рода: понятие и суть

1.2 Области применения

Глава 2. Мощность критерия

2.1 Мощность критерия: понятие и суть

2.2 Виды критериев

Заключение

Список литературы

Введение

Гипотеза, которую выдвигает исследователь, может оказаться как верной, так и неверной, поэтому возникает острая необходимость проверить данную гипотезу. Эта гипотеза проверяется методами статистики, поэтому она именуется статистической.

В результате проверки гипотезы методами статистики исследователь дважды может допустить ошибку и принять неверное решение, т.е. совершить ошибку двух родов. Поэтому все выводы, сделанные на основе статистических данных, нередко содержат в себе ошибки. Эти ошибки, совершенные исследователем могут привести к очень серьезным последствиям, так как статистические методы применяются во многих областях, чем объясняется актуальность темы ошибок первого и второго рода.

Избежать ошибки при проверке статистических гипотез могут помочь различные критерии. Различные они потому что каждый критерий обладает определенной мощностью и уровнем значимости. Но и они не дают 100% результат принятия верной гипотезы, однако они помогают значительно снизить вероятность совершения ошибки и принятия неверной гипотезы к минимуму.

Целью работы является исследование ошибок первого и второго рода и мощности критерия

Задачи:

дать определения понятиям ошибки первого и второго рода, мощность критерия
определить сферы применения ошибок первого и второго рода, и виды критериев, используемых при проверке выдвигаемых гипотез.

Глава 1. Ошибки первого и второго рода

1.1 Ошибки первого и второго рода: понятие и суть

Ошибки первого (α-риск) и второго рода (β-риск) – это ключевые понятия в математической статистике, которые используют при проверки гипотез, выдвигаемых исследователем.

Сущность ошибки первого рода заключается в том, что исследователем отвергается верная гипотеза. Уровнем значимости называется та вероятность, с которой возможно совершение ошибки первого рода, её принято обозначать – α, при этом значение обычно принимают за 0,05 или 0,01.

Сущность ошибки второго рода заключается в том, что исследователем принимается неверная гипотеза. Эта ошибка не имеет общепринятого названия, но ее принято обозначать – β.

	Гипотеза верна
	(нулевая гипотеза)	(альтернативная гипотеза)
Применение критерия исследователем	верно принята	неверно принята (Ошибка второго рода)
Применение критерия исследователем	неверно отвергнута (Ошибка первого рода)	верно отвергнута

Исходя из этого можно сделать вывод, что ошибки первого и второго родов взаимно-симметричны, и если поменять местами гипотезы и , то ошибки первого рода станут ошибками второго рода, а ошибки второго станут ошибками первого. Нулевая гипотеза – это наиболее вероятный, так называемый ожидаемый результат, а альтернативная – это противоположный, маловероятный результат, требующий дополнительной проверки.

Ошибку первого рода часто называют ложноположительным срабатыванием, а ошибку второго рода называют ложноотрицательным срабатыванием.

Вероятность совершения ошибки первого рода можно свести к нулю, всегда принимая нулевую гипотезу. Точно так же обстоит дело и с ошибками второго рода – всегда принимать альтернативную теорию. Но оба эти варианта неприемлемы.

1.2 Области применения

Ошибки первого и второго рода имеют широкую область применения.

Например, их используют в радиолокации для систем ПВО, где они имеют формулировку «ложная тревога» и «пропуск цели». В этой сфере ошибки первого и второго рода несут в себе основные принципы для построения радиолокационных станций.

Так же ошибки первого и второго рода используются в области компьютерного программного обеспечения, компьютерной безопасности. Например, для решения сохранения целостности данных и обеспечения доступа к ним легальных пользователей: здесь, как пример ошибки первого рода можно привести ситуацию, когда авторизованный пользователь распознается системой как нарушитель, а ошибкой второго рода – когда нарушитель распознается, как авторизованный. Так же их применяют для сортировки спама, в антивирусных программах, в компьютерных системах в аэропортах для предварительного досмотра пассажиров и их багажа на наличие запрещенных веществ и предметов, в биометрии.

Еще одной областью применения является медицина. Например их используют при проведении массовой медицинской диагностики – скрининга (относительно дешевый тест, используемый для массовой проверки людей, при отсутствии у них признаков заболевания), при чем здесь более распространены ошибки первого рода (например анализ крови на ВИЧ и СПИД). При проведении тестирования (исследование конкретного человека, при наличии у него клинических проявлений заболевания), ошибки второго рода наиболее распространены и являются существенной проблемой, например показать, что у пациента отсутствует заболевание, которое на самом деле у него есть, из-за чего больному не назначается, или назначается неуместное лечение.

Так же понятие «ошибка первого рода» используется исследователями в сфере изучения паранормальных явлений, где этим термином пользуются для описания какого либо визуального или аудио свидетельства, как несостоятельного.

Глава 2. Мощность критерия

2.1.Мощность критерия: понятие и суть

Как говорилось во введении, избежать ошибки при проверке статистических гипотез могут помочь различные критерии. Одной и наиболее значимой характеристикой любого критерия является его мощность.

Мощность – это способность выявить различия, если таковые имеются. Другими словами – это способность отклонить нулевую гипотезу, так как она неверна. Мощность критерия колеблется в диапазоне от 0 до 1, и чем ближе она к 1, тем мощнее критерий. Она вычисляется по формуле (1- β). Таким образом, чем выше мощность, тем меньше вероятность совершить ошибку второго рода.

При этом мощность критерия определяется только эмпирическим путем, и как не странно, из-за существования множества критериев, на практике оказывается, что один критерий способен выявить различия, где другому критерию этого сделать не удалось.

Существует несколько способов повышения уровня мощности:

Выбрать более высокий уровень значимости (α)
Сформулировать направленные гипотезы, где исследователь может сосредоточиться только на α-риске тех исходов, которые согласованы с направленной гипотезой
Увеличение объема выборки
Увеличить эффективность, т.е. выбрать значения с большей величиной связи

2.2.Виды критериев

Статистический критерий – это правило, которое математически обосновывает принятие нулевой гипотезе, об отсутствии различий, и отклонение альтернативной гипотезе, о наличии различий.

Статистические критерии подразделяются на параметрические и непараметрические.

Параметрические критерии предназначены для проверки параметрических гипотез и основываются на расчете показателей распределения, таких как среднее, дисперсия, стандартное отклонение. Они позволяют оценить напрямую уровень основных параметров генеральной совокупности, разности средних и различия дисперсий. На основе параметрических критериев можно проследить тенденцию изменения признаков. Так же эти критерии считаются наиболее мощными по сравнению с непараметрическими, но если признак измерен интервальной шкалой и нормально распределен. Но с интервальной шкало часто возникают проблемы, проверка на нормальность распределения требует сложных расчетов, а распределение часто отклоняется от нормального, тогда требуется обращаться к непараметрическим критериям.

Непараметрические критерии не содержат в себе ограничений, как параметрические и основаны на работе с другими данными, такими как частоты, ранги и т.п. Но с другой стороны с помощью этих критериев невозможно оценить такие важные параметры, как среднее или дисперсия, нельзя дать оценку взаимодействие двух или более условий и факторов, которые влияют на изменение признака. С помощью непараметрических критериев можно решать задачи в исследованиях в области, например педагогики или психологии: выявить различия в уровнях исследуемых признаков, оценить сдвиг значений и выявить различия в распределении.

Примеры непараметрических критериев:

Q-критерий Розенбаума
U-критерий Манна-Уитни
Критерий Уилкоксона
Критерий Пирсона
Критерий Колмогорова-Смирнова

Примеры параметрических критериев:

t-критерий Стьюдента
Критерий Фишера
Критерий отношения правдоподобия
Критерий Романовского

Также существуют другие способы классификации критериев, но они условны и включают в себя параметрические и непараметрические, и один и тот же критерий может быть использован в разных случаях.

Условная классификация:

Критерий значимости. Предполагает проверку гипотезы о численных значениях известного закона распределения
Проверка на согласие подразумевает проверку предположения о том, что величина, которую исследуют, будет подчинена предполагаемому закону. Критерии согласия можно трактовать, как критерии значимости. Это критерии Пирсона, Колмогорова, Крамера, Купера
Критерии проверки на однородность. При проверке на однородность исследуемые величина подвергаются проверке на факт значимости различия их законов распределения, другими словами, поддаются ли исследуемые величины одному и тому же закону. Применяются в факторном анализе для определения зависимостей.

Все критерии для принятия или опровержения выдвигаемой исследователем гипотезы применяются с доверительной вероятностью, другими словами на определенном уровне значимости.

Уровень значимости – это вероятность, с которой мы можем отклонить верную гипотезу и признать альтернативную, т.е. мы сочли различия в проверяемом признаке достаточно значимыми в ходе проверки любым из вышеперечисленных критериев.

Заключение

В ходе выполнения работы, мы выяснили, что же собой представляют ошибки первого и второго рода и области их применения, а так же познакомились с таким важным понятием в математической статистике как мощность критерия, а так же познакомились с некоторыми вида критериев и провели их классификацию.

Таким образом, можно сделать вывод, что ошибки первого и второго рода играют важную роль во многих сферах, таких как медицина, радиолокация, компьютерные технологии и во многих других.

Огромна роль их и при проведении психологических, педагогических и т.п. исследованиях.

Так как ошибки первого и второго рода являются случайными и могут привести к серьезным последствиям, существуют различные способы их проверки с помощью статистических критериев.

Эти критерии делятся на несколько групп. Каждый критерий обладает определенной мощностью, но каждый из них не достоверен на 100% и может дать сбой, поэтому определенно сказать, какой критерий более эффективный сказать нельзя. Каждый из них применяется в определенном случае и относительно уровня значимости.

referat911.ru

Реферат Ошибка первого рода

скачать

Реферат на тему:

План:

1 Определения
2 О смысле ошибок первого и второго рода
3 Вероятности ошибок (уровень значимости и мощность)
4 Примеры использования
- 4.1 Радиолокация
- 4.2 Компьютеры
  - 4.2.1 Компьютерная безопасность
  - 4.2.2 Фильтрация спама
  - 4.2.3 Вредоносное программное обеспечение
  - 4.2.4 Поиск в компьютерных базах данных
  - 4.2.5 Оптическое распознавание текстов (OCR)
  - 4.2.6 Досмотр пассажиров и багажа
  - 4.2.7 Биометрия
- 4.3 Массовая медицинская диагностика (скрининг)
- 4.4 Медицинское тестирование
- 4.5 Исследования сверхъестественных явлений

Введение

1. Определения

$\begin{matrix} H_0 \\ H_1, \end{matrix}$

где H0 — нулевая гипотеза, а h2 — альтернативная гипотеза. Предположим, что задан статистический критерий

$f:\mathbb{R}^n \to \{H_0,H_1\}$ ,

Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .

Верная гипотеза H0 h2 Результат применения критерия H0 h2

H0 верно принята	H0 неверно принята (Ошибка второго рода)
H0 неверно отвергнута (Ошибка первого рода)	H0 верно отвергнута

2. О смысле ошибок первого и второго рода

3. Вероятности ошибок (уровень значимости и мощность)

4. Примеры использования

4.1. Радиолокация

4.2. Компьютеры

Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.

4.2.1. Компьютерная безопасность

когда авторизованные пользователи классифицируются как нарушители (ошибки первого рода)
когда нарушители классифицируются как авторизованные пользователи (ошибки второго рода)

4.2.2. Фильтрация спама

4.2.3. Вредоносное программное обеспечение

4.2.4. Поиск в компьютерных базах данных

4.2.5. Оптическое распознавание текстов (OCR)

4.2.6. Досмотр пассажиров и багажа

4.2.7. Биометрия

4.3. Массовая медицинская диагностика (скрининг)

В медицинской практике есть существенное различие между скринингом и тестированием:

Скрининг включает в себя относительно дешёвые тесты, которые проводятся для большой группы людей при отсутствии каких-либо клинических признаков болезни (например, мазок Папаниколау).
Тестирование подразумевает гораздо более дорогие, зачастую инвазивные, процедуры, которые проводятся только для тех, у кого проявляются клинические признаки заболевания, и которые в основном применяются для подтверждения предполагаемого диагноза.

4.4. Медицинское тестирование

4.5. Исследования сверхъестественных явлений

Примечания

ГОСТ Р 50779.10-2000. «Статистические методы. Вероятность и основы статистики. Термины и определения.». Стр. 26 - protect.gost.ru/v.aspx?control=8&baseC=-1&page=0&month=-1&year=-1&search=&RegNum=1&DocOnPageCount=15&id=130411&pageK=A982F469-855A-4B0B-9443-710141B75665
Valerie J. Easton, John H. McColl. Statistics Glossary: Hypothesis Testing. - www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html
Данный пример как раз характеризует случай, когда классификация ошибок будет зависеть от назначения системы: если биометрическое сканирование используется для допуска сотрудников (нулевая гипотеза: «проходящий сканирование человек действительно является сотрудником»), то ошибочное отождествление будет ошибкой второго рода, а «неузнавание» — ошибкой первого рода; если же сканирование используется для опознания преступников (нулевая гипотеза: «проходящий сканирование человек не является преступником»), то ошибочное отождествление будет ошибкой первого рода, а «неузнавание» — ошибкой второго рода.
Относительно скрининга новорожденных, последние исследования показали, что количество ошибок первого рода в 12 раз больше, чем количество верных обнаружений (Gambrill, 2006. [1] - www.nlm.nih.gov/medlineplus/news/fullstory_34471.html)
Одним из последствий такого высокого уровня ошибок первого рода в США является то, что за произвольный 10-летний период половина обследуемых американских женщин получают как минимум одну ложноположительную маммограмму. Такие ошибочные маммограммы обходятся дорого, приводя к ежегодным расходам в 100 миллионов долларов на последующее (ненужное) лечение. Кроме того, они вызывают излишнюю тревогу у женщин. В результате высокого уровня подобных ошибок первого рода в США, примерно у 90-95 % женщин, получивших хотя бы раз в жизни положительную маммограмму, на самом деле заболевание отсутствует.
Наиболее низкие уровни этих ошибок наблюдаются в северной Европе, где маммографические плёнки считываются дважды, и для дополнительного тестирования устанавливается повышенное пороговое значение (высокий порог снижает статистическую эффективность теста).
Вероятность того, что выдаваемый тестом результат окажется ошибкой первого рода, может быть вычислена при помощи Теоремы Байеса.
На некоторых сайтах приведены примеры ошибок первого рода, например: Атлантическое Сообщество Паранормальных явлений (The Atlantic Paranormal Society, TAPS) - the-atlantic-paranormal-society.com/images/tapspics/index.html и Морстаунская организация по Исследованию Привидений (Moorestown Ghost Research) - www.moorestownghostresearch.com/FalsePositives.html.

wreferat.baza-referat.ru

Реферат Ошибка первого рода

скачать

Реферат на тему:

План:

1 Определения
2 О смысле ошибок первого и второго рода
3 Вероятности ошибок (уровень значимости и мощность)
4 Примеры использования
- 4.1 Радиолокация
- 4.2 Компьютеры
  - 4.2.1 Компьютерная безопасность
  - 4.2.2 Фильтрация спама
  - 4.2.3 Вредоносное программное обеспечение
  - 4.2.4 Поиск в компьютерных базах данных
  - 4.2.5 Оптическое распознавание текстов (OCR)
  - 4.2.6 Досмотр пассажиров и багажа
  - 4.2.7 Биометрия
- 4.3 Массовая медицинская диагностика (скрининг)
- 4.4 Медицинское тестирование
- 4.5 Исследования сверхъестественных явлений

Введение

1. Определения

$\begin{matrix} H_0 \\ H_1, \end{matrix}$

где H0 — нулевая гипотеза, а h2 — альтернативная гипотеза. Предположим, что задан статистический критерий

$f:\mathbb{R}^n \to \{H_0,H_1\}$ ,

Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе H0, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, и она точно определена статистическим критерием, то есть $f(\mathbf{x}) = H_1$ .
Распределение $\mathbb{P}^{\mathbf{X}}$ выборки $\mathbf{X}$ соответствует гипотезе h2, но она неверно отвергнута статистическим критерием, то есть $f(\mathbf{x}) = H_0$ .

Верная гипотеза H0 h2 Результат применения критерия H0 h2

H0 верно принята	H0 неверно принята (Ошибка второго рода)
H0 неверно отвергнута (Ошибка первого рода)	H0 верно отвергнута

2. О смысле ошибок первого и второго рода

3. Вероятности ошибок (уровень значимости и мощность)

4. Примеры использования

4.1. Радиолокация

4.2. Компьютеры

Понятия ошибок первого и второго рода широко используются в области компьютеров и программного обеспечения.

4.2.1. Компьютерная безопасность

когда авторизованные пользователи классифицируются как нарушители (ошибки первого рода)
когда нарушители классифицируются как авторизованные пользователи (ошибки второго рода)

4.2.2. Фильтрация спама

4.2.3. Вредоносное программное обеспечение

4.2.4. Поиск в компьютерных базах данных

4.2.5. Оптическое распознавание текстов (OCR)

4.2.6. Досмотр пассажиров и багажа

4.2.7. Биометрия

4.3. Массовая медицинская диагностика (скрининг)

В медицинской практике есть существенное различие между скринингом и тестированием:

Скрининг включает в себя относительно дешёвые тесты, которые проводятся для большой группы людей при отсутствии каких-либо клинических признаков болезни (например, мазок Папаниколау).
Тестирование подразумевает гораздо более дорогие, зачастую инвазивные, процедуры, которые проводятся только для тех, у кого проявляются клинические признаки заболевания, и которые в основном применяются для подтверждения предполагаемого диагноза.

4.4. Медицинское тестирование

4.5. Исследования сверхъестественных явлений

Примечания

ГОСТ Р 50779.10-2000. «Статистические методы. Вероятность и основы статистики. Термины и определения.». Стр. 26 - protect.gost.ru/v.aspx?control=8&baseC=-1&page=0&month=-1&year=-1&search=&RegNum=1&DocOnPageCount=15&id=130411&pageK=A982F469-855A-4B0B-9443-710141B75665
Valerie J. Easton, John H. McColl. Statistics Glossary: Hypothesis Testing. - www.stats.gla.ac.uk/steps/glossary/hypothesis_testing.html
Данный пример как раз характеризует случай, когда классификация ошибок будет зависеть от назначения системы: если биометрическое сканирование используется для допуска сотрудников (нулевая гипотеза: «проходящий сканирование человек действительно является сотрудником»), то ошибочное отождествление будет ошибкой второго рода, а «неузнавание» — ошибкой первого рода; если же сканирование используется для опознания преступников (нулевая гипотеза: «проходящий сканирование человек не является преступником»), то ошибочное отождествление будет ошибкой первого рода, а «неузнавание» — ошибкой второго рода.
Относительно скрининга новорожденных, последние исследования показали, что количество ошибок первого рода в 12 раз больше, чем количество верных обнаружений (Gambrill, 2006. [1] - www.nlm.nih.gov/medlineplus/news/fullstory_34471.html)
Одним из последствий такого высокого уровня ошибок первого рода в США является то, что за произвольный 10-летний период половина обследуемых американских женщин получают как минимум одну ложноположительную маммограмму. Такие ошибочные маммограммы обходятся дорого, приводя к ежегодным расходам в 100 миллионов долларов на последующее (ненужное) лечение. Кроме того, они вызывают излишнюю тревогу у женщин. В результате высокого уровня подобных ошибок первого рода в США, примерно у 90-95 % женщин, получивших хотя бы раз в жизни положительную маммограмму, на самом деле заболевание отсутствует.
Наиболее низкие уровни этих ошибок наблюдаются в северной Европе, где маммографические плёнки считываются дважды, и для дополнительного тестирования устанавливается повышенное пороговое значение (высокий порог снижает статистическую эффективность теста).
Вероятность того, что выдаваемый тестом результат окажется ошибкой первого рода, может быть вычислена при помощи Теоремы Байеса.
На некоторых сайтах приведены примеры ошибок первого рода, например: Атлантическое Сообщество Паранормальных явлений (The Atlantic Paranormal Society, TAPS) - the-atlantic-paranormal-society.com/images/tapspics/index.html и Морстаунская организация по Исследованию Привидений (Moorestown Ghost Research) - www.moorestownghostresearch.com/FalsePositives.html.

www.wreferat.baza-referat.ru

Смотрите также

..:::Новинки:::..

Windows Commander 5.11 Свежая версия.

Новая версия
IrfanView 3.75 (рус)

Обновление текстового редактора TextEd, уже 1.75a

System mechanic 3.7f
Новая версия

Обновление плагинов для WC, смотрим :-)

Весь Winamp
Посетите новый сайт.

WinRaR 3.00
Релиз уже здесь

PowerDesk 4.0 free
Просто - напросто сильный upgrade проводника.

..:::Счетчики:::..