МИНОБРНАУКИ РОССИИ
Федеральное государственное образовательное учреждение
среднего профессионального образования
«Петровский колледж»
Содержание «метода контрольных групп»
Чтобы инвестиции в повышение квалификации руководителей и специалистов принесли должный эффект, содержание обучения должно быть тесно связано с потребностями
управления. При разработке программ надо учитывать перспективы развития науки и техники,
задачи, стоящие перед предприятием. Один из важнейших факторов, влияющих на содержание
программ повышения квалификации, – данные о результатах оценки персонала, так как оценка
выявляет слабые места работника с точки зрения уровня знаний, квалификации и навыков.
Для оценки эффективности деятельности системы повышения квалификации персонала
можно использовать количество обученных или сумму затрат. Целесообразно определить,
насколько повысился реальный эффект от работы руководителя и специалиста после окончания
обучения, решает ли он такие задачи, которые раньше были ему недоступны, правильно ли
используется персонал, прошедший повышение квалификации, на практической работе,
насколько учебный план соответствует стоящим перед обученными задачам, насколько полезно
обучение для слушателей с точки зрения накопления знаний и навыков, служебной карьеры.
Основными методами оценки могут служить тесты по специально разработанным
схемам; интервью с прошедшими курс повышения квалификации и их руководителями; метод
контрольных групп, при котором тестирование проводится до начала программы и после ее
окончания, и результаты сравниваются с итогами тестирования группы, не проходившей курс
обучения. Метод контрольных групп используется и при оценке различных способов обучения:
в двух или нескольких группах слушателей приблизительно равного исходного уровня;
преподавание ведется по разным программам; сопоставление результатов позволяет выбрать
наиболее эффективную.
На все указанные выше моменты необходимо обращать внимание при оценке
экономической и социальной результативности деятельности управленческого персонала,
прошедшего повышение квалификации.
Учитывая зарубежный опыт управления повышением качества руководителей и
специалистов, а также вышеназванные недостатки и проблемы, выявленные в ходе изучения
рассматриваемого вопроса, предлагается концепция управления системой повышения
квалификации персонала (рис. 1.1).
Определение целей, задач повышения Стратеги предприятия
квалификации
Определение потребностей в повышении
квалификации
Оценка кандидатов
Составление плана обучения и учебной программы
Оценка затрат на обучение персонала
Организация процесса повышения квалификации
Анализ эффективности инвестиций в систему
повышения квалификации кадров
Формирование эффективной системы повышения
квалификации персонала
Рис. 1.1 Концепция управления системой повышения квалификации персонала
Существенным преимуществом этой концепции является то, что одновременно
реализуются два направления: первое связано с оценкой кадрового потенциала и
возможностями его развития; второе – связано непосредственно с системой повышения
квалификации персонала предприятия.
Выводы. Таким образом, используя зарубежный опыт нами предложена концепция
управления системой повышения квалификации персонала.После реализации указанных
направлений концепция предполагает организацию процесса обучения, оценку эффективности
системы повышения квалификации.
Применение на предприятиях предлагаемой концепции управления системой
повышения квалификации кадров позволит сформировать на предприятии более совершенную
систему обучения персонала, оптимизировать затраты на обучение и повысить эффективность
персонального менеджмента.
Метод контрольных групп представляет собой проводимый систе-
матически или периодически на платной основе опрос выборочной
совокупности респондентов (контрольной группы), ориентированный
на исследование спроса на потребительские товары по достаточно
стабильному перечню вопросов.
Достоинством контрольных групп является постоянная регистра-
ция поведения респондента. Поскольку вопросы, как правило, не из-
меняются, то нет необходимости каждый раз задавать их респонден-
ту. Данные контрольной группы более достоверны, чем результаты
разового опроса. В целом метод зарекомендовал себя положительно.
К недостаткам следует отнести высокие расходы и влияние факта
членства в группе на ответы данного респондента как потребителя.
Одна из проблем работы с контрольными группами заключается в
необходимости обеспечения сопоставимости результатов выборочных
обследований в динамике. Для обеспечения сопоставимости требует-
ся такая корректировка выборки, чтобы исключить влияние измене-
ния доходов, семейного положения и других характеристик потреби-
телей. Для сохранения представительности выборки она регулярно
обновляется в результате исключения одних и включения других еди-
ниц наблюдения.
Контрольные группы широко применяются в зарубежной практи-
• ке. Французская исследовательская фирма «Се-
кодип» работает с двумя контрольными группами по 4560 семей.
Консалтинговая фирма «Нильсон» работает с выборкой, которая ох-
ватывает покупателей, делающих покупки в нескольких магазинах
самообслуживания.
Контрольная группа также может состоять и из предприятий роз-
ничной торговли, которые регулярно, например, каждые два месяца
сообщают данные о размере заказов, об объеме и структуре товаро-
оборота, сбыта, товарных запасов. Заказчиками информации, получа-
емой от таких контрольных групп, преимущественно являются про-
изводственные предприятия. Участники контрольных групп также
заинтересованы в полученных результатах, к которым они получают
ограниченный доступ.
Всякое человеческое действие, предпринятое для достижения определенного результата, - это эксперимент, более или менее успешный. Задача науки заключается в том, чтобы установить точные правила экспериментирования и применять их для достижения заданных параметров. Объектом эксперимента для социолога являются люди и социальные общности - часто их реакция на “научное” вмешательство оказывается непредсказуемой, во всяком случае для экспериментатора.
Логика экспериментального метода была разработана английским социологом и моралистом Джоном Стюартом Миллем, жившим в XIX в. Милль установил пять логических схем индуктивного вывода, одна из которых - “метод различия” - являет собой классическую схему эксперимента.
Схема эта довольно проста. Сначала берутся две совокупности (два объекта) и выравниваются по значимым признакам. Иначе говоря, нужно сделать так, чтобы группы практически не различались. Конечно, они не могут не различаться вовсе. Поэтому внимание экспериментатора сосредоточивается на значимых признаках, т. е. на тех, которые могут оказать влияние на результаты эксперимента.
Например, изучая воздействие телепередачи на политические установки зрителей, исследователь должен убедиться, что возраст испытуемых в различных группах варьирует незначительно. Почему возраст? Потому что из предшествующих исследований известно, что возраст влияет на политические установки. Следовательно, этот признак подлежит контролю. Несколько по-иному оценивается, например, численность блондинов, брюнетов или шатенов. Обычно такого рода параметрами при изучении политических установок пренебрегают, почему-то не считая их значимыми. Чем больше параметров учитывает исследователь, тем надежнее эксперимент.
Затем начинается полевой или лабораторный этап эксперимента. Иногда утверждается, что это самый главный этап - собственно эксперимент. Такое суждение опрометчиво. Успех или провал эксперимента зависит прежде всего от того, насколько тщательно проработаны его идеальная схема, план проведения и ожидаемые результаты. Лабораторное (полевое) исследование не должно сталкиваться с “нештатными” ситуациями, т. е. ситуациями, не предусмотренными предварительно разработанным планом. Если это происходит, полевую работу надо немедленно прекратить и вернуться к проектированию исследования. Неудача исследования заключается отнюдь не в отрицательном результате - иногда он имеет большее значение, чем Положительный, - а в получении ничего не означающих данных.
Предположим, что все идет “штатно” и мы находимся на полевом этапе эксперимента. Здесь одна группа объектов подвергается воздействию экспериментальной переменной. Все, кто работает в “опытных” науках, делают примерно одно и то же. Химик подвергает вещество воздействию реактива и затем наблюдает, как оно меняет цвет. Физик нагревает газы с целью продемонстрировать их расширение при нагревании. Агробиолог охлаждает семена и затем фиксирует динамику роста яровых (правда, потом это оказывается ошибкой). Социолог показывает студентам учебный фильм и констатирует усвоение материала.
На этом эксперимент не заканчивается. Чтобы убедиться в том, что данные результаты возникли вследствие воздействия именно экспериментальной переменной, а не какой-либо иной, следует сопоставить параметры экспериментальной группы с параметрами группы, где никаких воздействий не применялось. Различие между этими параметрами и есть результат воздействия экспериментальной переменной. Если различие нулевое или несущественное, мы констатируем отсутствие связи. Если применение экспериментальной переменной значительно изменяет распределение изучаемого признака, имеются основания предполагать причинную связь между ними. Такова общая схема, которая лежит в основании более сложных планов эксперимента.
Классический проект проверки гипотез предполагает работу с двумя объектами: экспериментальным и контрольным. Это не значит, что все экспериментаторы обязаны работать с двумя объектами. Естественные науки XIX в. не знали такого разделения объектов. Впервые экспериментальную и контрольную группы стали выделять в начале XX в.
В социологии и социальной психологии в качестве объектов выбираются группы, идентичные по составу. Экспериментальной группой называется та группа, к которой “применяется” изучаемая независимая переменная; контрольная группа остается вне экспериментального воздействия.
stud24.ru
Для того, чтобы оценить программу, необходимо собрать информацию о результатах её реализации. Наиболее убедительными и наглядными являются результаты проведения реального эксперимента: наблюдатель сразу собственными глазами может опознать произошедшие изменения. Однако в число серьёзных недостатков этого метода входят дороговизна проведения серьёзных полномасштабных экспериментов, а также сложность их проведения, ведь подчас качественное оценивание политических программ требует получения экспериментальных данных о широком круге бенефициаров. Как же провести оценивание программы на практике, когда зачастую в наличии имеется лишь ограниченный массив данных за один период времени? На решение этой задачи и направлены эконометрические методы оценивания.
Эконометрические методы (англ.
econometric methods of evaluation) представляют собой не экспериментальные методы оценивания и заключаются в совместном применении математического, статистического и экономического инструментария к анализу эмпирических данных с целью оценки эффекта программы.Самым очевидным способом оценки изменений, произошедших в ходе реализации программы, являлось бы сравнение параметров двух состояний для каждого бенефициара: до и после проведения программы (например уровень образования индивида до и после проведения государством образовательной программы). Однако никто, чаще всего, не обладает таким массивом информации, так как до начала реализации программы средства на сбор подобных данных, как правило, не выделяются. Использование же эконометрических методов без привлечения значительных средств позволяет «оценить, что было бы, если бы индивид не участвовал в программе, то есть „рассчитать“ условное значение (англ. counterfractual) интересующего нас параметра в отсутствие программы» на основании данных только лишь одного периода.
В число эконометрических методов оценивания входят:
Исходя из названия становится понятно, что оценка программы данным методом осуществляется на основании сравнения среднего значения интересующего нас показателя (уровня занятости, образования, дохода и т. д.) у тех кто участвовал в программе со средним значением этого же показателя в контрольной группе. В контрольную группу, для простоты вычислений, включают всех индивидов, в данной программе не участвовавших. Иными словами, метод сравнения средних акцентирует внимание на разнице средних значений показателей у двух групп индивидов:
d Y = E(Y | D=1) — E(Y | D=0)Где Y1 и Y2 — средние значения показателя у участвовавших (D=1) и не участвовавших (D=0) в программе индивидов. Однако данный метод обладает существенными недостатками и подчас дает противоречивые оценки. В той или иной ситуации разница средних значений может получиться отрицательной: среднее значение интересующего нас показателя может быть больше при отсутствии программы, — однако это совсем не значит, что программа неэффективна. Включая в контрольную группу всех «остальных» людей, мы тем самым сравниваем «несопоставимых» индивидов: ведь программа изначально нацелена на людей с заниженным значением показателя (например, программа повышения уровня дохода населения направлена на людей, уровень дохода которых ниже среднего по стране), а контрольная группа может включать в себя миллионеров и очень состоятельных людей.
Метод оценивания заключается в построении двух уравнений регрессии средних значений интересующего нас показателя для двух сравниваемых групп индивидов в зависимости от контрольных показателей методом наименьших квадратов. Общий принцип данного метода схож с первым: мы по-прежнему сравниваем средние значения интересующего нас показателя. Однако теперь вместо двух средних значений мы можем составить уравнение регрессии для каждой группы:
Yi = βxi + sDi + uiГде Yi — среднее значение интересующего нас показателя, Di — так называемая «дамми» — переменная участия в программе (D=0, 1), а s — показатель эффекта от проведения программы. Однако есть в данном подходе и существенные отличия: если раньше мы делили общество на бенефициаров и тех, кто в программе не участвовал, не учитывая их различий не по одному из критериев, то в рамках метода построения регрессии мы вводим некоторый контроль ряда переменных (xi), решая тем самым проблему «несопоставимости» сравниваемых индивидов. Если в рамках первого метода нам приходилось сравнивать индивидов, живущих за чертой бедности, и миллионеров по уровню образования, то сейчас мы можем контролировать переменную xi — «уровень дохода» и сравнить уровень образования участвовавших и не участвовавших в программе индивидов, изначально обладающих одинаковым уровнем дохода (живущих в одном регионе и т. д.).
Благодаря этому методу, таким образом, мы можем получить два уравнения регрессии — то есть две линейные зависимости интересующего нас показателя от контрольных характеристик, на основании чего можем делать соответствующие оценивающие выводы. В простейшем виде это может выглядеть так: для простоты рассмотрим все тот же пример реализации образовательной программы. Для получения оценки её эффективности необходимо сравнить средний уровень образования после проведения программы у тех, кто в ней участвовал (Y (D1), и тех, кого данная программа не касалась (Y (D0). Однако теперь мы производим сравнение только между индивидами, обладающими одним уровнем дохода (Xi) тем самым решая проблему несопоставимости индивидов: сравнивать бенефициара с индивидов больше не придется.
Пример задачи на сравнение средних: Ниже представлены объемы спроса на некое изделие за прошедшие 24 месяца. Необходимо с помощью методики сравнения среднего дать прогноз объема спроса на следующий месяц.
1 | 46 | 13 | 54 |
2 | 56 | 14 | 42 |
3 | 54 | 15 | 64 |
4 | 43 | 16 | 60 |
5 | 57 | 17 | 70 |
6 | 56 | 18 | 66 |
7 | 67 | 19 | 57 |
8 | 62 | 20 | 55 |
9 | 50 | 21 | 52 |
10 | 56 | 22 | 62 |
11 | 47 | 23 | 70 |
12 | 56 | 24 | 72 |
Метод подбора контрольной группы имитирует естественный эксперимент и по своей идее наиболее близок к сопоставлению двух состояний одного индивида: до и после программы. Метод заключается в сравнении участвовавшего в программе индивида (D=1) и в ней не участвовавшего, но фактически сопоставимого по наблюдаемым характеристикам (Х) с первым:
d Y = E (Y1 |D = 1, X) — E (Y0 |D = 1, X)Суть метода заключается в сравнении двух состояний будто бы одного и того же индивида. Значение интересующего нас показателя после проведения программы мы можем оценить по состоянию участвовавшего в программе индивида (D=1), а значение показателя до проведения программы — по состоянию не участвовавшего в программе индивида, очень схожего по многим наблюдаемым характеристикам с первым. Два индивида должны быть настолько похожи между собой, что второй также вполне мог бы участвовать в программе — поэтому D=1. Поиск таких схожих индивидов и представляет собой подбор контрольной группы. Таким образом, данный метод решает проблему формального отбора, с которой сталкивается предыдущий метод: мы фактически сравнивали тех индивидов, которые в ней участвовали, и тех, кого по разным причинам не взяли — и получали смещенные оценки. Кроме того, в рамках данного метода не фиксируется форма функциональной зависимости Y от X. Однако, порой бывает довольно сложно найти максимально схожих по многим характеристикам людей, что существенно затрудняет оценивание данным методом.
Данный метод является вариацией вышеизложенного метода подбора контрольной группы с тем лишь отклонением, что позволяет значительно экономить время и сокращает число критериев, по которым ведется отбор участников контрольной группы. Теперь вместо подсчета многочисленных характеристик для того, чтобы найти схожих по наблюдаемым признакам индивидов, достаточно подсчитать индекс, характеризующий вероятность участия этого индивида в программе. Фактически это одно и то же: раз два человека с одинаковой вероятностью попали бы в данную программу — значит они непременно схожи по многим наблюдаемым характеристикам, а это в свою очередь значит, что их можно сравнивать между собой не боясь проблемы несопоставимости. Таким образом, два «схожих» индивида, независимо от того, участвовали они фактически в программе или нет, имеют близкие значения данных вероятностей, в связи с чем оценивание сводится к сравнению их значений интересующих показателей.
Метод построения регрессии с переключением режимов заключается в составлении трех уравнений для участвовавших и неучаствовавших в программе индивидов: первое уравнение — уравнение, определяющее вероятность участия в программе:
I* = β(Y0i — Y1i) + γZi + εi I*>0 — участник I*<0 — неучастникДва вторых уравнения показывают функциональную зависимость интересующего нас показателя Y от наблюдаемых контрольных характеристик X с учётов воздействия на Y также и ненаблюдаемых характеристик. Контрольной группой, исходя из этого, являются все те же формально сопоставимые по наблюдаемым характеристикам (Х) с адресатами, не участвовавшие в программе индивиды с учётом ненаблюдаемых характеристик, влияющих на принятие решения об участии (или неучастии) в программе.
Явным преимуществом данного метода является то, что он вбирает в себя ключевые идеи всех вышеизложенных методов: сравнивает средние значения интересующих нас показателей участвовавших и неучаствовавших в программе индивидов, сопоставимых однако по многим наблюдаемым критериям, — но и преодолевает главный их недостаток — обращает внимание на ненаблюдаемые характеристики индивидов.
Доп. статья — Оценка гос политики и программ на рынке труда
Рынок труда можно поделить на два сектора: бюджетный и небюджетный. Представим себе, что планируется проведение программы, направленной на повышение зарплат бюджетников. Но главный вопрос: на сколько нужно повышать заработные платы работников бюджетного сектора, иными словами, на сколько вознаграждение бюджетников уступает вознаграждению в частном секторе?
В рамках метода сравнения средних необходимо найти средние значения интересующего нас показателя (уровня заработной платы) в группе, участвующей в программе (работники бюджетного сектора) и в контрольной группе (работников небюджетного сектора). Фактически, мы рассматриваем принадлежность к бюджетному сектору «как воздействие на группу индивидов, в результате которого их зарплаты отклоняются от тех, которыми могли бы быть в не бюджетном секторе». В результате сравнения средних выясняется, что средний уровень заработной платы не бюджетного сектора превышает средний уровень оплаты труда бюджетников на 19 %.
Однако, просто сравнив средние уровни оплаты труда по секторам, мы совершенно не учли многочисленных различий, им свойственных. В их числе разное соотношение женщин и мужчин, различия в уровне образования, по стажу и др. В случае же с использованием метода МНК-регрессия (англ. OLS) контрольной группой являются формально сопоставимые по наблюдаемым характеристикам работники не бюджетного сектора. Таким образом, если принять во внимание, например, пол и продолжительность рабочей недели, и построить два уравнения регрессии, характеризующих зависимость среднего уровня заработной платы от пола, то общий разрыв между заработными платами двух секторов сократится до 16 %.
Метод подбора контрольной группы (англ. matching) на практике обнаруживает свой главный недостаток: крайне сложно найти максимально соответствующих по множеству наблюдаемых характеристик работников частного сектора — подчас оказывается, что это все невозможно просчитать. На практике оказалось, что неучёт даже одной характеристики — региона приводит к существенным различиям. Без учёта регионов разница между уровнями оплаты труда составляет 21 %, с учётом регионов — 23 %.
Метод подбора контрольной группы по индексу соответствия (англ. propensity score matching), являющийся в данном случае более уместным, экономит время и позволяет получить более точное значение, учитывая, однако же, тот же самый набор характеристик. Согласно этому методу, средние уровни заработных плат различаются по секторам примерно на 21-22 %.
Учет ненаблюдаемых характеристик в рамках метода регрессии с переключением режимов (англ. switching regression) привел к сокращению разницы между оплатой труда в двух секторах до 17 %. Однако очень сложно найти способ выявления ненаблюдаемых характеристик, не влияющих на уровень заработной платы того или иного сотрудника, но которые бы воздействовали на показатель принятия решения о выборе сектора.
Таким образом, мы можем ясно видеть, что все без исключения методы дают схожие значения, которые тем точнее, чем большее число наблюдаемых и ненаблюдаемых характеристик мы берем в учёт.
dic.academic.ru
Во многих исследованиях случай-контроль авторы сами формируют группы сравнения, вместо того чтобы, как это бывает в когортных и одномоментных исследованиях, позволить это сделать природе. Этот элемент искусственности при формировании групп составляет неизбежное зло, поскольку достоверность исследований случай-контроль зависит от сопоставимости основной и контрольной групп.
Основная и контрольная группы сопоставимы, если контрольную группу можно рассматривать как основную при условии развития у ее участников изучаемого состояния. Другими словами, чтобы быть сопоставимыми, члены основной и контрольной групп должны принадлежать к одной и той же общей популяции. Второе, более спорное положение: чтобы быть сопоставимыми, пациенты основной и контрольной групп должны иметь равную возможность подвергаться воздействию изучаемого фактора [10]. Например, вероятность применения нестероидных противовоспалительных препаратов (см. ранее), по-видимому, выше у тех, кто регулярно лечится и, очевидно, еще больше у больных с сочетанием симптомов. Обязательно ли пациенты в обеих группах, основной и контрольной, должны иметь одинаковые симптомы и получать одинаковую медицинскую помощь? Мнения различны, но следует учитывать, что оценка риска будет невозможна, если пациенты из разных групп будут лечиться у врачей, придерживающихся разной тактики назначения нестероидных противовоспалительных препаратов.
Таким образом, для обеспечения сопоставимости основной и контрольной групп требуется учитывать все обстоятельства, при которых больной подвергался воздействию изучаемого фактора.
Формирование основной группыРаньше основные группы в исследованиях случай-контроль, как правило, набирались из больных, наблюдавшихся в клиниках или других лечебных учреждениях. Создание регистров заболеваний, таких как Система наблюдения за онкологическими больными Национального института рака США, и компьютерных баз диагностических данных сделали реальным отбор представительной выборки из всех случаев, возникших в определенной популяции.
Случаи, выделенные из общей популяции, должны быть более типичными и включать более широкий спектр проявлений заболевания.
Больные, которые отбираются в основную группу для исследования случай-контроль, должны по возможности иметь недавно возникшее заболевание (для оценки заболеваемости), а не уже давно существующее (для оценки распространенности). Причины этого обсуждались в главе 4. Распространенность заболевания на некоторый момент времени является функцией двух переменных - заболеваемости и продолжительности болезни. Продолжительность в свою очередь определяется скоростью, с которой пациенты лишаются статуса больного (в связи с выздоровлением или смертью) или сохраняют его из-за медленного течения заболевания либо паллиативного характера лечения. Вследствие этих причин, факторы риска для распространенности заболевания могут одновременно быть факторами риска как для заболеваемости, так и для продолжительности болезни или для того и другого вместе; их относительные вклады невозможно различить. Воздействие, приводящее к развитию смертельной формы заболевания уменьшает его распространенность и приводит к снижению относительного риска, оцениваемого на основе распространенности.
Если отношения шансов, полученные для болезней с малой и большой продолжительностью, одинаковы, то читатель может быть хотя бы отчасти уверен, что результаты исследования случай-контроль не подверглись влиянию систематической ошибки вследствие отбора.
Формирование контрольной группыГлавный источник систематических ошибок в исследованиях случай-контроль в том, что контрольная группа представляет собой не естественно сформировавшуюся группу, а специально создается исследователем. Какой контроль считается сопоставимым с основной группой?
Существует несколько способов правильного формирования контрольной группы. Лучший способ минимизировать связанную с отбором систематическую ошибку - формировать обе группы, основную и контрольную, из одной и той же популяции. Если основная группа охватывает все случаи или представляет собой несмещенную выборку из всех случаев, возникающих в популяции (накапливаемых в когортном исследовании или выявленных в одномоментном исследовании), то группа контроля должна представлять собой случайную выборку из всех других лиц той же популяции. Такая тактика называется популяционным (population-based), или гнездовым (nested) исследованием случай-контроль. Контрольная группа должна формироваться по тем же критериям включения/исключения, что и основная группа, и должна быть отобрана из популяции или когорты примерно в то же время, в которое отбирается экспериментальная группа.
Пример. Предупреждает ли регулярная интенсивная физическая активность риск остановки сердца у лиц без явного заболевания сердечно-сосудистой системы? Наличие информационной системы неотложной медицинской помощи облегчило выполнение популяционного исследования случай-контроль для ответа на этот вопрос [11]. Больные были отобраны из 1250 жителей Сиэтла и пригородной зоны графства Кинг, штат Вашингтон, США, которые в течение определенного периода времени перенесли вне стационара остановку сердца. Данные собирались из отчетов персонала скорой помощи. Контрольная группа была сформирована по случайным выбранным телефонным номерам в той же местности (большинство жителей имели домашние телефоны). Обе группы, основная и контрольная, должны были удовлетворять единым критериям включения: возраст 25-75 лет; отсутствие клинически распознаваемого заболевания сердца; отсутствие предшествующего заболевания, ограничивающего физическую активность; наличие супруга/супруги, которые могли сообщить информацию о привычной физической нагрузке, т.е. об изучаемом воздействии. Участники контрольной группы соответствовали участникам основной группы по возрасту, полу, семейному положению и месту жительства (город или пригород). Супруги участников обеих групп опрашивались о способе проведения досуга. Критерии включения обеспечивали принадлежность участников обеих групп к одной и той же популяции и равную степень физической активности.
Результаты, основанные на изучении 163 лиц, включенных в основную и контрольную группы, подтвердили находки предшествующих исследований. Риск остановки сердца у лиц с интенсивной физической активностью во время досуга оказался на 65-75% ниже, чем у лиц, ведущих малоподвижный образ жизни.
Хотя отбор основной и контрольной групп из определенной популяции или когорты предпочтителен, часто более реальным оказывается отбор обеих групп в клиниках или других медицинских учреждениях. Однако такой путь опаснее, поскольку контингент больных в лечебных учреждениях, как правило, представляет собой смещенную выборку из популяции, на которую должны распространяться результаты исследования.
Второй метод формирования сопоставимой контрольной группы включает в себя подходы, иллюстрированные примерами в этой главе и изложенные в главе 6: наложение ограничений, подбор пар, стратификация и стандартизация. Наиболее сложна процедура подбора пар, которая обсуждается далее.
Метод подбора пар при формировании основной и контрольной групп заключается в том, что каждому испытуемому, отнесенному к основной группе, соответствует один или несколько испытуемых с такими же характеристиками в контрольной группе. Пары обычно подбираются по возрасту, полу и месту жительства, так как эти характеристики часто связаны с заболеванием. Однако если известны другие важные факторы, то при подборе пар не следует ограничиваться демографическими данными. Подбор пар увеличивает полезную информацию, поскольку уменьшает различия между основной и контрольной группами по другим (помимо изучаемого) факторам, влияющим на развитие заболевания. Это повышает чувствительность метода для выявления причинно-следственных связей. Но процедура подбора пар сопряжена с риском. Если исследователь подбирает пару по фактору, связанному с изучаемым воздействием, то повышается шанс, что участники такой пары будут иметь одинаковый анамнез в отношении этого воздействия. Например, если пары подбирали по наличию симптомов артрита, по поводу которого обычно назначают нестероидные противовоспалительные препараты, то возрастает вероятность, что такие пары будут иметь одинаковый анамнез в отношении применения этих лекарственных средств. Данный процесс, называемый переуравновегиивани-ем (overmatching), вызывает смещение отношения шансов по направлению к единице и ослабляет способность исследования выявлять статистически значимое увеличение или уменьшение отношения шансов.
Третий подход состоит в формировании нескольких контрольных групп. Вследствие трудностей подбора истинно сопоставимых контрольных групп, при использовании одной контрольной группы может возникнуть систематическая ошибка при оценке отношения шансов. Для того чтобы этого не произошло, можно отобрать несколько контрольных групп из различных источников1. При отборе основной группы в клинике имеется возможность сформировать одну контрольную группу из других больных той же клиники, а вторую - из лиц, живущих по соседству с пациентами, включенными в основную группу. Если при использовании разных контрольных групп получатся одинаковые отношения шансов, это свидетельствует об отсутствии систематической ошибки, так как маловероятно, чтобы смещение в одинаковом направлении и в одинаковой степени повлияло на результаты, полученные с участием отличающихся друг от друга контрольных групп. Если же оценки относительных рисков окажутся разными, то это признак того, что при подборе одной или нескольких групп не была учтена систематическая ошибка; при этом существует возможность разобраться, в чем она состояла.
Пример. В исследовании случай-контроль, проводившемся для выявления возможной связи между приемом эстрогенов и развитием рака эндометрия, основная группа набиралась в пределах одной университетской клиники. Были созданы две контрольные группы: одна - среди гинекологических больных той же клиники, вторая -из случайной выборки женщин, живущих в районе, обслуживаемом клиникой.
Сопутствующие заболевания, например артериальная гипертензия, сахарный диабет и желчнокаменная болезнь, встречались намного чаще в основной группе и в больничной контрольной группе, что отражает, очевидно, поводы для госпитализации. Несмотря на эти различия, в обеих контрольных группах длительный прием эстрогенов отмечался гораздо реже, чем в основной группе, и для них были получены очень близкие отношения шансов (4,1 и 3,6).
Авторы [12] заключили, что такое постоянство результатов при двух совершенно разных группах сравнения свидетельствует об отсутствии систематической ошибки и о достаточной точности результатов.
Возможные варианты подбора основной и контрольной групп обобщены на рис. 10.4. Если вся основная группа набрана в определенной популяции (или в представительной выборке из всех случаев), то лица контрольной группы должны быть набраны из этой же популяции. Такова оптимальная ситуация. Если основная группа является смещенной выборкой из всех случаев, как это и бывает для большинства больничных выборок, то контрольная группа должна формироваться с таким же смещением.
Оценка воздействияДаже если удалось избежать систематической ошибки при создании основной и контрольной групп, перед исследователем встает задача оценки достоверности воздействия после того, как заболевание или исход уже произошли. Исследования случай-контроль подвержены систематическим ошибкам при оценке достоверности воздействия. Это связано с тем, что воздействие оценивается после начала изучаемого заболевания или возникновения исхода. Различают три вида таких систематических ошибок:
1. Влияние исхода на воздействие.
2. Влияние исхода на воспоминания о воздействии.
3. Влияние исхода на оценку или регистрацию воздействия.
Рис. 10.4. Две тактики создания основной и контрольной групп из общей популяции, несмещенные выборки и выборки с одинаковым смещением
Систематическая ошибка первого вида особенно важна в ситуации, когда в качестве воздействия изучается лечение, поскольку решение о его назначении может быть продиктовано ранними проявлениями болезни. Это систематическая ошибка, вызванная наличием показаний к лечению. Обратимся к примеру. Исследование случай-контроль было проведено для того чтобы установить, предупреждает ли прием бета-блокаторов развитие инфаркта миокарда у пациентов, лечившихся по поводу артериальной гипертензии [13]. Поскольку стенокардия - главное показание к назначению бета-блокаторов, авторы исключили всех пациентов с указаниями на стенокардию в анамнезе и с другими проявлениями ИБС. Результаты показали, что в группе больных с артериальной гипертензией, леченных бета-блокаторами, риск развития несмертельного инфаркта миокарда значительно снижался даже после исключения всех пациентов со стенокардией или другими проявлениями ИБС.
Систематическая ошибка второго вида возникает из-за того, что воспоминания больных о воздействии изучаемого фактора отличаются от воспоминаний лиц контрольной группы. При всеобщей доступности сведений о возможном риске в связи с экологическими факторами или применением лекарств вполне естественно, что заболевшие люди лучше вспоминают факты, предшествовавшие развитию болезни, чем лица без соответствующего заболевания. Эту ошибку следует учитывать, когда оценка воздействия основана на сборе анамнеза.
Существуют две меры защиты от такой систематической ошибки. Во-первых, нужно иметь альтернативный источник той же информации - документы (история болезни или другие письменные данные) или результаты опроса родственников либо других осведомленных лиц. Во-вторых, цель исследования должна быть скрыта от обследуемых лиц. Разумеется, неэтично вообще не информировать их об общей сути исследования. Однако подробный рассказ о конкретных гипотезах может исказить получаемые результаты и тем самым привести к другому нарушению этики -вовлечению людей в бесполезный исследовательский проект.
Третья проблема - влияние исхода на оценку или регистрацию воздействия должна быть знакома всем, кто изучал приемы диагностики. Если врач, который обследует поступившего в стационар пациента с заболеванием почек, знает о возможной связи между применением нестероидных противовоспалительных препаратов и развитием почечной недостаточности, то можно ожидать, что он специально расспросит пациента об использовании анальгетиков и подробно зафиксирует эту информацию. Исследователь, знающий цель исследования и исходы у обследуемых лиц, может проявить предвзятость при сборе анамнеза. Меры предупреждения этого вида систематической ошибки те же, что и упомянутые выше: множественные источники информации и слепой метод сбора данных, т.е. тот, кто проводит сбор данных, не должен быть осведомлен о гипотезе, проверяемой в исследовании.
Научные стандарты для исследований случай - контрольДля того чтобы судить о достоверности исследования случай-контроль, предлагается сначала рассмотреть, каким образом тот же вопрос решался бы в рандомизированном контролируемом испытании [14]. Конечно, в действительности выполнить исследование таким способом нельзя, но рандомизированное контролируемое испытание послужит научным стандартом при обсуждении последствий компромиссов, присущих исследованию случай-контроль.
В клиническое испытание обычно включают только тех больных, которые выражают согласие на участие в исследовании. Аналогично, для исследования случай-контроль нужно подбирать тех лиц, которые в принципе могли подвергаться воздействию. Например, в исследование нестероидных противовоспалительных препаратов в качестве возможной причины развития почечной недостаточности следует включать лиц обоего пола, не имеющих противопоказаний к назначению этих препаратов (таких как язвенная болезнь, например). Так же как в клиническом испытании, все лица из обеих групп должны быть подвергнуты одинаковому обследованию для выявления болезни почек. Эти и другие параллели между клиническими испытаниями и исследованиями случай-контроль могут быть использованы, чтобы разобраться, какие ошибки могли произойти, насколько они серьезны и как их устранить.
Для установления критериев достоверности исследований случай-контроль предпринимались определенные усилия [15]. Однако, чтобы применять эти критерии, требуется глубокое понимание множества факторов, потенциально влияющих на воздействие и заболевание, а также на выявление того и другого в реальных клинических ситуациях.
Исследования случай - контроль при анализе системы здравоохраненияИсследования случай-контроль используются прежде всего для проверки гипотез об этиологии заболевания. В последнее время эта методика стала применяться для изучения вопросов, связанных с обеспечением и качеством медицинской помощи.
Пример. Можно ли предупредить детский церебральный паралич и внутриутробную смерть плода? Британские авторы [16] в исследовании случай-контроль сравнивали данные об антенатальном лечении 141 младенца с церебральным параличом и 62 младенцев, умерших в интранатальном или неонатальном периоде (основная группа). На каждый случай болезни или смерти были подобраны два здоровых младенца, родившихся в то же время и в том же месте (контрольная группа). Недостаточные меры, направленные на коррекцию патологического состояния плода, отмечены чаще в основной, чем в контрольной группе, но этим удавалось объяснить лишь очень небольшой процент случаев детского церебрального паралича.
Поскольку наиболее серьезные последствия плохого качества медицинской помощи относительно редки, исследование случай-контроль можно рекомендовать как эффективную тактику для изучения связи между отклонением от официальных рекомендаций и неблагоприятными последствиями этого.
www.kievoncology.com