Контрольная работа по методам оптимальных решений. Вариант 3
Краткое описание
Вариант № 3
Методы оптимальных решений:
6.3. Дана задача линейного программирования L (Х) = -Х1 + Х2 → при ограничениях:
— Х1 + Х2 ≤ 2
— 2Х1 — 3Х2 ≤ -6
Х1 — 3х2 ≤ 0
Х1 ≤ 4
Х1;Х2 ≥ 0
Графическим методом найти оптимальные решения при стремлении целевой функции к максимальному и минимальному значениям.
6.6. Составить математическую модель и решить задачу симплексным методом.
В производстве пользующихся спросом двух изделий, А и В, принимают участие 3 цеха фирмы. На изготовление одного изделия А 1-й цех затрачивает a1 ч, 2-й цех — a2 ч, 3-й цех — а3 ч. На изготовление одного изделия В 1-й цех затрачивает d1 ч, 2-й цех — d
От реализации одного изделия А фирма получает доход c1 р., изделия В — c2 р.
Определить максимальный доход от реализации всех изделий А и В.
6.7. Дана исходная задача при ограничениях:
L (Х) = Х1 + Х2 → maх при ограничениях:
7х1 + 6х2 ≤ 42
— 2х1 + Х2 ≤ 4
3х1 — 2х2 ≤ 0
— Х
Х1; Х2 ≥ 0
Составить математическую модель симметричной двойственной задачи. По решению двойственной или исходной задачи найти решение другой с использованием основных теорем двойственности.
6.11. Составить математическую модель транспортной задачи и решить ее.
Фирма имеет три магазина розничной торговли, расположенных в разных районах города (А, В, С). Поставки продукции в эти магазины осуществляются с двух складов D и Е, площади которых вмещают 30 и 25 т продукции соответственно. В связи с возросшим покупательским спросом фирма планирует расширить площади магазинов, поэтому их потребности в продукции с торговых складов составят 20, 35 и 15 т в день. Чтобы удовлетворить спрос на продукцию, предполагается строительство третьего склада, площади которого позволят хранить в нем 15 т продукции ежедневно. Руководство фирмы рассматривает два варианта его размещения. В таблице даны транспортные издержки, соответствующие перевозке продукции с двух существующих складов, и два варианта размещения нового склада.
Оценить две транспортные модели и принять решение, какой вариант размещения нового склада выгоднее. Предполагается, что остальные издержки сохраняют существующие значения.
Методы и модели в экономике.
8.2.
Для модернизации предприятий совет директоров инвестирует средства в объеме 250 млн р. с дискретностью 50 млн р. Прирост выпуска продукции зависит от выделенной суммы, его значения представлены предприятиями и содержатся в таблице.
Найти распределение инвестиций между предприятиями, обеспечивающее фирме максимальный прирост выпуска продукции, причем на одно предприятие можно осуществить только одну инвестицию.
8.3. В трех районах города предприниматель планирует строительство пользующихся спросом одинаковых по площади мини-магазинов «Продукты». Известны места, в которых их можно построить. Подсчитаны затраты на их строительство и эксплуатацию.
Необходимо так разместить мини — магазины, чтобы затраты на их строительство и эксплуатацию были минимальные.
Таблица
Х |
1 |
2 |
3 |
4 |
g1(х)
g 2 (х)
g3(х) |
22
20
23 |
35
37
36 |
47
46
50 |
61
58
59 |
9.3. Составить сетевой график выполнения работ и рассчитать временные параметры по данным, представленным в таблице.
Таблица
Содержание работы |
Обозначение |
Предыдущая работа |
Продолжительность, дни. |
Исходные данные на изделие |
|
36 | |
Заказ комплектующих деталей |
8 |
||
Выпуск документации |
18 |
||
Изготовление деталей |
32 |
||
Поставка комплектующих деталей |
21 |
||
Сборка изделия |
, |
10 |
|
Выпуск документации на испытание |
9 |
||
Испытание и приемка изделия |
, |
13 |
1) Определить оптимальную стратегию фирмы в продаже товаров на ярмарке.
2) Если существует риск (вероятность реализации плана П1 — b% = 30, П2 — с% = 45, П3 — d% = 25), то какую стратегию фирме следует считать оптимальной?
Таблица
|
Величина дохода, ден. ед. |
||
|
Д1 |
Д2 |
Д3 |
П1 |
3 |
4 |
2 |
П2 |
1 |
|
4 |
П3 |
5 |
3 |
1 |
11.2. Приходная касса городского района с временем работы А = 10 часов в день проводит прием от населения коммунальных услуг и различных платежей в среднем от В = 300 человек в день.
В приходной кассе работают С = 3 оператора-кассира. Средняя продолжительность обслуживания одного клиента составляет
Определить характеристики работы приходной кассы как объекта СМО.
Контрольная работа по методам оптимальных решений. Вариант 3
Контрольная работа по методам оптимальных решений. Вариант 5
Контрольная работа по методам оптимальных решений. Вариант 6
Контрольная работа по методам оптимальных решений. Вариант 7
Контрольная работа по методам оптимальных решений. Вариант-8.
Контрольная работа по методам оптимальных решений. Вариант 10
Контрольная работа по методам оптимальных решений. Вариант 7
Краткое описание
Вариант № 7
Методы оптимальных решений:
6.3. Дана задача линейного программирования L (Х) = Х1 + Х2→ maх (min) при ограничениях:
7 х1 + 6х2 ≤ 42
— 2х1 + Х2 ≤ 4
3х1— 2х2 ≤ 0
— Х2 ≤ -2
Х1;Х2 ≥ 0
Графическим методом найти оптимальные решения при стремлении целевой функции к максимальному и минимальному значениям.
6.6. Составить математическую модель и решить задачу симплексным методом.
В производстве пользующихся спросом двух изделий, А и В, принимают участие 3 цеха фирмы. На изготовление одного изделия А 1-й цех затрачивает a1 ч, 2-й цех — a2 ч, 3-й цех — а3 ч. На изготовление одного изделия В 1-й цех затрачивает d1 ч, 2-й цех — d2 ч, 3-й цех — d3 ч. На производство обоих изделий 1-й цех может затратить не более b1 ч, 2-й цех — не более b2 ч, 3-й цех — не более b3 ч.
От реализации одного изделия А фирма получает доход c1 р., изделия В — c2 р.
Определить максимальный доход от реализации всех изделий А и В.
6.7. Дана исходная задача при ограничениях:
7х1 + 8х2 ≤ 56
— 2х + 3х2 ≤ 6
— 2х1 + Х2 ≤ 0
Х1 ≤ 6
Х1;Х2 ≥ 0
Составить математическую модель симметричной двойственной задачи. По решению двойственной или исходной задачи найти решение другой с использованием основных теорем двойственности.
6.11. Составить математическую модель транспортной задачи и решить ее.
Фирма имеет три магазина розничной торговли, расположенных в разных районах города (А, В, С). Поставки продукции в эти магазины осуществляются с двух складов D и Е, площади которых вмещают 30 и 25 т продукции соответственно. В связи с возросшим покупательским спросом фирма планирует расширить площади магазинов, поэтому их потребности в продукции с торговых складов составят 20, 35 и 15 т в день. Чтобы удовлетворить спрос на продукцию, предполагается строительство третьего склада, площади которого позволят хранить в нем 15 т продукции ежедневно. Руководство фирмы рассматривает два варианта его размещения. В таблице даны транспортные издержки, соответствующие перевозке продукции с двух существующих складов, и два варианта размещения нового склада.
Оценить две транспортные модели и принять решение, ка¬кой вариант размещения нового склада выгоднее. Предполагается, что остальные издержки сохраняют существующие значения.
Методы и модели в экономике:
8.2. Совет директоров фирмы рассматривает предложения по наращиванию производственных мощностей для увеличения выпуска однородной продукции на четырех предприятиях, при¬надлежащих фирме.
Для модернизации предприятий совет директоров инвестирует средства в объеме 250 млн р. с дискретностью 50 млн р. Прирост выпуска продукции зависит от выделенной суммы, его значения представлены предприятиями и содержатся в таблице.
Найти распределение инвестиций между предприятиями, обеспечивающее фирме максимальный прирост выпуска продукции, причем на одно предприятие можно осуществить только одну инвестицию.
8.3. В трех районах города предприниматель планирует строительство пользующихся спросом одинаковых по площади ми¬ни-магазинов «Продукты». Известны места, в которых их можно построить. Подсчитаны затраты на их строительство и эксплуатацию.
Необходимо так разместить мини-магазины, чтобы затраты на их строительство и эксплуатацию были минимальные.
Таблица
Х |
1 |
2 |
3 |
4 |
g1(х)
g 2 (х)
g3(х) |
18
17
20 |
29
30
32 |
42
41
44 |
57
55
59 |
9.3. Составить сетевой график выполнения работ и рассчитать временные параметры по данным, представленным в таблице.
Таблица
Содержание работы |
Обозначение |
Предыдущая работа |
Продолжительность, дни. |
Исходные данные на изделие |
|
15 |
|
Заказ комплектующих деталей |
10 |
||
Выпуск документации |
12 |
||
Изготовление деталей |
30 |
||
Поставка комплектующих деталей |
26 |
||
Сборка изделия |
, |
17 |
|
Выпуск документации на испытание |
19 |
||
Испытание и приемка изделия |
, |
18 |
10.2. Торговая фирма разработала несколько вариантов плана продаж товаров на предстоящей ярмарке с учетом конъюнктуры рынка и спроса покупателей. Получающиеся от их возможных сочетаний показатели дохода представлены в таблице.
1) Определить оптимальную стратегию фирмы в продаже товаров на ярмарке.
2) Если существует риск (вероятность реализации плана П1 — b% = 30, П2 — с% = 35, П3 — d% = 35), то какую стратегию фирме следует считать оптимальной?
Таблица
План продаж |
Величина дохода, ден. ед. |
||
|
Д1 |
Д2 |
Д3 |
П1 |
2 |
3 |
3 |
П2 |
4 |
2 |
1 |
П3 |
3 |
2 |
4 |
11.2. Приходная касса городского района с временем работы А = 8 часов в день проводит прием от населения коммунальных услуг и различных платежей в среднем от В = 240 человек в день.
В приходной кассе работают С = 3 оператора-кассира. Средняя продолжительность обслуживания одного клиента составляет D = 5 мин.
Определить характеристики работы приходной кассы как объекта СМО.
Контрольная работа по методам оптимальных решений. Вариант 3
Контрольная работа по методам оптимальных решений. Вариант 5
Контрольная работа по методам оптимальных решений. Вариант 6
Контрольная работа по методам оптимальных решений. Вариант 7
Контрольная работа по методам оптимальных решений. Вариант-8.
Контрольная работа по методам оптимальных решений. Вариант 10
Контрольная работа по «Методы оптимальных решений»
КОНТРОЛЬНАЯ РАБОТА
В а р и а н т 2
Задание 1. Пусть экономическая ситуация описывается как задача линейного программирования вида:
F = 3×1 + x2 ® max
2×1 + x2 ≤ 10 [pic 1]
1 ≤ x1 ≤ 4
x2 ≥ 1
x1 ≥ 0
Постройте графическую модель задачи и найдите ее решение графическим методом.
Р е ш е н и е :
Приведём задачу к стандартному виду ЗЛП :
F = 3×1 + x2 → max [pic 2]
2×1 + x2 ≤ 10
x1 ≥ 1
x1 ≤ 4
x2 ≥ 1.
Построим область допустимых решений (ОДP) Для этого построим прямые
( заменяем знаки неравенства на «=» )
2×1 + х2 = 10 (1)
х1 = 1 (2)
х1 = 4 (3)
х2 = 1 (4)
( прямую (1) cтроим по точкам (1; 8) и (5; 0) )
[pic 3]
Получили ОДР – трапецию ABCD. Направление максимизации целевой функкции (ЦФ) F = 3х1 + х2 задаёт вектор-градиент ( розовая стрелка ), его координаты – коэффициенты ЦФ, (3; 1) . Линии уровня ЦФ (краcный пунктир) – это прямые F = C, т.е. 3х1 + х2 = С, они перпендикулярны градиенту. Проводим произвольно линию уровня через начало координат ( при С = 0 короткий пунктир) или через конец вектора (3; 1) . При решении задачи на максимум нужно двигать эту прямую по градиенту до последнего касания этой прямой с ОДР в точке D.
[pic 4]
Так как точка D получена в результате пересечения прямых (1) и (3), то ее
координаты удовлетворяют уравнениям этих прямых:[pic 5]
2×1+ x2 = 10
x1 = 4
откуда получим: x1 = 4, x2 = 2 или Х* = (4; 2).
Тогда максимальное значение целевой функции:
max F = F(X*) = 3*4 + 1*2 = 14
Ответ : max F = F(4; 2 ) = 14
Задание 2
Для производства 4-х видов продукции используется 3 вида сырья. Нормы расхода сырья (кг), его запасы (кг), прибыль от реализации единицы продукции заданы таблицей.
Нормы расхода ресурсов на 1ед продукции | Запас ресурса | ||||
1 | 2 | 3 | 4 | ||
А | 4 | 5 | 10 | 2 | 30 |
В | 5 | 15 | 20 | 5 | 70 |
С | 40 | 10 | 15 | 20 | 150 |
Прибыль | 6 | 7,5 | 10 | 15 | МАХ |
1. Составить задачу линейного программирования, позволяющую определить оптимальный план выпуска продукции, обеспечивающий получение максимальной прибыли.
2. Решить задачу, используя симплекс-метод. Записать решение и пояснить его экономический смысл. Важно: количество продукции каждого вида может принимать дробные значения.
3. Составить двойственную задачу. Найти решение двойственной задачи,
используя симплекс-таблицы, полученные при решении исходной задачи.
Пояснить экономический смысл решения.
Р е ш е н и е :
1. Обозначим : х1, x2 х3 х4 — план производства видов продукции И1 И2 И3 И4 соответственно. Тогда затраты ресурсов на план : А – (4х1+5х2+10х3+2х4),
В – (5х1+15х2+20х3+5х4), С – (40х1+10х2+15х3+20х4), прибыль равна:
6х1 + 7,5х2 + 10х3 + 15х4 (де.).
Получаем задачу ЛП :
F = 6х1 + 7,5х2 + 10х3 + 15х4 → max
4х1+5х2+10х3+2х4 ≤ 30[pic 6]
Методы оптимальных решений — готовая контрольная работа по цене 200 руб
Фрагмент работы Введение Содержание Список литературы
Для изготовления сапог, ботинок и кроссовок используется сырье трех видов. Запаса сырья известны и равны соответственно: 350,392 и 408. Количество сырья необходимое для производства сапог соответственно равны: 14,14 и 6 т; для ботинок: 5,8 и 12 т; а для кроссовок: 12, 6 и 4 т. Прибыль от реализации единицы товары первого, второго и третьего вида соответственно равны: 20, 10 и 30 условных единиц. Найти ежедневный объем выпуска товаров каждого видов, при котором прибыль предприятия будет максимальной.
Для производства 4-х видов продукции используется 3 вида сырья. Нормы расхода сырья (кг) запасы (кг) его ценность от реализации единицы продукции заданы таблицей.
Составить план выпуска продукции, обеспечивающий получение максимальной прибыли, используя симплексный метод.
Вариант 9
Нормы расхода ресурсов на единичное изделие Запас
ресурсов
изделие 1 изделие 2 изделие 3 изделие 4
Ресурс 1 1 2 3 5 60
Ресурс 2 2 5 11 6 50
Ресурс 3 3 6 3 7 80
Ценность 2 5 7 9
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОГО РЕШЕНИЯ
1. ГЕОМЕТРИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧ
ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Рекомендации. По аналогии с лабораторной работой №1,2 необходимо решить задачу линейного программирования, построив двойственную задачу геометрическим и исследовать ее симплексным методом. Задания для самостоятельного решения берем соответственно из лабораторных работ 1 и 2. Решение выполняется в MS EXSEL, подробное описание смотри в лабораторных работах №1 и №2.
Вариант №9
2. СИМПЛЕКС-МЕТОД ДЛЯ ДВОЙСТВЕННОЙ ЗАДАЧИ
Для производства 4-х видов продукции используется 3 вида сырья. Нормы расхода сырья (кг) запасы (кг) его ценность от реализации единицы продукции заданы таблицей.
Составить план выпуска продукции, обеспечивающий получение максимальной прибыли, используя симплексный метод.
Вариант 9
Нормы расхода ресурсов на единичное изделие Запас
ресурсов
изделие 1 изделие 2 изделие 3 изделие 4
Ресурс 1 1 2 3 5 60
Ресурс 2 2 5 11 6 50
Ресурс 3 3 6 3 7 80
Ценность 2 5 7 9
МЕТОДЫ ОПТИМАЛЬНЫХ РЕШЕНИЙ — Контрольная работа
Основная часть (выдержка)
ЗАДАЧА 1
В системе векторов найти любую подсистему векторов, которые образуют базис, разложить векторы по базису, перейти к другому базису, найти коэффициенты разложения векторов во втором базисе; в обоих случаях определить обратные матрицы, соответствующие векторам базиса. Правильность вычисления в каждом случае проверить с помощью умножения вектора слева на матрицу, обратную матрице вектора базиса.
1.1.
Решение :
Векторы а1 а2 а3 линейно независимы и образуют базис, т.к. определитель, составленный из координат этих векторов, отличен от нуля:
Δ = 322231113
∆ = 3*(3*3 — 1*1) — 2*(2*3 — 1*2) + 1*(2*1 — 3*2) = 12
Определитель матрицы равен ∆ =12
Разложим а4 = α1а1 + α2а2 + α3а3
Запишем данное равенство в координатной форме:
(5;1;11) = α(3;2;2) + α(2;3;1) + α(1;1;3)
Используя свойства векторов, получим следующее равенство:
(5;1;11) = (3α1;2α1;2α1;) + (2α2;3α2;1α2;) + (1α3;1α3;3α3;)
(5;1;11) = (3α1 + 2α2 + 1α3;2α1 + 3α2 + 1α3;2α1 + 1α2 + 3α3)
По свойству равенства векторов имеем:
3α1 + 2α2 + 1α3 = 5
2α1 + 3α2 + 1α3 = 1
2α1 + 1α2 + 3α3 = 11
Решаем полученную систему уравнений методом Крамера
5 2 1
Δ1= 1 3 1
11 1 3
3 5 1
Δ2 = 2 1 1
2 11 3
3 2 5
Δ3 = 2 3 1
2 1 11
решим методом Крамера
=> вычислим сначала определители
Δ1=24, Δ2= -24, Δ3=36
α1 = Δ1/ Δ=24/12=2
α2 = Δ2/ Δ=-24/12=-2
α3= Δ3/ Δ=36/12=3
а4 = 2-23
а4 = 2а1 -2а2 + 3а3 .
Следующий базис выберем
Векторы линейно независимы и образуют базис, т.к. определитель, составленный из координат этих векторов, отличен от нуля:
Подборка по базе: зачетная работа.docx, Контрольная работа.docx, Лабораторная работа по дисциплине Гражданское право (1) (1).docx, Лабораторная работа О.С. Тучиной.docx, ОГП ТЕМА №6 Методы оценки своего функционального состояния и спо, Курсовая работа ст. Герцовский Г.А. гр.С-10-17 ЗиС.docx, Лабораторная работа.docx, Курсовая работа моя.doc, Контрольная работа по географии.doc, практическая работа 3(1).pdf Факультет Экономики и финансов Кафедра Экономика «Бухгалтерский учет, анализ и аудит»
(название дисциплины)
Работа защищена с оценкой _______________________________________________ (оценка, подпись преподавателя) Москва 2017 г. Задание 1 Построить математическую модель задачи оптимизации производства. Предприятие выпускает продукцию четырех видов П1-П4, для изготовления которой используются ресурсы трех видов: трудовые, сырье и оборудование. Нормы расхода каждого вида ресурса на изготовление единицы каждого вида продукции приведены в таблице. Прибыль, получаемая от реализации единицы продукции, равна: для продукции П1 – 60 у.е., для П2 – 70 у.е., для П3 – 120 у.е. и для П4 – 130 у.е. Определить оптимальный план производства каждого вида продукции, максимизирующий прибыль данного предприятия. Решение Решим прямую задачу линейного программирования симплексным методом, с использованием симплексной таблицы. Определим максимальное значение целевой функции F(X) = 60x1+70x2+120x3+130x4 при следующих условиях-ограничений. x1+x2+x3+x4≤16 Для построения первого опорного плана систему неравенств приведем к системе уравнений путем введения дополнительных переменных (переход к канонической форме). 1x1 + 1x2 + 1x3 + 1x4 + 1x5 + 0x6 + 0x7 = 16 6x1 + 5x2 + 4x3 + 3x4 + 0x5 + 1x6 + 0x7 = 110 4x1 + 6x2 + 10x3 + 13x4 + 0x5 + 0x6 + 1x7 = 100 Решим систему уравнений относительно базисных переменных: x5, x6, x7 Полагая, что свободные переменные равны 0, получим первый опорный план: X0 = (0,0,0,0,16,110,100)
Переходим к основному алгоритму симплекс-метода.
Формируем следующую часть симплексной таблицы. Вместо переменной x7 в план 1 войдет переменная x4.
|
Методы оптимальных решений Витте (МИЭМП) часть 1. Контрольная работа
Описание
Вариант 3 Контрольная работа
Ситуация 1
Построить математическую модель задачи оптимизации производства.
Фабрика выпускает 3 вида тканей, причем суточное плановое задание составляет не менее 90м тканей 1-го вида, 70м- 2, 60м- 3. Суточные ресурсы следующие: 780 единиц производственного оборудования, 850 единиц сырья и 790 единиц электроэнергии, расход которых на 1м представлен в таблице. Цена за 1м равна 80уе.- 1 вид, 70-2й, 60-3й. Определить сколько метров ткани каждого вида следует выпускать, чтобы общая стоимость выпускаемой продукции была максимальной. Ресурсы 1 2 3 Оборудование 2 3 4 Сырьѐ 1 4 5 Электроэнергия 3 4 2
Ситуация 2 Построить математическую модель задачи. Составить задачу, двойственную к исходной. Предприятие предложен на выбор выпуск 3 новых изделий, за счет которых можно было бы расширить номенклатуру продукции предприятия при тех же запасах ресурсов. Нормы затрат ресурсов и прибыль от реализации единицы продукции для этих изделий представлены в таблице. Определить из предложенных видов изделия, выгодные для выпуска предприятием
Ситуация 3 Решить транспортную задачу с использованием вычислительных средств Excel.
Имеются n пунктов производства и m пунктов распределения продукции. Стоимость перевозки единицы продукции с i- го пункта производства в j-й центр распределения Сij приведена в таблице, где под строкой понимается пункт производства, а под столбцом – пункт распределения. Кроме того, в этой таблице в i-й строке указан объем производства в i- м пункте производства, а в j-м столбце указан спрос в j-м центре распределения. Необходимо составить план перевозок по доставке требуемой продукции в пункты распределения, минимизирующий суммарные транспортные расходы.
Ситуация 4 Решить задачу о назначениях преподавателей на проведение занятий в соответствии с заданной таблицей. Стоимость выполнения Преподаватели Виды занятий
4 способа проверки стратегических решений давлением, вдохновленные американскими военными
Почти каждый руководитель разработал процесс, призванный избежать критических стратегических ошибок, но по мере того, как мир продолжает усложняться, становится все труднее предвидеть все изменения и силы, которые могут повлиять на вашу конечную цель. Таким образом, крайне важно выявить слабые места в своих стратегиях до их реализации и разработать для этого строгий процесс. Врожденная способность пробивать бреши в собственных стратегиях — это то, что американские военные практиковали и совершенствовали на протяжении веков.Советы включают формирование групп, которые рассматривают сценарии, альтернативные ожидаемому результату, при одновременном поиске решений для этих сценариев, если они произойдут; формирование совета, который предложит вам чистую правду; проведение «военных игр», чтобы пробить бреши в собственных стратегиях; и формирование стратегического совета, который может анализировать ситуации с разных точек зрения.
Каждый лидер хочет избежать серьезных стратегических ошибок, но в сложном мире трудно предвидеть все силы, которые могут повлиять на вашу цель.Жизненно важно найти слабые места в ваших стратегиях до того, как вы их реализуете, и разработать для этого строгий процесс.
Способность пробивать дыры в собственных стратегиях — это то, что американские военные практиковали и совершенствовали на протяжении веков. Рик служил в армии США 35 лет, выйдя на пенсию в звании генерал-лейтенанта, и видел это воочию. В пылу битвы неполное или просто неправильное стратегическое планирование заставляет лидеров возвращаться к принятию решений на месте.Хотя иногда это необходимо, придумывание на ходу чаще связано с неудачей и гибелью людей и часто является симптомом неэффективного или неточного ожидания конкурентных действий или изменений окружающей среды.
То же самое и в бизнесе, и методы, отработанные военными, могут помочь руководству предвидеть проблемы и при необходимости менять курс.
Повышение ситуационной осведомленностиПроще говоря, ситуационная осведомленность (SA) достигается после того, как солдат намеренно оценил окружающую среду с различных точек зрения и убедился, что все потенциальные перспективы были захвачены.
В деловом мире все более расплывчато — нет ландшафтов, зданий или передвижения войск, которые нужно сканировать. Но по-прежнему крайне важно понимать среду, в которой мы работаем, и предвидеть, как различные факторы повлияют на наши решения.
Один из способов повысить осведомленность о ситуации — это обсудить альтернативные реальности. Хотя это звучит как научная фантастика, альтернативные реальности в основном гипотетические. Мы думаем, что X случится, но что, если случится Y или Z?
В компании Merck, где Джей занимал должность директора по стратегии и развитию бизнеса и президента по развитию бизнеса, «альтернативные реальности» использовались для предотвращения «командного мышления», которое часто возникает, когда организации считают, что общепринятый взгляд на ситуацию является правильным.
Чтобы улучшить ситуационную осведомленность, начните с формирования групп и поручения им разработать альтернативы, основанные на разных взглядах на одну и ту же ситуацию. Например, что, если новый конкурент выйдет на рынок раньше, чем ожидалось? Что они могли сделать, чтобы нас удивить и / или перехитрить? Что делать, если они задерживаются; какие меры они могут предпринять, чтобы попытаться быстрее восстановиться и проникнуть на рынок? Могли ли их действия быть крайними или отчаянными? Какие действия может и должна наша команда рассмотреть для снижения или уменьшения риска в этих альтернативных сценариях?
Следующий шаг — сравнить эти гипотетические гипотезы вместе и затем определить, какие контрмеры окажут наибольшее влияние.
Самое главное, не забудьте рассмотреть конкретные «триггеры», которые укажут на развертывание одного или нескольких альтернативных сценариев. Предварительное согласование этих триггеров полезно, потому что они предполагают определенные пороговые значения для изменения действия или направления. После выявления вы должны регулярно отслеживать эти триггеры на панели инструментов, которую видят все старшие члены команды. Это устраняет или значительно сокращает дискуссии, когда изменение курса становится необходимым и срочным. Затем убедитесь, что руководители групп регулярно проходят оценку SA и обсуждают альтернативные сценарии и триггеры во время каждой бизнес-проверки.
Небольшие затраты времени могут привести к новому пониманию готовности вашей организации и проницательности ваших лидеров, которые остались бы незамеченными до кризиса.
Развитие перспективы извнеЭто еще один метод, который широко используется в вооруженных силах и может выявить уникальные, но недостаточно используемые возможности или неиспользованные источники конкурентного преимущества. Подумайте о самолетах. Долгое время военные использовали самолеты в первую очередь для улучшения видимости местности и передвижения войск, но с начала 1900-х годов военные начали использовать самолеты для доставки боеприпасов и ведения боевых действий.Какие самолеты у вашей организации?
Часто это вспомогательные активы или возможности, которые часто рассматриваются как «затраты на ведение бизнеса». Они могут включать в себя контролируемую глобальную цепочку поставок, уникальные возможности для тестирования соединений, патентованные каналы связи с ключевыми составляющими, уникальное производственное оборудование и т. Д. Подумайте: в будущих сценариях может ли какое-либо из этих направлений стать новым направлением бизнеса? Если ваша среда неожиданно изменится, может ли кто-нибудь из них помочь вам адаптироваться?
В компаниях взгляд извне может помочь сформировать честное представление о сильных и слабых сторонах вашей организации.Заказчики могут быть отличным источником для этого, и еще один вариант — формирование стратегического консультативного совета.
Разыграй этоЕще одна практика — это военные игры, и зачастую нет замены тому, чтобы задействовать реальных людей, чтобы посмотреть, как они отреагируют. Даже сложное моделирование искусственного интеллекта, хотя и полезно, может не обладать вариативностью и изобретательностью человеческого творчества. Военные США стали экспертами в подготовке к боевым действиям с использованием военных игр. Наиболее примечательным является создание Национального учебного центра в пустыне Мохаве в Калифорнии, где армия США проводит боевые действия в режиме реального времени, совершенствуя свои возможности.
В компании Merck часто использовались военные игры, связанные с критическими решениями. Лучший способ сделать это — назначить высокоэффективных менеджеров руководить «противоборствующими» командами, которые должны состоять из людей, обладающих опытом в соответствующих функциональных областях. Перед упражнением обязательно подготовьте фон, который описывает общую проблему и предоставляет конкретную информацию и данные. Лучшая практика — поручить линейной области, наиболее ответственной за ситуацию, организовать и провести общее упражнение — и убедиться, что каждая группа представит свои выводы в конце.Стимулирование «противостоящих» команд к успеху поможет обеспечить надежную симуляцию. Например, рассмотрите возможность приглашения старшего руководителя для оценки результатов и предложения денежного бонуса или признания команды победившей команде или того и другого.
Формируйте разнородные стратегические группыНаконец, сформируйте группы стратегических инициатив и заполните их людьми, которые могут анализировать проблемы с разных точек зрения.
В компании Merck группа стратегических инициатив часто предлагала альтернативные решения и действия по ключевым вопросам бизнеса.В одном случае выбор позиционирования нового продукта в качестве лечения второй линии по сравнению с попыткой вытеснить хорошо принятую начальную терапию оказался уникальным преимуществом, помогая добиться запуска, который намного превзошел ожидания.
Как лучше всего использовать различные тесты?
Реферат
Даже несмотря на многообещающие последние новости о разработке вакцин, быстрое и крупномасштабное тестирование, отслеживание, отслеживание и выделение (TTTI) по-прежнему имеет важное значение для ответных мер политики общественного здравоохранения на пандемию COVID ‑ 19.В этой записке содержится обновленная информация о таких стратегиях, представленная ранее ОЭСР, в свете последних достижений в технологиях тестирования. Молекулярные тесты, и в частности ОТ-ПЦР, остаются эталоном для выявления инфекций, потому что эти тесты очень надежны. Но ограничения емкости и относительно высокая стоимость RT-PCR ограничивают ее массовое использование. Недавно разработанные быстрые тесты на антигены предлагают преимущество более быстрого получения результатов. Они также дешевле, просты в использовании и могут выполняться на месте, что позволяет использовать их в очень больших масштабах.Однако они менее надежны, чем молекулярные тесты. Для достижения своих целей стратегии тестирования могут комбинировать различные технологии и использовать их взаимодополняющими способами с учетом их соответствующих сильных сторон и ограничений.
В то время как последние новости о разработке вакцины против COVID ‑ 19 обнадеживают, стратегии тестирования, отслеживания, отслеживания и выделения (TTTI) будут по-прежнему иметь важное значение . До тех пор, пока все население не будет иммунизировано, только TTTI может предотвратить будущие повторные заражения после карантина .Широко доступны два основных типа технологий тестирования для информирования таких стратегий.
Молекулярные тесты, в частности RT-PCR , остаются эталоном для выявления активных инфекций. Эти тесты оказались очень надежными, — они достигают высокой чувствительности и специфичности. Но ограничения емкости и относительно высокая стоимость тестов RT-PCR ограничивают их массовое использование. Кроме того, получение результатов тестирования занимает много времени.
Быстрые тесты на антигены имеют главное преимущество: дает результаты намного быстрее. Они также просты в использовании, могут выполняться на месте и дешевле, чем молекулярные тесты, что позволяет использовать их в очень больших масштабах. Однако они менее надежны, чем молекулярные тесты — они достигают хорошей специфичности, но имеют лишь умеренную чувствительность .
Цели стратегии тестирования должны определять выбор соответствующего типа теста с учетом этих сильных сторон и ограничений.
Мониторинг конкретных групп населения , в которых подозревается возникновение нового кластера инфекций, является наиболее подходящим применением быстрых тестов на антигены в местах оказания медицинской помощи, учитывая, что их можно использовать быстро и в больших масштабах.Но это требует повторения тестов. Тестирование пассажиров для авиаперелета может быть средством дополнительной проверки перед посадкой на рейс и ослабления карантинных требований по прибытии, но такие стратегии следует применять с осторожностью.
Экспресс-тесты на антигены — единственный действенный вариант для массовых скрининговых кампаний среди населения в целом. Хотя это может показаться привлекательной стратегией для руководства мерами сдерживания, связанные с этим проблемы не следует недооценивать, а эффективность остается неопределенной.
Молекулярное тестирование является предпочтительным вариантом в клинических условиях для диагностики пациентов и информирования о решениях по лечению, поскольку надежность этих тестов сводит к минимуму риск ошибочного диагноза.
Молекулярные тесты также являются лучшим вариантом для людей с симптомами и людей, которые контактировали с с подтвержденным случаем для информирования о стратегиях TTTI. Некоторые экспресс-тесты на антигены в местах оказания медицинской помощи могут, однако, представлять собой возможную альтернативу молекулярным тестам в таких ситуациях.Но может потребоваться повторное тестирование или подтверждающие молекулярные тесты. Полезность экспресс-тестов на антигены в медицинских учреждениях в стратегиях TTTI зависит от того, могут ли повышенная скорость и более низкая стоимость, а следовательно, и большее количество тестов перевешивать более низкую чувствительность.
Тесты на базе RT-LAMP и CRISPR в местах оказания медицинской помощи могут в конечном итоге преодолеть некоторые ограничения RT-PCR и быстрых тестов на антигены. Однако их разработка все еще продолжается, и они пока еще не получили широкого распространения. Кроме того, еще не ясны логистические последствия использования этих тестов.
Даже с учетом многообещающих последних новостей о разработке вакцины против COVID ‑ 19, пройдет некоторое время, прежде чем вакцины станут доступны населению в целом. Таким образом, тестирование, отслеживание, отслеживание и изоляция (TTTI) быстро, массово и грамотно по-прежнему будет иметь важное значение для предотвращения будущих повторных заражений после блокировки. Быстрое подавление инфекций требует тестирования подозреваемых случаев и всех их контактов для своевременного выявления инфицированных и изоляции инфицированных; эффективное отслеживание их, чтобы убедиться, что они не распространяют болезнь дальше; и исчерпывающе отслеживая, с кем они контактировали.Обзор доступных технологий тестирования был представлен в кратком изложении политики ОЭСР под названием «Тестирование на COVID-19: способ снятия ограничений содержания», опубликованном в мае 2020 года. С тех пор был достигнут успехов в разработке новых методов тестирования и перепрофилировании. существующих технологий для COVID ‑ 19 , включая, среди прочего, быстрые тесты на антигены и другие методы молекулярной диагностики (в основном тесты на основе CRISPR1 и RT-LAMP2).
В отличие от ОТ-ПЦР, которая до сих пор использовалась наиболее широко, новые быстрые тесты на антиген могут быть легко развернуты в местах оказания медицинской помощи и обеспечат почти немедленные результаты.Эти функции очень полезны для улучшения стратегий TTTI, но, как описано ниже, быстрые тесты на антигены менее чувствительны, чем RT-PCR, и это может ограничивать их применимость в некоторых сценариях. Тесты на месте RT-LAMP и CRISPR привлекают большое внимание и могут стать полезным дополнением к «ящику инструментов тестирования» в среднесрочной перспективе.
В этой записке содержится обновленная версия более ранней сводки ОЭСР в свете этих последних достижений в технологиях тестирования и обсуждается значение более эффективных стратегий сдерживания и смягчения последствий до тех пор, пока вакцины не станут широко доступными.Основные технологии, доступные в настоящее время или ожидаемые в краткосрочной / среднесрочной перспективе, описаны в следующем разделе и приведены в таблице 2. В следующем разделе обсуждаются стратегии тестирования и соответствующее использование различных технологий для их поддержки.
Существуют различные технологии тестирования с разными целями, характеристиками, сильными сторонами и ограничениями
Молекулярные / геномные тесты
ОТ-ПЦР — единственный хорошо зарекомендовавший себя метод
ОТ-ПЦР — это диагностический метод для обнаружения вирусного генетического материала ( вирусная РНК) в биологическом образце после его амплификации для обнаружения.Это текущий справочник по обнаружению присутствия вируса в дыхательных путях, то есть для выявления активных инфекций. Этот метод имеет очень хорошую чувствительность и специфичность, что означает, что он очень надежен (см. Вставку 1). Однако в некоторых ситуациях бывает трудно интерпретировать положительные результаты (см. Вставку 2). Некоторые более общие ограничения этого метода также усложняют его использование в массовом масштабе . Во-первых, некоторые важные материалы для тестирования (например, реагенты, мазки из носа, транспортные среды и т. Д.)) находятся в ограниченном количестве. Кроме того, даже если с помощью этого метода можно получить результаты в течение нескольких часов, логистика сбора образцов, их транспортировка в центральную лабораторию, анализ образца и возврат результатов приводят к длительному периоду времени между взятием образца и получением результатов. и общались. Это может сделать тестирование ОТ-ПЦР узким местом в стратегиях TTTI, которые зависят от выявления и изоляции инфицированных людей как можно быстрее. Наконец, в некоторых странах сдерживающим фактором является относительно высокая стоимость ОТ-ПЦР (Carter et al., 2020 [1]). Для простоты методы, которые имеют те же общие характеристики, что и ОТ-ПЦР, в частности, транскрипционно-опосредованная амплификация (ТМА) и стандартная RT-LAMP, отдельно не обсуждаются. Ссылки на ОТ-ПЦР ниже охватывают эти три метода.
Вставка 1. Надежность диагностических тестовНадежность диагностических тестов определяется их способностью точно определять положительные и отрицательные случаи . Это описывается двумя параметрами:
1. Чувствительность: вероятность того, что тест даст положительный результат, если тестируемый действительно инфицирован.
2. Специфичность: вероятность того, что тест даст отрицательный результат, если испытуемый действительно не инфицирован.
Низкая чувствительность теста дает высокую долю ложноотрицательных результатов теста среди всех инфицированных людей, в то время как низкая специфичность теста дает высокую долю ложноположительных результатов теста среди всех людей, которые не инфицированы.Это означает, что прогностическая ценность диагностического теста также зависит от распространенности инфекции. То есть доля «истинно положительных» среди всех положительных результатов теста и доля «истинно отрицательных» среди всех отрицательных результатов теста зависит не только от чувствительности и специфичности теста, но и от доли людей, которые действительно инфицированы в протестированной популяции. Это дополнительно проиллюстрировано для экспресс-тестов на антигены во вставке 3.
Вставка 2. Текущие тесты ОТ-ПЦР могут быть «сверхчувствительными» и выявлять случаи, которые больше не заразны.Для выявления вирусного генетического материала необходимо, чтобы ОТ-ПЦР усилить генетический материал, чтобы достичь определенного порога обнаружения.Результат этого метода тестирования в контексте обнаружения COVID ‑ 19 является двоичным (положительным или отрицательным), и количество циклов амплификации является одним из параметров метода. Чем больше количество циклов, выполненных с одним образцом, тем выше шансы обнаружить (существующий) вирусный генетический материал, даже если он присутствует в образце в очень ограниченных количествах. Другими словами, если образец имеет очень ограниченное количество генетического материала (например, когда кто-то находится на стадии выздоровления от болезни), ОТ-ПЦР может дать отрицательный результат с 25 циклами, но положительный с 35 (потому что эффект из 10 дополнительных циклов позволит амплификации достичь порога обнаружения).
Это означает, что большое количество циклов может привести к положительным результатам тестов, даже если образцы взяты у людей, которые больше не заразны (потому что они выздоравливают или уже выздоровели, но все еще несут некоторые остатки вируса в носу и горле) .
Молекулярные / геномные тесты в разработке
RT-LAMP-тесты на месте
RT-LAMP — это метод, аналогичный обычным тестам RT-PCR, за исключением того, что амплификация нуклеиновой кислоты происходит при постоянной температуре, 3 и, таким образом, не требуется такое оборудование, как дорогие термоциклеры, используемые для регулирования температуры образца в RT-PCR.
До недавнего времени тесты RT-LAMP выполнялись преимущественно в полноценных лабораториях и представляли собой альтернативу RT-PCR с аналогичными характеристиками, но некоторые наборы для тестирования в местах оказания помощи и рядом с ними, использующие этот метод, недавно были были коммерциализированы и одобрены для использования, в том числе несколько в ЕС и США4. Эти тесты показывают высокий уровень чувствительности и специфичности в отношении ОТ-ПЦР (Thompson and Lei, 2020 [2]; Dao Thi et al., 2020 [3] ]). Еще предстоит увидеть, как быстро можно будет расширить масштабы использования RT-LAMP в местах оказания медицинской помощи.Однако, в зависимости от стоимости, эта технология может оказаться более жизнеспособным вариантом для использования, например, в контексте тестирования перед поездкой, чем тестирование на антигены.
Тесты на основе CRISPR
Тесты на основе CRISPR работают, идентифицируя последовательность вирусной РНК COVID ‑ 19 и разделяя любую соседнюю одноцепочечную РНК. Эти разрезы высвобождают отдельно введенную флуоресцентную частицу в тестовый раствор. Когда на образец попадает лазерный луч, высвободившиеся флуоресцентные частицы загораются, сигнализируя о наличии вирусного генетического материала.Текущие прототипы, основанные на этой методике, дают результаты в течение 30 минут с уровнями производительности, сравнимыми с RT-PCR, и могут быть выполнены в месте оказания медицинской помощи.
Кроме того, у этого метода есть еще одно ключевое преимущество — он позволяет количественно определять количество вируса в образце. Эта функция может, например, помочь в оценке того, насколько заразен пациент. С другой стороны, молекулярные тесты усиливают вирусный генетический материал, чтобы его обнаружить. Это, по определению, изменяет количество присутствующего генетического материала, что исключает возможность точного определения количества вируса, изначально содержащегося в образце (Fozouni et al., 2020 [4]; Рамачандран и др., 2020 [5]).
Тесты на антигены
Тесты на антигены выявляют другую часть вируса SARS ‑ CoV ‑ 2, белковую оболочку, которая окружает геном РНК. Как и молекулярные тесты, тесты на антигены предназначены для выявления присутствия вируса у лиц с симптомами или бессимптомно и проводятся на образцах, взятых из дыхательных путей. К основным преимуществам экспресс-тестов на антигены5 по сравнению с RT-PCR относятся их простота использования : их можно проводить в месте оказания медицинской помощи; к реагенту прикладывают простой тампон.Они также на намного дешевле , от 15 долларов США до менее 50,6 долларов США. Но их главное преимущество — это быстрота результата : большинство из них дают результат за 15-30 минут, в то время как, как упоминалось выше, для RT-PCR требуется несколько часов. необходимо выполнить, и еще больше времени до получения результатов из-за всей до- и постаналитической работы. Следовательно, экспресс-тесты на антигены могут позволить увеличить объем тестирования и быстрее изолировать людей с положительным результатом, что будет способствовать более быстрому разрыву цепочек передачи.
Тем не менее, по сравнению с ОТ-ПЦР, эти тесты также имеют недостатки: большинство экспресс-тестов на антигены достигают хорошей специфичности по сравнению с ОТ-ПЦР, но только средней чувствительности (см. Вставку 3), хотя эти числа могут варьироваться в зависимости от того, как оценивается производительность. Эта более низкая чувствительность экспресс-тестов на антигены должна быть квалифицирована из-за возможной чрезмерной чувствительности ОТ-ПЦР в отношении выявления людей, которые являются заразными в некоторых сценариях (см. Вставку 2). Действительно, некоторые оценки экспресс-тестов на антигены сообщают о чувствительности, близкой к ОТ-ПЦР при высоких уровнях вирусной концентрации (см., Например, Corman et al.(2020 [6]) и Общественное здравоохранение Англии и Оксфордского университета (2020 [7]). Это может позволить надежно выявить наиболее проблемные случаи передачи вируса.
Вставка 3. Проведение экспресс-тестов на антигеныИспользуя ОТ-ПЦР в качестве эталона, в систематических обзорах сообщается о сниженной и сильно изменчивой чувствительности и высокой специфичности от средней до по ряду оцененных экспресс-тестов (Cochrane COVID-19 Группа точности диагностических тестов, 2020 [8]; HAS, 2020 [9]).Французский Haute Autorité de Santé (HAS, 2020 [9]) оценил, что:
Чувствительность составила около 71% [CI 57-82] по всем тестам, но варьировалась от 17% [CI 9-27] до 97% [ДИ 83‑100]. Нижняя граница особенно проблематична.
Специфичность составляла около 99%, [ДИ 97,3–99,4] и менее вариабельна, от 86% [ДИ 73–94] до 100% [ДИ 99‑100].
Однако истинная производительность этих тестов может быть несколько занижена.Приведенные выше оценки основаны на проверках на замороженных-размороженных образцах, хранящихся в различных вирусных транспортных средах, и проанализированы ретроспективно, что могло повлиять на эффективность тестов. Кроме того, еще не полностью подтверждена чувствительность и специфичность экспресс-тестов на антигены у бессимптомных людей. Однако это может быть незначительной проблемой, потому что чувствительность и специфичность ОТ-ПЦР, по которой оцениваются тесты на антигены, не зависят от того, проявляются ли у кого-то симптомы.
Если предположить такую же эффективность, как и у пациентов с симптомами, скрининг в масштабах всей популяции с использованием только экспресс-тестов на антигены приведет к высокой доле ложноположительных результатов, несмотря на их высокую специфичность.Это связано с тем, что распространенность болезни среди населения в целом низкая, а это означает, что большинство людей, прошедших тестирование, на самом деле имеют отрицательный результат. В сочетании с более низкой чувствительностью, приводящей к высокой доле ложноотрицательных результатов, возможности таких тестов по выявлению истинно положительных случаев ограничены. Как показано на панели A таблицы 1, в гипотетической популяции в 1000000 человек, в которой инфицировано 10000 человек (1%), тест с чувствительностью 71% и специфичностью 99% дает 17000 положительных тестов, из которых 9 900 (58%) — ложные срабатывания.Таким образом, положительный тест будет соответствовать инфицированному человеку только в 42% случаев (прогностическая ценность положительного результата). Прогностическая ценность положительного результата теста с чувствительностью 50% и специфичностью 99% составляет всего 34%. Это означает, что в таких обстоятельствах положительные результаты теста необходимо будет подтвердить с помощью ОТ-ПЦР. Единственным другим вариантом компенсации неточности может быть многократное использование экспресс-тестов на антигены для мониторинга инфекционного статуса данной группы населения (см. Следующий раздел).
В сценарии более высокой распространенности (таблица 1, панель B) положительная прогностическая ценность теста со средней чувствительностью намного более благоприятна.Таким образом, тест достигает своего наивысшего потенциала при подтверждении инфекции в сценариях, где вероятность заражения человека высока — например, когда тестирование пациента с симптомами и ОТ-ПЦР неосуществимы. Здесь положительный экспресс-тест на антиген почти наверняка идентифицирует активную инфекцию. Подтверждение с помощью ОТ-ПЦР не требуется. Это, конечно, происходит за счет более низкой прогностической ценности отрицательных результатов, то есть более высокой доли ложноотрицательных результатов. Так что, наоборот, нельзя с уверенностью сделать вывод, что симптоматический пациент с отрицательным результатом не инфицирован.Это еще более серьезная проблема, если тест не проводится на ранней стадии инфекции: чем больше времени проходит, тем выше вероятность отрицательного результата теста на антиген, даже если кто-то инфицирован. Вот почему в некоторых клинических сценариях (например, у пациентов из группы риска) необходимо проводить ОТ-ПЦР для подтверждения отрицательного результата теста на антиген.
Таблица 1. Прогностические значения тестов зависят от чувствительности и специфичности теста и от распространенности заболевания | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
Панель A: Предполагая низкую распространенность заболевания (1% от население инфицировано) | ||||||||||||
Население = 1000000 Распространенность = 1% | Тест A Чувствительность = 71% Специфичность = 99% | 4 9002 9002 Чувствительность = 50% Специфичность = 99% | ||||||||||
Положительная | Отрицательная | Положительная | 7 100 | 2900 | 5 00 0 | 5000 | ||||||
Незараженный | 990 000 | 9 900 | 980100 | 980100 | 02980100 | 0 | ||||||
Итого | 1 000 000 | 17 000 | 983 000 | 14 900 | 14 900 | 9002 985 | 902 985 | 902 | 41.76% | 99,70% | 33,56% | 99,49% |
Популяция с высокой распространенностью ) | ||||||||||||
Население = 1000000 Распространенность = 20% | Тест A Чувствительность = 71% Специфичность = 99% | 42 3 Тест B 900 50% Специфичность = 99% | ||||||||||
Положительная | Отрицательная | Положительная | Отрицательная | 58 000 | 100 000 | 100 000 | ||||||
Не заражен | 800 000 | 8 000 | 792 000 | 7 7 | 7 | |||||||
1000000 | 150 000 | 850 000 | 108 000 | 892 000 | 93,18% | 92,59% | 88,79% |
Серологические тесты
Серологические тесты на наличие специфических заболеваний биологические жидкости (обычно кровь). Такие тесты определяют, выработал ли человек антитела против данного патогена в результате воздействия или инфекции. Эти тесты бывают разных форм: некоторые требуют установки сложных машин в лабораториях (например,г. ELISA-тесты), в других используется менее сложное оборудование и их можно использовать на месте (экспресс-тесты). Серологические тесты играют важную роль в эпидемиологии и разработке вакцин. Однако они не подходят для диагностики новых инфекций у облученных пациентов или пациентов с симптомами, и, как следствие, не играют никакой роли в реализации стратегий TTTI. .
Таблица 2. Различные типы технологий тестирования, доступные в контексте COVID-19 | |||||||
---|---|---|---|---|---|---|---|
Молекулярные / геномные тесты | 9025 | Серологические тесты (не актуально для стратегий TTTI) | |||||
Цель теста | Обнаружение наличия вируса в организме | 902 902 иммунного ответа на вирус ||||||
Методика | ОТ-ПЦР | Пункт оказания помощи RT-LAMP | тесты Тесты на основе CRISPR | Rapid an tigen tests | ELISA-тесты | Иммунохроматографические тесты (экспресс-тесты) | |
Что он ищет? | Выполняет поиск вирусного генетического материала (РНК) в образце, взятом у пациента (обычно мазке из носоглотки) | Проверяет наличие вирусного генетического материала (РНК) в образце, взятом из пациент (обычно мазок из носоглотки) | Выполняет поиск вирусного генетического материала (РНК) в образце, взятом у пациента (обычно мазок из носоглотки) | Выполняет поиск вирусных антигенов в взятом образце от пациента (обычно мазок из носоглотки) | Выявляет наличие иммунного ответа (антител) против вируса в жидкостях пациента (обычно в крови) | ||
Что означает положительный результат теста? | Вирус присутствует у пациента | Пациент подвергся воздействию вируса и либо выздоравливает, либо уже выздоровел | |||||
Для чего используется тест? | Чтобы узнать, инфицирован ли человек в настоящее время SARS ‑ CoV ‑ 2 Узнать, циркулирует ли SARS ‑ CoV ‑ 2 в данной группе или популяции | Чтобы узнать, подвергался ли пациент воздействию SARS ‑CoV ‑ 2 и, следовательно, может быть защищен от новых инфекций (и потенциально не может больше распространять болезнь) 1 | |||||
Плюсы | — Высокая чувствительность и специфичность | — Эффективность близка к RT- ПЦР — Может использоваться в пункте оказания помощи — Обычно дает результат менее чем за час | — Сообщается о производительности, близкой к RT-PCR — Можно использовать в пункте оказания помощи — Может количественно определить вирусную нагрузку — Дать результат через 15-30 минут | — Простота обработки — Недорого — Дать результат через 15-30 минут — Можно использовать сразу t-of-care — Хорошая специфичность | — Более надежный, чем иммунохроматографические анализы — Предоставляет количественную информацию (концентрация в антителах) | — Менее ресурсоемкий, чем тесты ELISA — Может быть выполняется на месте — Быстрая (от 15 до 30 минут) | |
Минусы | — Трудоемкие; — Большинство тестов все еще необходимо обработать в лаборатории — Требуется время, чтобы дать результаты (по крайней мере, несколько часов) — Тестирование материалов в дефиците | — Еще не широко доступны на месте- уход. — Цена все еще не определена | — Пока не доступна в пункте обслуживания — Цена все еще не определена | — Более низкая чувствительность по сравнению с ОТ-ПЦР | — Возможные ошибки интерпретации, если она тоже выполняется на ранней стадии процесса заражения, поскольку антитела еще не были выработаны — Возможные ложноположительные результаты (взаимодействие с другими заболеваниями) | ||
— Необходимо проводить в лаборатории — Интенсивное использование ресурсов (от 1 до 5 часов) | — Предоставляет только качественную информацию (наличие или отсутствие антител) |
Какие тесты следует использовать в каких обстоятельствах?
В целом, сильные стороны и ограничения различных технологий тестирования, описанных выше, означают, что выбор наиболее подходящей технологии должен зависеть от целей стратегии тестирования , а не наоборот.На практике есть три основные задачи тестирования:
1. Точный диагноз пациента для информирования решений в клинической помощи ;
2. Подтверждение или опровержение подозреваемых случаев, например поскольку у человека проявляются симптомы или он контактировал с подтвержденным случаем, на номер проинформируйте TTTI стратегии; и,
3. Мониторинг определенных групп населения , в которых предполагается наличие инфекции (например,г. дома престарелых, компании, школы и университеты, географические районы с подозреваемыми кластерами и т. д.).
Ни одна из доступных в настоящее время технологий тестирования не подходит для всех трех сценариев, и необходимо учитывать различные последствия с точки зрения затрат и логистических требований при принятии решения, какие тесты использовать для чего и на ком. В таблице 3 приведены тесты, которые следует использовать в первую очередь в каждом из трех сценариев. Технологии тестирования также можно комбинировать. для достижения целей стратегии тестирования, а тесты можно повторять, чтобы компенсировать более низкую точность тестирования.Как поясняется ниже, например, ОТ-ПЦР может использоваться для подтверждения неопределенных результатов экспресс-тестов на антигены, а повторные экспресс-тесты на антигены увеличивают вероятность того, что их результаты являются точными.
Хотя тесты на базе RT-LAMP и CRISPR могут в конечном итоге преодолеть некоторые ограничения ОТ-ПЦР и быстрых тестов на антигены, их разработка все еще продолжается, и они еще не широко доступны. Кроме того, еще не ясны логистические последствия использования этих тестов.
Таблица 3.Наиболее подходящее использование современных технологий тестирования | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
ОТ-ПЦР (и аналогичные молекулярные тесты) | Быстрые тесты на антигены | Тесты на основе CRISPR4 | Пункт оказания помощи RT-LAMP4 ||||||||
Точный диагноз пациентов для принятия решений в клинической помощи | √ | ( √ ) | ( √ ) | |||||||
TTTI (т.е.е. подтверждающие или опровергающие подозреваемые, в том числе симптоматические, случаи и контактные лица) | √ | √ 2 | ( √ ) | ( 3 √ ) | Мониторинг отдельных групп населения (дома престарелых, школы и университеты и т. Д.) | ( √ ) 1 | √ 3 | ( √ ) | ( √ ) |
Диагностика пациентов для информирования клинических решений
Тесты ОТ-ПЦР (и аналогичные молекулярные тесты) остаются эталоном в этом сценарии из-за их более высокой чувствительности и специфичности.В среднесрочной перспективе тесты RT-LAMP и тесты на основе CRISPR могут дополнять RT-PCR, поскольку их эффективность очень близка. В клинических условиях цель состоит в том, чтобы свести к минимуму риск постановки неправильного диагноза и неправильного управленческого решения, которые могут иметь серьезные неблагоприятные последствия для пациентов. Это особенно важно зимой, когда циркулируют другие респираторные патогены. Поэтому всегда будет предпочтительнее самый надежный тест.
Использование в тестировании, отслеживании, отслеживании и изоляции путем подтверждения подозреваемых и контактных случаев
Этот сценарий включает подтверждение или опровержение инфекции у людей, у которых симптомы проявляются в амбулаторных условиях (в качестве первого шага диагностики), а также у людей, которые контактировали с подтвержденный случай для информирования стратегий TTTI.Тесты RT-PCR (и аналогичные молекулярные тесты) также подходят для этой цели и на данный момент остаются эталоном в таких сценариях. Тем не менее, нехватка средств и возможностей может ограничить их пригодность для подтверждения подозреваемых случаев, особенно когда их количество очень велико. Экспресс-тесты на антигены в местах оказания медицинской помощи представляют собой возможную альтернативу, если нельзя использовать ОТ-ПЦР. (Европейский центр профилактики и контроля заболеваний, 2020 [11]).
Полезность экспресс-тестов на антигены в лечебных учреждениях в стратегиях TTTI проистекает из повышенной скорости и более низких затрат, которые могут перевесить более низкую чувствительность .Модели, которые пытались оценить возможное влияние быстрых тестов на антигены (HAS, 2020 [9]), предполагают, что:
Более низкая чувствительность может быть компенсирована проведением большего количества тестов. Но при чувствительности 70% (см. Вставку 3), количество тестов необходимо увеличить как минимум на 50% .
Более низкая чувствительность может быть компенсирована за счет более быстрого получения результатов. Эффект от этого выигрыша во времени, конечно, будет зависеть от момента времени, в который человек проходит тестирование после появления симптомов (чем ближе к нему, тем сильнее будет воздействие), но получение результата мгновенно (в отличие от 2 дней после прохождения теста) может снизить вероятность передачи примерно на 30% .Это означает, что основная полезность этих тестов может заключаться в том, чтобы пациенты с симптомами вскоре после появления симптомов могли быстрее получить результаты и привести к более быстрой изоляции.
В сумме , если результаты ОТ-ПЦР невозможно получить менее чем за 24-48 часов или количество людей, подлежащих тестированию, превышает возможности ОТ-ПЦР, для быстрого диагностика симптоматических и бессимптомных пациентов в амбулаторных условиях как второй лучший вариант. Учитывая, что чувствительность доступных в настоящее время быстрых тестов на антигены широко варьируется (см. Вставку 3), важно использовать наиболее эффективные тесты на антигены.7
Мониторинг конкретных групп населения
Раннее обнаружение кластеров в некоторых конкретных группах населения будет Ключевым моментом является то, что текущие меры сдерживания и смягчения, включая второй раунд общей изоляции населения в некоторых странах, начнут отменяться. Это может способствовать предотвращению очередного раунда дорогостоящих мер сдерживания, пока вакцина становится доступной в необходимых количествах.
Для мониторинга определенных групп населения, таких как дома престарелых, университеты, школы, компании, или любой группы населения, в которой предполагается возникновение нового кластера инфекций, быстрые тесты на антигены в местах оказания медицинской помощи представляют собой наиболее подходящий инструмент, но может потребоваться повторное тестирование . Во-первых, это связано с тем, что в любое время могут возникнуть новые заражения, что приведет к случайному появлению новых кластеров, поэтому тесты необходимо проводить регулярно, чтобы повысить шансы их обнаружения.Во-вторых, регулярное повторение тестов повышает точность тестирования (см. Вставку 4).
Вставка 4. Преимущества повторного тестированияПри использовании несовершенного теста, т. Е. . со специфичностью или чувствительностью <100%, повторное тестирование может повысить надежность результатов тестирования. Это верно как на индивидуальном, так и на популяционном уровнях.
Повторное тестирование в выбранных группах населения
Невозможно предсказать, когда произойдет интересующее событие, например, новая инфекция или возникновение нового кластера, в данной группе населения.Следовательно, с чисто вероятностной точки зрения повторное тестирование увеличивает шансы обнаружения вируса в момент, когда возникают или только что произошли новые инфекции.
Влияние повторного тестирования на отдельных лицах
Если в результатах теста есть случайные ошибки, повторение теста для одного и того же человека может помочь статистически снизить уровень ошибок. Ошибки, связанные с технической способностью теста точно обнаруживать вирус в образце, останутся, но «точность», связанная со случайными ошибками, будет увеличена.Например, при тестировании инфицированного человека с помощью теста с чувствительностью 71% (см. Вставку 3) существует 29% вероятность того, что тест даст ложноотрицательный результат. Учитывая, что первый результат отрицательный, вероятность того, что тот же тест вернет ложноотрицательный результат при повторном выполнении, составляет всего 8,4% (= 0,29 x 0,29), если эта ошибка является случайной. Третий последовательный тест снизит вероятность до 2,4% (= 0,29 x 0,29 x 0,29). «Случайно» в этом контексте означает, что 29% вероятность ложноотрицательного результата не зависит от последовательных тестов, т.е.е. нет никаких основополагающих характеристик теста или протестированного образца, которые каждый раз приводили бы к тому, что результат был бы истинным или ложным.
Тем не менее, важно иметь в виду, что положительные результаты, полученные в таких обстоятельствах, могут потребовать подтверждения с помощью ОТ-ПЦР. Когда распространенность низкая, большое количество ложных срабатываний может стать серьезной проблемой (см. Вставку 3).
Для некоторых целей, Наблюдение за сточными водами может использоваться для наблюдения за большими группами населения с привязкой к конкретному месту.В настоящее время убедительно продемонстрировано, что люди, инфицированные COVID ‑ 19, выделяют вирус с калом еще до проявления симптомов. Наблюдение за сточными водами домов престарелых, компаний, университетских городков, определенных районов и т. Д. Позволит выявить появление и колебания COVID ‑ 19 с течением времени, возможно, предлагая действенные доказательства для руководства «повторным открытием» или инициирования более интенсивного тестирования.
Тестирование для безопасных авиаперелетов
Экспресс-тесты на антигены все чаще используются в связи с воздушным транспортом , чтобы гарантировать, что только люди с отрицательным результатом тестирования могут путешествовать, и как средство отмены или смягчения требований карантина по прибытии .Однако следует отметить, что авиаперелеты могут увеличить подверженность вирусу, поскольку меры физического дистанцирования могут быть труднодостижимыми. Чтобы совершить полет, необходимо провести время в загруженных зонах аэропортов, таких как линии безопасности и посадки, а также в закрытом пространстве самолета рядом с другими пассажирами в течение нескольких часов, особенно во время дальнемагистральных рейсов. Это также может включать в себя поездки в / из аэропортов на общественном транспорте. Хотя тестирование может помочь снизить риск, оно не может устранить его.Поэтому тестирование необходимо сочетать с другими мерами предосторожности до, во время и после путешествия, чтобы снизить вероятность распространения вируса путешественниками. Это также означает, что логистика надежной стратегии тестирования для авиаперелетов может быть сложной .
До сих пор большинство авиакомпаний просили пассажиров предоставить отрицательный результат теста RT-PCR, сделанный менее чем за 48 часов до полета. Страны также установили требования к тестированию и изоляции для пассажиров, въезжающих на их территорию, включая самоизоляцию или принудительный карантин на определенный период времени по прибытии. Независимо от типа механизмов тестирования, которые могут быть разработаны для повышения безопасности путешествий, период строгой изоляции по прибытии в страны назначения может оставаться необходимым для ограничения распространения вируса, особенно в странах или регионах, которым удалось достичь очень низкого уровня. уровень передачи , как показывает опыт Исландии. Когда 15 июня 2020 года страна вновь открыла свои границы, власти освободили путешественников от двухнедельного карантина, если по прибытии у них был отрицательный результат.Однако случаи заболевания начали расти менее чем через месяц. Три месяца спустя власти пересмотрели свою политику и теперь требуют два теста — один по прибытии, а другой через пять дней с обязательным карантином между ними.
Хотя переход на экспресс-тесты на антигены выглядит привлекательным, в частности потому, что время между прохождением теста и получением результатов сокращается, стратегии тестирования должны оставаться осторожными . Как уже упоминалось, увеличение скорости может не устранить важность нескольких дней самоизоляции при достижении страны назначения.Кроме того, надежная стратегия тестирования, способствующая повышению безопасности путешествий, потребовала бы повторных тестов за несколько дней до поездки с подтверждающей ОТ-ПЦР для получения положительных результатов. Это также потребует, чтобы все пассажиры согласились пройти тестирование, чтобы они ждали результатов перед поездкой и не путешествовали, если результаты окажутся положительными, а вместо этого ушли в изоляцию. Тем, кто путешествует, необходимо провести еще один тест через несколько дней после прибытия , чтобы убедиться, что они не заразились вирусом во время перевозки.Центры США по контролю и профилактике заболеваний (CDC) опубликовали подробное руководство по тестированию в контексте авиаперелетов в ноябре 2020 года (CDC, 2020 [12]). Европейский CDC считает, что экспресс-тесты на антигены не подходят для проверки прибывающих путешественников, чтобы предотвратить занесение или повторное занесение вируса в регионы / страны, достигшие нулевого или очень низкого уровня передачи. В этих ситуациях следует использовать только ОТ-ПЦР, чтобы снизить риск получения ложноотрицательных результатов (Европейский центр профилактики и контроля заболеваний, 2020 [11]).
Есть ли роль общегосударственного тестирования?
Массовые скрининговые кампании среди населения в целом могут показаться привлекательной стратегией для определения мер сдерживания, но связанные с этим проблемы не следует недооценивать, а их эффективность остается неопределенной.
Во-первых, тестирование миллионов людей каждую неделю со всей необходимой до- и постаналитической работой — сложная и трудоемкая задача. Во-вторых, с точки зрения возможностей и стоимости, экспресс-тесты на антигены — единственный работоспособный вариант на данный момент для массового тестирования миллионов людей.Однако их более низкая производительность, о которой говорилось выше, однако, вызывает проблемы . Даже если эффективность экспресс-тестов на антигены со временем улучшится, проблема низкой распространенности среди населения в целом и, следовательно, большого числа ложноположительных результатов останется проблемой (см. Вставку 3). Другими словами, значительная часть (вполне вероятно, более половины) всех «положительных» тестов на самом деле будет ложноположительными. Это рискует подорвать принятие теста — особенно если, что необходимо для эффективности стратегии, ожидается, что люди с положительным результатом теста будут изолировать себя.В масштабе с этим трудно справиться. Это означает, что многие люди столкнутся с ограничениями в своей повседневной жизни, в том числе в отношении их трудоспособности, даже если они не являются переносчиками вируса. Директивным органам необходимо подумать, будет ли общественная поддержка такого сценария достаточной для того, чтобы стратегия стала жизнеспособной. Массовый скрининг эффективен только в том случае, если люди хотят пройти тестирование и если те, кто идентифицирован как положительный изолят, быстро выделяются, и они могут сопротивляться этому, особенно если они сомневаются в достоверности результатов теста.
Некоторые страны уже проводят пилотный скрининг всего населения (см. Вставку 5), но эти инициативы пока не дали неопределенных результатов, а их внедрение оказывается сложным и дорогостоящим. С технологической точки зрения секвенирование следующего поколения (NGS) потенциально может стать подходящим решением в будущем. Но эта технология все еще находится в разработке. NGS предлагает высокочувствительный и специфический метод тестирования с возможностью обеспечения чрезвычайно высокой пропускной способности. Некоторые компании и лаборатории развивают потенциал тестирования COVID ‑ 19 с использованием NGS, который может тестировать до 10 000 образцов за один раз со временем обработки для получения результатов в течение 24–48 часов (Национальные академии наук, инженерии и медицины, 2020 [13] ).
Вставка 5. Тестирование всего населения в Ливерпуле (Соединенное Королевство) и Словацкой РеспубликеПравительство города Ливерпуля в Соединенном Королевстве и национальное правительство Словацкой Республики недавно начали кампании тестирования всего населения.
Ливерпуль
После увеличения заболеваемости COVID ‑ 19 6 ноября 2020 года правительство Ливерпуля инициировало пилотную инициативу по тестированию всего населения города, насчитывающего около 500 000 человек. Цель состоит в том, чтобы оценить, может ли бессимптомное тестирование в масштабах всей популяции помочь выявить больше случаев и разорвать цепочки передачи лучше, чем выявление оппортунистических случаев.Участие является добровольным, и каждый участник получает два теста: ОТ-ПЦР и тест на антиген «бокового потока», результаты которого могут быть получены в течение 1 часа. Тесты RT-LAMP используются для тестирования медицинского персонала. При сравнении с ОТ-ПЦР использованный тест с боковым потоком имел чувствительность 76,8% и специфичность 99,68% (Public Health England and Oxford University, 2020 [7]). Однако было также обнаружено, что он точно определяет 95% людей с высокой вирусной нагрузкой, которые могут быть более заразными, чем другие, и имеют сопоставимую способность обнаруживать вирусные антигены у людей с симптомами и бессимптомных (там же.). Люди могут пройти тестирование дважды в течение двух недель. Всех людей с положительным результатом одного из двух тестов просят самоизолироваться и регистрировать для отслеживания контактов.
По состоянию на 17 ноября пилотный проект еще не был завершен, и около 20% населения прошли тестирование в течение первых 10 дней. Пилотный проект представляет собой серьезную логистическую задачу, в нем задействовано 2 000 военнослужащих в дополнение к местному медицинскому и социальному персоналу. Его также критиковали за то, что оно слишком дорогое для бездоказательной стратегии, и высказывались опасения, что его добровольный характер может привести к тому, что лица, подвергающиеся наибольшему риску, с наименьшей вероятностью явятся на скрининг (Gill and Gray, 2020 [14]).Ранее сообщалось, что соблюдение самоизоляции в Соединенном Королевстве является низким, что вызывает опасения по поводу того, будут ли бессимптомные люди, получившие положительный результат теста в пилотном проекте, соблюдать, чтобы инициатива была эффективной в снижении передачи.
Словацкая Республика
В октябре 2020 года правительство Словацкой Республики выступило с инициативой по проведению экспресс-тестов на антигены для всего населения страны в возрасте от 10 до 65 лет, составляющего примерно 4 миллиона человек.Участие как таковое не было обязательным. Тем не менее, те, кто не участвовал, должны были самоизолироваться в течение 10 дней дома, а люди, неспособные предоставить отрицательный результат теста, если их остановила полиция, могли быть оштрафованы. Люди с положительным результатом теста также должны были самоизолироваться в своих домах или отправиться в общественный карантин на 10 дней.
В первые выходные тестирования, 31 октября и 1 ноября, было протестировано около 3,6 миллиона человек, из которых примерно 1,06% были признаны положительными.Около 2 миллионов человек прошли повторное тестирование в выходные 7 и 8 ноября, из которых 0,6% были признаны положительными.
Зарегистрированная частота новых случаев COVID ‑ 19 существенно снизилась в период с начала до середины ноября 2020 года. Однако, хотя это многообещающе, с начала октября действуют ограничительные меры физического дистанцирования, поэтому невозможно объяснить снижение заболеваемости. заболеваемости в программе тестирования. Инициативу в основном критиковали за то, что она подвергала людей заражению в переполненных центрах тестирования, а также за то, что она слишком ресурсозатратна, но при этом дает неопределенные преимущества (Holt, 2020 [15]).
Ссылки
[1] Carter, L. et al. (2020), «Методы анализа и разработка тестов для диагностики COVID-19», ACS Central Science , Vol. 6/5, стр. 591-605, http://dx.doi.org/10.1021/acscentsci.0c00501.
[12] CDC (2020), Testing and International Air Travel , https://www.cdc.gov/coronavirus/2019-ncov/travelers/testing-air-travel.html.
[8] Кокрановская группа по точности диагностических тестов на COVID-19 (2020), «Экспресс-тесты на антиген в местах оказания медицинской помощи и молекулярные тесты для диагностики инфекции SARS-CoV-2», Кокрановская база данных систематических обзоров , http: // dx.doi.org/10.1002/14651858.cd013705.
[6] Corman, V. et al. (2020), «Сравнение семи коммерческих экспресс-тестов на антиген SARS-CoV-2», medRxiv , http://dx.doi.org/10.1101/2020.11.12.20230292.
[3] Dao Thi, V. et al. (2020), «Колориметрический анализ RT-LAMP и LAMP-секвенирование для обнаружения РНК SARS-CoV-2 в клинических образцах», Science Translational Medicine , Vol. 12/556, с. eabc7075, http://dx.doi.org/10.1126/scitranslmed.abc7075.
[11] Европейский центр профилактики и контроля заболеваний (2020), Варианты использования экспресс-тестов на антиген COVID-19 в ЕС / ЕЭЗ и Великобритании., https://www.ecdc.europa.eu/sites/default/files/documents/Options-use-of-rapid-antigen-tests-for-COVID-19_0.pdf.
[4] Fozouni, P. et al. (2020), Прямое обнаружение SARS-CoV-2 с помощью CRISPR-Cas13a и мобильного телефона , Лаборатория Колд-Спринг-Харбор, http://dx.doi.org/10.1101/2020.09.28.20201947.
[14] Гилл, М. и М. Грей (2020), «Массовое тестирование на covid-19 в Великобритании», BMJ , стр. m4436, http://dx.doi.org/10.1136/bmj.m4436.
[9] HAS (2020), Revue Rapide Sur les tests de detection antigénique du virus SARS-CoV-2 , Haute Autorité de Santé, Paris, https: // www.has-sante.fr/upload/docs/application/pdf/2020-10/synthese_tests_antigeniques_vd.pdf (по состоянию на 10 ноября 2020 г.).
[15] Холт, Э. (2020), «Словакия проверяет всех взрослых на SARS-CoV-2», The Lancet , Vol. 396/10260, стр. 1386-1387, http://dx.doi.org/10.1016/s0140-6736(20)32261-3.
[13] Национальные академии наук, инженерии и медицины (2020), Экспресс-консультация экспертов по критическим вопросам диагностического тестирования пандемии COVID-19 , https: // doi.org / 10.17226 / 25984.
[10] ОЭСР (2020), «Тестирование на COVID-19: способ снятия ограничений содержания» , Политика ОЭСР в ответ на коронавирус (COVID-19) , Издательство ОЭСР, Париж, https: //www.oecd .org / coronavirus / policy-answers / testing-for-covid-19-a-way-to-lift-confinement-sizes-89756248 /.
[7] Общественное здравоохранение Англии и Оксфордский университет (2020 г.), Быстрая оценка устройств обнаружения вирусных антигенов бокового потока (LFD) для массового тестирования в сообществе , Оксфордский университет, Оксфорд, Англия, https: // www.ox.ac.uk/sites/files/oxford/media_wysiwyg/UK rating_PHE Портон-Даунский университет Оксфордского университета_final.pdf (по состоянию на 17 ноября 2020 г.).
[5] Ramachandran, A. et al. (2020), «Управляемая электрическим полем микрофлюидика для быстрой диагностики на основе CRISPR и ее применение для обнаружения SARS-CoV-2», Proceedings of the National Academy of Sciences , p. 202010254, http://dx.doi.org/10.1073/pnas.2010254117.
[2] Томпсон Д. и Й. Лей (2020), «Мини-обзор: недавний прогресс в обнаружении COVID-19 с помощью RT-LAMP», Отчеты по датчикам и исполнительным механизмам , Vol.2/1, стр. 100017, http://dx.doi.org/10.1016/j.snr.2020.100017.
[16] ВОЗ (2020), Обнаружение антигена в диагностике инфекции SARS-CoV-2 с использованием быстрых иммуноанализов , https://www.who.int/publications/i/item/antigen-detection-in -The-Diagnosis-of-sars-cov-2infection-using-Rapid-Immunoassays.
Примечания
← 1. Сокращение от «Кластерные регулярно чередующиеся короткие палиндромные повторы». Подробности смотрите ниже.
← 2. Сокращение от «Изотермическое усиление, опосредованное петлей».Подробности смотрите ниже.
← 3. В традиционной ОТ-ПЦР используются различные циклы нагрева и охлаждения образца.
← 5. Существует два типа тестов на антигены: экспресс-тесты на антигены, которые можно использовать в местах оказания медицинской помощи, и иммуноферментные тесты (ELISA), которые выполняются на автоматизированных устройствах в биологических лабораториях.
← 6. Для сравнения, затраты на тесты ОТ-ПЦР сильно различаются, но обычно превышают 50 долларов США.
← 7. В своем временном руководстве по использованию тестов на антигены ВОЗ рекомендует минимальную чувствительность ≥80% и ≥ 97% специфичность по сравнению с ОТ-ПЦР.См. ВОЗ (2020 [17]).
Ссылки [1] Carter, L. et al. (2020), «Методы анализа и разработка тестов для диагностики COVID-19», ACS Central Science , Vol. 6/5, стр. 591-605, http://dx.doi.org/10.1021/acscentsci.0c00501.Открыть DOI Ссылки [2] Томпсон, Д. и Я. Лей (2020), «Мини-обзор: недавний прогресс в обнаружении COVID-19 с помощью RT-LAMP», Отчеты о датчиках и исполнительных механизмах , Vol. 2/1, стр. 100017, http://dx.doi.org/10.1016/j.snr.2020.100017.
Открыть DOI Ссылки [3] Dao Thi, V. et al. (2020), «Колориметрический анализ RT-LAMP и LAMP-секвенирование для обнаружения РНК SARS-CoV-2 в клинических образцах», Science Translational Medicine , Vol. 12/556, с. eabc7075, http://dx.doi.org/10.1126/scitranslmed.abc7075.
Открыть DOI Ссылки [4] Fozouni, P. et al. (2020), Прямое обнаружение SARS-CoV-2 с помощью CRISPR-Cas13a и мобильного телефона , Лаборатория Колд-Спринг-Харбор, http: // dx.doi.org/10.1101/2020.09.28.20201947.
Открыть DOI Ссылки [5] Ramachandran, A. et al. (2020), «Управляемая электрическим полем микрофлюидика для быстрой диагностики на основе CRISPR и ее применение для обнаружения SARS-CoV-2», Proceedings of the National Academy of Sciences , p. 202010254, http://dx.doi.org/10.1073/pnas.2010254117.
Открыть DOI Ссылки [6] Corman, V. et al. (2020), «Сравнение семи коммерческих экспресс-тестов на антиген SARS-CoV-2», medRxiv , http: // dx.doi.org/10.1101/2020.11.12.20230292.
Открыть DOI Ссылки [7] Общественное здравоохранение Англии и Оксфордский университет (2020 г.), Быстрая оценка устройств обнаружения вирусного антигена (LFD) бокового потока для массового тестирования сообщества , Оксфордский университет, Оксфорд, Англия, https: //www.ox.ac.uk/sites/files/oxford/media_wysiwyg/UK analysis_PHE Портон-Даунский университет Оксфордского университета_final.pdf (по состоянию на 17 ноября 2020 г.).
Открытый URL-адрес Ссылки [8] Кокрановская группа по точности диагностических тестов на COVID-19 (2020), «Экспресс-тесты на антиген в месте оказания медицинской помощи и молекулярные тесты для диагностики инфекции SARS-CoV-2», Кокрановская база данных систематических обзоров , http: // dx.doi.org/10.1002/14651858.cd013705.
Открыть DOI Ссылки [9] HAS (2020), Revue Rapide Sur les tests de detection antigénique du virus SARS-CoV-2 , Haute Autorité de Santé, Paris, https: //www.has-sante. fr / upload / docs / application / pdf / 2020-10 / synthese_tests_antigeniques_vd.pdf (по состоянию на 10 ноября 2020 г.).
Открытый URL-адрес Ссылки [9] HAS (2020), Revue Rapide Sur les tests de detection antigénique du virus SARS-CoV-2 , Haute Autorité de Santé, Paris, https: // www.has-sante.fr/upload/docs/application/pdf/2020-10/synthese_tests_antigeniques_vd.pdf (по состоянию на 10 ноября 2020 г.).
Открытый URL-адрес Ссылки [10] ОЭСР (2020), «Тестирование на COVID-19: способ снятия ограничений, связанных с ограничением свободы» , Политика ОЭСР в ответ на коронавирус (COVID-19) , Издательство ОЭСР, Париж, https: //www.oecd.org/coronavirus/policy-responses/testing-for-covid-19-a-way-to-lift-confinement-restrictions-89756248/.
Открыть DOI Ссылки [11] Европейский центр профилактики и контроля заболеваний (2020), Варианты использования экспресс-тестов на антиген COVID-19 в ЕС / ЕЭЗ и Великобритании., https://www.ecdc.europa.eu/sites/default/files/documents/Options-use-of-rapid-antigen-tests-for-COVID-19_0.pdf.
Открыть DOI Ссылки [9] HAS (2020), Revue Rapide Sur les tests de detection antigénique du virus SARS-CoV-2 , Haute Autorité de Santé, Paris, https: //www.has-sante. fr / upload / docs / application / pdf / 2020-10 / synthese_tests_antigeniques_vd.pdf (по состоянию на 10 ноября 2020 г.).
Открытый URL-адрес Ссылки [12] CDC (2020), Testing and International Air Travel , https: // www.cdc.gov/coronavirus/2019-ncov/travelers/testing-air-travel.html.
Открыть DOI Ссылки [11] Европейский центр профилактики и контроля заболеваний (2020), Варианты использования экспресс-тестов на антиген COVID-19 в ЕС / ЕЭЗ и Великобритании. , https://www.ecdc.europa.eu/sites/default/files/documents/Options-use-of-rapid-antigen-tests-for-COVID-19_0.pdf.
Открыть DOI Ссылки [13] Национальные академии наук, инженерии и медицины (2020), Экспресс-консультация экспертов по критическим вопросам диагностического тестирования пандемии COVID-19 , https: // doi.org / 10.17226 / 25984.
Открыть DOI Ссылки [7] Общественное здравоохранение Англии и Оксфордский университет (2020 г.), Быстрая оценка устройств обнаружения вирусного антигена (LFD) бокового потока для массового тестирования сообщества , Оксфордский университет, Оксфорд, Англия, https: //www.ox.ac.uk/sites/files/oxford/media_wysiwyg/UK analysis_PHE Портон-Даунский университет Оксфордского университета_final.pdf (по состоянию на 17 ноября 2020 г.).
Открытый URL-адрес Ссылки [14] Гилл, М. и М. Грей (2020), «Массовое тестирование на covid-19 в Великобритании», BMJ , стр.m4436, http://dx.doi.org/10.1136/bmj.m4436.
Открыть DOI Ссылки [15] Холт, Э. (2020), «Словакия для тестирования всех взрослых на SARS-CoV-2», The Lancet , Vol. 396/10260, стр. 1386-1387, http://dx.doi.org/10.1016/s0140-6736(20)32261-3.
Открыть DOI Ссылки [16] ВОЗ (2020), Выявление антигена в диагностике инфекции SARS-CoV-2 с использованием быстрых иммуноанализов , https://www.who.int/publications/i/item/ Антиген-обнаружение-в-диагностике-sars-cov-2-инфекции-с использованием-экспресс-иммуноанализа.
Открыть DOI
Уверенное обучение оптимальным решениям
Решения — вездесущий компонент повседневного поведения. Чтобы быть эффективными, они требуют обработки неопределенности, возникающей из-за зашумленной и неоднозначной информации, которую предоставляет среда (1). Это отражается в компромиссе между скоростью и точностью решений. Быстрый выбор основан на небольшом количестве информации и, следовательно, может принести в жертву точность. Напротив, медленный выбор дает больше возможностей для сбора доказательств и, следовательно, с большей вероятностью будет правильным, но более дорогостоящий с точки зрения внимания или усилий, а также потерянного времени и возможностей.Следовательно, для эффективных решений требуется не только механизм для сбора доказательств, но и механизм, запускающий выбор после того, как будет собрано достаточно доказательств. Модели дрейфа-диффузии (или модели принятия решений о диффузии) (DDM) представляют собой широко используемое семейство моделей (2), которое обеспечивает оба механизма. DDM не только удивительно хорошо подходят к поведению человека и животных (3–5), но также, как известно, позволяют достичь оптимальной по Байесу стратегии принятия решений в широком диапазоне обстоятельств (4, 6–10).
DDM предполагают, что частица дрейфует и диффундирует, пока не достигнет одной из двух границ, каждая из которых запускает свой выбор (рис.1 А ). Дрейф частицы отражает чистый избыток свидетельств в пользу одного из двух вариантов. Примером этого является задача движения со случайными точками, в которой направление и согласованность движения задают знак и величину смещения. Стохастическая диффузия частицы отражает неопределенность мгновенных свидетельств и отвечает за изменчивость времени принятия решений и вариантов выбора, широко наблюдаемых при принятии решений людьми и животными (3, 5). Стандартное допущение, лежащее в основе DDM, состоит в том, что шумные мгновенные свидетельства, которые накапливаются с течением времени, одномерны — это абстракция мгновенных свидетельств некоторого стимула, связанных с принятием решения.В действительности, однако, доказательства обычно распределяются по большему количеству входов, таких как нейронная популяция в головном мозге, а не по отдельным нейронам (или парам нейрон / антинейрон; Рис. 1 A ). Более того, мозг априори не знает, как это распределенное кодирование предоставляет информацию о правильности того или иного выбора. Как следствие, ему необходимо научиться интерпретировать активность нейронной популяции на основе успеха или неудачи предыдущего выбора. Как с течением времени можно эффективно усвоить такую интерпретацию, как нормативно, так и механически, является предметом этой работы.
Множество существующих вычислительных моделей того, как люди и животные могут научиться улучшать свои решения на основе обратной связи (например, ссылки 11⇓⇓ – 14), не решают вопрос, который мы задаем, поскольку все они предполагают, что все доказательства для каждого выбора предоставляется сразу, без учета временного аспекта накопления доказательств. Это похоже на эксперименты с фиксированной продолжительностью, в которых время накопления доказательств определяется окружающей средой, а не лицом, принимающим решения. Вместо этого мы рассмотрим более общий и естественный случай, когда время принятия решения находится под контролем лица, принимающего решения.В этой обстановке, обычно изучаемой с использованием парадигм «времени реакции», временное накопление доказательств необходимо рассматривать явно, и, как мы покажем, время, необходимое для накопления этих доказательств, влияет на то, как стратегия принятия решений обновляется после обратной связи. Некоторые модели как для выбора, так и для времени реакции обращались к наличию многомерных входов (например, ссылки 15–17). Однако они обычно предполагали столько же вариантов выбора, сколько входные данные, были скорее механистическими, чем нормативными, и не рассматривали, как интерпретировать входные данные можно изучить.Кроме того, мы расширяем предыдущую работу, рассматривая влияние априорных предубеждений на веру в то, что один вариант более правильный, чем другой, и то, как можно изучить такие предубеждения. Это дает теоретическое понимание того, как предвзятость выбора влияет на принятие оптимальных решений в диффузионных моделях. Кроме того, он поясняет, как разные реализации этого смещения приводят к разным реализациям модели распространения, например, предложенной Хэнксом и др. (18).
Результаты
Оптимальное решение по Байесу с использованием диффузионных моделей.
Стандартный способ (8, 10, 19) интерпретировать диффузионные модели как механистические реализации байесовского оптимального принятия решений состоит в том, чтобы предположить, что в каждом испытании ненаблюдаемое скрытое состояние μ (называемое «скоростью дрейфа» в диффузионных моделях) взятый из априорного распределения μ∼N (0, σμ2) с нулевым средним и дисперсией σμ2. Задача лица, принимающего решение, состоит в том, чтобы сделать вывод о том, является ли это скрытое состояние положительным или отрицательным (например, движение вправо или влево в задаче движения со случайными точками), независимо от его величины (например, движение вправо или влево).g., уровень когерентности точки). Само латентное состояние не наблюдается напрямую, но косвенно передается через поток зашумленных мгновенных свидетельств значений δz1, δz2 ,. . ., которые на каждом небольшом временном шаге размером δt предоставляют независимую и одинаково распределенную зашумленную информацию о μ через δzi | μ∼N (μδt, δt). Здесь мы выбрали единичную дисперсию, масштабированную по δt. Любое изменение масштаба этой дисперсии с помощью дополнительного параметра приведет к глобальному изменению масштаба свидетельства, которое может быть исключено (4, 8, 20), что делает такое изменение масштаба ненужным.
После некоторого времени, когда t≡nδt наблюдал n частей таких свидетельств, δz1: n, апостериорное убеждение лица, принимающего решение о μ, p (μ | δz1: n), оказывается полностью определенным накопленными свидетельствами z ( t) = ∑i = 1nδzi, а время t ( Материалы и методы ). Тогда апостериорная уверенность в том, что μ положительна (например, движение влево), приводит к следующему (8): p (μ≥0 | z (t), t) = ∫0∞p (μ | δz1: n) dμ = Φ (z (t) t + σμ − 2), [1] где Φ (⋅) — кумулятивная функция стандартного гауссиана. Противоположное мнение об отрицательности μ — это просто p (μ <0 | z (t), t) = 1 − p (μ≥0 | z (t), t) (см. Рис.3 А ). Накопленные свидетельства следуют за процессом диффузии, z (t) | μ∼N (μt, t), и, таким образом, могут быть интерпретированы как местоположение дрейфующей и диффундирующей частицы с дрейфом μ и единичной дисперсией диффузии (рис. 1 A ). По формуле 1, апостериорное предположение о μ≥0 составляет> 1/2 для положительного z (t) и <1/2 для отрицательного z (t). Для принятия оптимальных по Байесу решений теория байесовских решений (21) требует, чтобы эти решения выбирались так, чтобы максимизировать ожидаемое связанное вознаграждение (или, более формально, минимизировать ожидаемые убытки).Предполагая, что правильный выбор одинаково полезен, это подразумевает выбор варианта, который считается более правильным. Учитывая вышеупомянутое апостериорное убеждение, это делает y = sign (z (t)) ∈ {−1,1} оптимальным по Байесу выбором, который может быть реализован механически с помощью (возможно, изменяющихся во времени) границ ± θ (t) на z (t), связанный с двумя вариантами. На этих границах апостериорная уверенность в том, что вы сделали правильный выбор, или уверенность в решении (22), затем выражается уравнением. 1 с заменой z (t) на θ (t). Достаточная статистика, z (t) и t, этой апостериорной оценки остается неизменной при введении таких границ принятия решения, что уравнение1 остается в силе даже при наличии этих границ (8). Таким образом, при вышеупомянутых предположениях априорных и доказательных, диффузионные модели реализуют байесовскую оптимальную стратегию принятия решений (см. Рис. 3 B ).
Обратите внимание, что | μ | (то есть отношение сигнал / шум мгновенного свидетельства) контролирует объем информации, предоставляемой о знаке μ, и, следовательно, сложность индивидуальных решений. Таким образом, использованное априорное значение μ∼N (0, σμ2), которое имеет большую массу при малых | μ |, отражает то, что сложность решений варьируется в разных испытаниях и что более сложные решения встречаются чаще, чем более простые.Априорная ширина σμ2 определяет разброс значений μ по испытаниям и, следовательно, общую сложность задачи (большее σμ2 = общая более легкая задача). Мы выбрали гауссовский априор для математического удобства, а также потому, что во многих экспериментах (например, ссылка 20) жесткие испытания проводятся чаще, чем простые, хотя они обычно не используют гауссовские априорные значения. В общем, важным предположением является то, что сложность варьируется в зависимости от испытания, но не совсем то, как это происходит, то есть форма априорного распределения не критична (8).Другой предварительный выбор не изменит качественно наши результаты, но сделает трудным или невозможным получение интерпретируемых выражений в замкнутой форме. Прогнозы модели качественно изменятся, если мы предположим, что сложность фиксирована или известна априори (8), но мы не будем рассматривать этот случай, поскольку это редко, если вообще когда-либо происходит в реальном мире.
Использование входных данных многомерной модели диффузии.
Чтобы расширить модели диффузии до многомерных моментальных свидетельств, мы предполагаем, что им дан k -мерный вектор δxi.Это свидетельство может представлять входные данные от нескольких датчиков или (абстрактную) активность нейрональной популяции (рис. 1 B ). Поскольку активность нейронов в популяции, которая кодирует ограниченную информацию о латентном состоянии μ, вероятно, коррелирует между нейронами (23, 24), мы выбрали статистику мгновенных свидетельств, чтобы также показать такие корреляции ( Материалы и методы ). В общем, мы выбираем эту статистику так, чтобы wTδxi = δzi, где вектор w обозначает k входных весов (в настоящее время предполагается, что они известны).Определяя накопленные свидетельства большой размерности как x (t) = ∑i = 1nδxi, это означает, что z (t) = wTx (t), так что снова является оптимальным по Байесу запускать решения, как только wTx (t) становится равным единице. двух решающих границ ± θ (t). Кроме того, апостериорное представление о μ≥0 аналогично уравнению. 1, задаваемый следующим образом: p (μ≥0 | w, x (t), t) = Φ (wTx∼ (t)), [2] где мы определили ослабленное во времени накопленное свидетельство x∼ (t) = x (t) / t + σμ − 2. Как следствие, уверенность в решении для любого выбора, как и прежде, определяется формулой.2 с заменой wTx∼ (t) на θ (t) / t + σμ − 2. Для не зависящих от времени границ принятия решения, θ (t) = θ, эта достоверность уменьшается со временем (рис. 1 C ), отражая неопределенность относительно μ, и то, что поздний выбор, вероятно, связан с низким μ, что связано с тяжелое испытание и, следовательно, низкая уверенность в принятии решения. Это парадоксальное падение уверенности со временем было ранее описано для диффузионных моделей с одномерными входными данными (8, 25) и является следствием трудности испытания, которая варьируется в зависимости от испытания.В частности, он возникает из-за смеси простых испытаний, связанных с большими | μ | которые приводят к быстрому выбору с высокой степенью достоверности и жестким испытаниям, связанным с малым | μ | которые приводят к медленному и неуверенному выбору. Следовательно, он не зависит от нашего выбора гауссовского априорного значения, но присутствует при любом выборе симметричного априорного значения по сравнению с μ ( SI Приложение ). Доверие остается постоянным с течением времени только тогда, когда сложность фиксирована для испытаний (т.е. μ∈ {−μ0, μ0} для некоторого фиксированного μ0).
Использование обратной связи для определения задних весов.
До сих пор мы предполагали, что лицо, принимающее решение, знает линейные входные веса w, чтобы делать байесовский выбор. Если бы они не были известны, как бы их можно было узнать? Традиционно обучение считалось проблемой оптимизации, в которой лицо, принимающее решения, настраивает некоторые параметры принятия решения (здесь входные веса w), чтобы максимизировать их производительность. Вместо этого мы будем рассматривать это как проблему вывода, в которой лицо, принимающее решение, стремится определить параметры принятия решения, которые наиболее совместимы с предоставленными наблюдениями.Эти два взгляда не обязательно несовместимы. Например, минимизация среднеквадратичной ошибки линейной модели (задача оптимизации) дает то же решение, что и последовательная байесовская линейная регрессия (проблема вывода) (26). Фактически, как мы показываем в Приложении SI , наша проблема обучения также может быть сформулирована как проблема оптимизации. Тем не менее, здесь мы выбираем путь обучения на основе вывода, поскольку он обеспечивает статистическую интерпретацию задействованных величин, что дает дополнительную информацию.В частности, мы фокусируемся на изучении весов, сохраняя при этом границы диффузионной модели фиксированными. Уровень вознаграждения лица, принимающего решения (т. Е. Среднее количество правильных выборов в единицу времени), который мы используем в качестве показателя эффективности, зависит как от весов, так и от выбранных границ решения. Однако, чтобы изолировать проблему обучения весам, мы фиксируем границы так, чтобы конкретный набор оптимальных весов w ∗ максимизировал эту норму вознаграждения. Цель обучения весу — найти эти веса. Обучение весу — это проблема, которую необходимо решить, даже если одновременно будут оптимизированы границы принятия решения.Мы рассмотрели, как лучше всего настроить эти границы в другом месте (8, 27).
Чтобы увидеть, как обучение можно рассматривать как вывод, рассмотрим следующий сценарий. Прежде чем наблюдать какое-либо свидетельство, лицо, принимающее решение, имеет некоторое представление, p (w), о входных весах либо в качестве априорного, либо сформированного из предыдущего опыта. Теперь они наблюдают новое свидетельство, δx1, δx2,… и используют среднее значение веры над весами,
Вероятность p (y ∗ | w, x (t), t) выражает для любого гипотетического вектора весов w вероятность того, что наблюдаемое свидетельство делает y ∗ правильным выбором. Чтобы найти его функциональную форму, предположим, что для известного весового вектора мы показали, что p (μ≥0 | w, x (t), t), заданное уравнением.2 выражает вероятность того, что y = 1 (связанный с μ≥0) является правильным выбором. Следовательно, 1 − p (μ≥0 | w, x (t), t) соответствует вероятности того, что y = −1 (связанный с μ <0) - правильный выбор. Следовательно, он может действовать как указанная выше функция правдоподобия, которая, согласно формуле. 2, задается формулой p (y ∗ | w, x (t), t) = Φ (y ∗ wTx∼ (t)), где мы использовали 1 − Φ (a) = Φ (−a). Таким образом, убеждение лица, принимающего решение, оптимально обновляется после каждого выбора следующим образом: p (w | x (t), t, y ∗) ∝Φ (y ∗ wTx∼ (t)) p (w). [4] Это уравнение обновления требует только знания накопленных свидетельств x (t), времени принятия решения t и обратной связи y ∗, но не зависит от выбранного варианта y и того, как лицо, принимающее решение, пришло к этому выбору.Фактически, лицо, принимающее решение, может делать случайный выбор, независимо от накопленных доказательств, и все же узнавать w в соответствии с приведенным выше уравнением обновления, пока они отслеживают x (t) и t, и подтверждают обратную связь y ∗. Следовательно, обучение и принятие решений не обязательно связаны. Тем не менее, мы предполагаем для всех симуляций, что лица, принимающие решения, принимают решения, используя среднюю оценку
Как в Ур. 4, параметры правдоподобия w являются линейными в пределах кумулятивной функции Гаусса, такие проблемы известны как «пробит-регрессия» и не имеют выражения в закрытой форме для апостериорного распределения. Мы могли бы продолжить выборку из апостериорного метода методом Монте-Карло цепи Маркова, но это не дало бы много информации о различных факторах, которые модулируют изучение апостериорных весов. Вместо этого мы продолжаем вывод аппроксимации этой апостериорной формы в закрытой форме, чтобы обеспечить такое понимание, а также потенциальную механистическую реализацию.
Уверенность контролирует скорость обучения.
Чтобы найти приближение к апостериорной в уравнении. 4, предположим, что априорность задается гауссовым распределением p (w) = N (w | μw, Σw) со средним μw и ковариацией Σw, которая является максимальным распределением энтропии, определяющим среднее значение и ковариацию (28 ). Во-первых, мы исследовали, как знание w с ограниченной уверенностью, заданной Σw, влияет на уверенность в принятии решения. Маргинализация по всем возможным значениям w ( материалов и методов ) привела к тому, что уверенность в выборе будет выражена следующим образом: p (y | x (t), t) = Φ (yμwTx∼1 + x∼TΣwx∼).[5] По сравнению с формулой. 2, уверенность выбора дополнительно ослабляется на Σw. В частности, более высокая неопределенность веса (т.е. общая большая ковариация Σw) приводит к более низкой достоверности решения, как и можно было бы интуитивно ожидать (рис. 1 C ).
Затем мы нашли апостериорную аппроксимацию в замкнутой форме (уравнение 4). При повторном обучении для последовательных решений апостериорное значение весов после предыдущего решения становится предшествующим для нового решения. К сожалению, прямое применение этого принципа привело бы к апостериорному изменению своей функциональной формы после каждого обновления, что сделало бы его трудноразрешимым.Вместо этого мы использовали фильтрацию предполагаемой плотности (ADF) (26, 29), которая устанавливает фиксированную функциональную форму q (w | y ∗, x (t), t) = N (w | μw ∗, Σw ∗) апостериорной плотности — в нашем случае, гауссовский для согласования с априорными, а затем находит апостериорные параметры μw ∗ и Σw ∗, которые делают это приближенное апостериорное наилучшее совпадение с «истинным» апостериорным p (w | y ∗, x (t), t) (уравнение . 4). Выполнение этого сопоставления путем минимизации дивергенции Кульбака – Лейбера KL (p‖q) приводит к апостериорному среднему (30, 31): μw ∗ = μw + ξw1 + x∼TΣwx∼y ∗ Σwx∼, [6] и аналогичное выражение для апостериорной ковариации ( Материалы и методы ).Выбор KL (p‖q) для измерения расстояния между p и q является в некоторой степени произвольным, но имеет полезные свойства, такие как то, что он заставляет первые два момента q совпадать с моментами p ( SI Приложение ). В уравнении. 6, коэффициент ξw модулирует, насколько сильно это среднее обновляется в сторону y ∗ Σwx∼, и оказывается монотонно убывающей функцией уверенности решения (рис. 1 D , Top ; см. Материалы и методы для математической выражение). Для неправильных выборов, для которых достоверность решения p (y ∗ | x (t), t) <1/2, ξw является наибольшим для вариантов, сделанных с высокой степенью уверенности, что способствует значительным корректировкам веса.Для вариантов с низкой степенью достоверности он способствует лишь умеренным корректировкам, в частности, независимо от того, был ли выбор правильным или неправильным. Верный выбор с высокой степенью уверенности приводит к низкому значению ξw и, следовательно, к интуитивно незначительному обновлению стратегии. Обновление апостериорной ковариации следует за аналогичной модуляцией скорости обучения, взвешенной по достоверности ( SI Приложение , рис. S1, и Материалы и методы ).
Уверенность в принятии решения — не единственный фактор, влияющий на скорость обучения в уравнении.6. Например, x∼ сокращается для более длинных и менее достоверных вариантов выбора (потому что оно обратно пропорционально времени) и приводит в целом к меньшему обучению. Менее определенные веса, связанные с большими величинами Σw, имеют аналогичный эффект. Чтобы исследовать общее влияние всех этих факторов в совокупности на скорость обучения, мы смоделировали длинную последовательность последовательных выборов и построили график скорости обучения для случайного подмножества этих испытаний в зависимости от достоверности решения (рис. 1 D , Bottom ).Этот график показал небольшое снижение скорости обучения для вариантов с низкой достоверностью по сравнению с ξw, но оставил общую зависимость от ξw без изменений.
Сравнение производительности с оптимальным выводом и более простой эвристикой.
Интуиция, обеспечиваемая почти оптимальным обучением ADF, является информативной только в том случае, если ее приближения не вызывают значительного падения производительности. Мы количественно оценили это падение, сравнив производительность ADF с характеристиками оптимального правила Байеса, как было обнаружено с помощью выборки Гиббса ( Материалы и методы ).Выборка Гиббса является биологически неправдоподобной, поскольку она требует полной памяти входных данных и обратной связи для прошлых решений и не поддается обработке для более длительных последовательностей решений, но, тем не менее, обеспечивает оптимальную базовую линию для сравнения. Кроме того, мы проверили производительность двух дополнительных приближений. Одним из них был вариант ADF, который предполагает диагональную ковариационную матрицу Σw, дающую локальное правило обучения, которое может быть реализовано нервной системой. Этот вариант, кроме того, уменьшил количество параметров с квадратичных до линейных по размеру w.Вторым было разложение логарифмически-апостериорного логарифма Тейлора второго порядка, что привело к правилу обучения, аналогичному ADF, но с меньшим влиянием неопределенности веса на скорость обучения ( Материалы и методы ).
Кроме того, мы проверили, может ли более простая эвристика обучения соответствовать производительности ADF. Мы сосредоточились на трех правилах возрастающей сложности. Дельта-правило, которое можно рассматривать как вариант обучения с разницей во времени или обучения с подкреплением (32), обновляет свою оценку веса после n-го решения следующим образом: wn + 1 = wn + α2θ (0) (yn ∗ θ ( t) −xn (t) Twn) xn (t), [7] где yn ∗ ∈ {−1,1} — это обратная связь о правильном выборе, предоставленная после этого решения, и мы решили нормализовать скорость обучения α следующим образом: начальная высота границы θ (0), чтобы сделать ее менее чувствительной к выбранной высоте.Поскольку решения инициируются на одной из двух границ, xn (t) Twn∈ {−θ (t), θ (t)}, невязка в скобках равна нулю для правильного выбора и ± 2θ (t) для неправильного выбора. В результате, в отличие от ADF, корректировка веса выполняется только после неправильного выбора и с фиксированной скоростью обучения α, а не с модуляцией по достоверности (рис. 1 D , справа ). Наше моделирование показало, что дельта-правило чрезмерно и неоптимально уменьшает размер веса ‖w‖ с течением времени, что приводит к нереалистично длительному времени реакции и столь же нереалистичным почти нулевым весам.Чтобы противодействовать этой проблеме, мы разработали нормализованное правило дельты, которое обновляет оценки веса как правило дельты, но затем нормализует их на w ← w‖w * ‖ / ‖w‖, чтобы гарантировать, что его размер соответствует размеру истинных весов w ∗. Доступ к этим истинным весам w ∗ делает его правилом всезнающего обучения, которое не может быть реализовано лицом, принимающим решения, на практике. Наконец, мы протестировали правило обучения, которое выполняет стохастическое градиентное восхождение на логарифмической вероятности обратной связи: wn + 1 = wn + α∇wlogp (yn ∗ | wn, xn (t), t) = wn + αyn ∗ ξwx∼n (t).[8] Это правило вводит взвешивание достоверности решения через ξw, но отличается от ADF тем, что не принимает во внимание неопределенность веса (Σw в ADF) и требует настройки параметра скорости обучения α.
Мы оценили эффективность этих правил обучения, моделируя обучение с отягощениями для 1000 последовательных решений (называемых «испытаниями»; подробности см. В «Материалы и методы» ) в задаче, в которой использование оптимального вектора веса максимизирует вознаграждение. Эта ставка вознаграждения представляла собой среднее вознаграждение за правильный выбор за вычетом некоторых небольших затрат на сбор доказательств в течение среднего времени в последовательных испытаниях, и это показатель, который, как мы ожидаем, будут оптимизировать лица, принимающие рациональные решения.Для каждого правила обучения мы нашли его коэффициент вознаграждения относительно случайного поведения и оптимального выбора.
Рис. 2 A показывает эту относительную ставку вознаграждения для всех правил обучения и различного количества входов. Как можно видеть, производительность ADF и других правил вероятностного обучения неотличима от обучения оптимальному весу по Байесу для всех проверенных чисел входных данных. Удивительно, но вариант ADF, который игнорирует записи недиагональной ковариации, даже превосходит оптимальное по Байесу обучение для большого количества входных данных (рис.2 A , желтая линия на 50 входов). Причина, по которой более простое правило обучения может превзойти правило, которое считается оптимальным байесовской теорией принятия решений, заключается в том, что это более простое правило имеет меньше параметров и более простую базовую модель, которая, тем не менее, была достаточно хороша для изучения требуемых весов. Изучение меньшего количества параметров с теми же данными привело к изначально более точным оценкам параметров и лучшей связанной производительности. Концептуально это похоже на то, что линейная модель превосходит квадратичную модель при подборе квадратичной функции, если доступно мало данных и если функция достаточно близка к линейной (как показано в приложении SI , рис.S2). Когда будут доступны больше данных, квадратичная модель превзойдет линейную. Точно так же оптимальное по Байесу правило обучения превосходит более простое, если наблюдается еще одна обратная связь. Однако в нашем моделировании этого не происходит в пределах 1000 смоделированных испытаний.
Рис. 2.Входное обучение веса и отслеживание эффективности различных обучающих правил. На всех графиках показана относительная ставка вознаграждения (0 = немедленный, случайный выбор; 1 = оптимальный), усредненная по 5000 моделированиям с различными истинными базовыми весами и для 2 ( верхних ) и 50 ( нижних ) входных данных.( A ) Относительная ставка вознаграждения за вероятностные и эвристические правила обучения. Вероятностные правила обучения включают в себя оптимальное правило (выборка Гиббса), фильтрация предполагаемой плотности (ADF), ADF с диагональной ковариационной матрицей (ADF [diag]) и правило обучения, основанное на разложении логарифмически-апостериорного логарифма Тейлора второго порядка. (Опыт Тейлора). Как для 2, так и для 50 входов все правила работают примерно одинаково. Для эвристических правил разные оттенки цвета указывают на разную скорость обучения. Показанная начальная производительность — это то, что после первого применения правила обучения, так что начальные показатели могут отличаться в зависимости от правил обучения.( B ) Устойчивая производительность при различных скоростях обучения эвристических правил. Производительность в установившемся режиме измерялась как среднее значение по 5000 моделированиям, среднее значение по последним 100 из 1000 смоделированных испытаний, в которых истинные веса медленно меняются в последовательных испытаниях. Оптимальная относительная ставка вознаграждения, равная 1, соответствует знанию истинного веса в каждом испытании, что из-за изменения веса недостижимо в этой настройке. Цветовая схема такая же, как в A , но вертикальная ось имеет другой масштаб.Правило дельты не сходилось и не было включено в B .
Все остальные обучающие эвристики работали значительно хуже. Для низкоразмерных входных данных правило дельты изначально улучшало коэффициент вознаграждения, но на более позднем этапе снова ухудшает его во всех скоростях обучения. Нормализованное дельта-правило избегало таких падений производительности для низкоразмерных входных данных, но оба варианта дельта-правила не могли справиться с многомерными входами. Только стохастический градиентный подъем по логарифмической вероятности обеспечил стабильную эвристику обучения для входных данных большой размерности, но с обратной стороной необходимости выбора скорости обучения.Небольшая скорость обучения приводит к медленному обучению и связанному с этим более медленному снижению угловой ошибки. В целом, вероятностные правила обучения значительно превзошли все протестированные эвристические правила обучения и сопоставили (а в одном случае даже превзошли) эффективность обучения весу байесовской оптимальной оценки.
Отслеживание нестационарных входных весов.
До сих пор мы проверили, насколько хорошо наше правило обучения весу может определять истинные, лежащие в основе веса, на основе двоичной обратной связи о правильности выбора, сделанного лицом, принимающим решения.Для этого мы предположили, что истинные веса оставались неизменными для всех решений. Что произойдет, если эти веса будут медленно меняться с течением времени? Такой сценарий может иметь место, если, например, мир вокруг нас изменяется медленно, или если нейронное представление этого мира изменяется медленно из-за нейронной пластичности или чего-то подобного. В этом случае истинные веса станут движущейся целью, которую мы никогда не сможем точно изучить. Вместо этого мы должны были бы после некоторого начального переходного процесса ожидать достижения стабильной производительности, которая остается примерно постоянной при последовательных решениях.Мы сравнили эту установившуюся производительность байесовского оптимального обучения (теперь реализуемого фильтром частиц) с вероятностными и эвристическими правилами обучения, представленными в предыдущем разделе. Вероятностные правила были обновлены, чтобы учесть такое изменение веса от испытания к опыту, которое моделируется с помощью процесса авторегрессии первого порядка ( Материалы и методы ). Эвристические правила остались неизменными, поскольку их использование постоянной скорости обучения уже инкапсулирует предположение, что истинные веса меняются в зависимости от решений.
Рис. 2 B иллюстрирует эффективность различных правил обучения. Во-первых, он показывает, что для входных данных низкой размерности различные вероятностные модели дают сравнимую производительность, но для входных данных высокой размерности приближенные правила вероятностного обучения превосходят оптимальное обучение по Байесу. В последнем случае эти приближения не были на самом деле вредными, но вместо этого были полезными по той же причине, о которой говорилось выше. В частности, более нейрореалистичный вариант ADF, который отслеживал только диагональ ковариационной матрицы, снова превзошел все другие вероятностные модели.Во-вторых, только эвристическое правило обучения, которое выполняло градиентное восхождение на логарифмической вероятности, достигло установившейся производительности, сравнимой с приблизительными вероятностными правилами, и то только для высокой входной размерности и конкретного выбора скорости обучения. Это не должно вызывать удивления, поскольку при использовании функции правдоподобия вводится больше информации о структуре задачи, чем при использовании других эвристик. Правило дельты не сходилось и, следовательно, никогда не достигало стабильной производительности. В целом вариант ADF, ориентированный только на диагональную ковариационную матрицу, показал наилучшую общую производительность.
Изучение весов и предварительного смещения в скрытом состоянии.
Наше правило обучения можно обобщить для изучения предшествующих смещений в дополнение к входным весам. Априор, который мы использовали до сих пор для скрытой переменной, μ∼N (0, σμ2), несмещен, поскольку и μ≥0, и μ <0 равновероятны. Чтобы ввести априорное смещение, мы вместо этого использовали μ∼N (m, σμ2), где m управляет смещением через P + ≡p (μ≥0) = Φ (m / σμ). Положительное (или отрицательное) значение m вызывает P +> 1/2 (или <1/2), что делает y = 1 (или y = −1) более вероятным правильным выбором даже до того, как будет накоплено свидетельство.После накопления доказательств такой априорный результат дает апостериор: p (μ≥0 | w, x (t), t) = Φ (wTx (t) + σμ − 2mt + σμ − 2). [9] Сравнивая это с несмещенная апостериорная, уравнение. 2, выявляет дополнительный член σμ − 2m, относительное влияние которого со временем ослабевает.
Этот дополнительный термин имеет два последствия. Во-первых, добавление элементов m и σμ − 2 к векторам w и x (t), соответственно, показывает, что w и m могут быть изучены совместно с помощью того же правила обучения, которое мы вывели ранее ( Материалы и методы ).Во-вторых, этот термин требует от нас переосмысления связи между границами решений и выбором. Как показано на рис. 3 C , такой априор вызывает неизменный во времени сдвиг в ассоциации между накопленными доказательствами, z (t) = wTx (t), и апостериорным убеждением μ≥0 и соответствующей достоверностью решения. Этот сдвиг позволяет иметь один и тот же байесовский оптимальный выбор на обеих границах принятия решения (рис. 3 C , синие / красные области принятия решений). Следовательно, мы утратили удобную с механической точки зрения уникальную связь между границами принятия решений и вариантами выбора.Мы восстанавливаем эту связь с помощью сдвига счетчика границ, так что эти границы оказываются на тех же уровнях достоверности решения для противоположных выборов, делая их асимметричными вокруг z = 0. Математически это эквивалентно смещению начальной точки накопления доказательств, z∼ (0), от нуля в противоположном направлении [Рис. 3 C , сдвиг на C1 (P +) = σμ − 2m; SI Приложение ]. Следовательно, априорное смещение реализуется посредством зависимого от смещения простого сдвига начальной точки накопления, что приводит к механистически простой реализации байесовского оптимального принятия решений со смещенными априорными значениями.
Рис. 3.Доверие к решению, предшествующие предубеждения и связь между границей решения и выбором. ( A ) Для несмещенного априорного значения [т.е. P + ≡p (μ≥0) = 1/2] достоверность решения (цветовой градиент) симметрична относительно z = 0 для каждого фиксированного времени t. Соответствующее апостериорное убеждение p (μ≥0 | z (t), t) (числа над / под меткой оси «время»; постоянное вдоль белых линий; ½ вдоль голубой линии) способствует выбору y = 1 и y = −1 выше. (синяя область в B ) и ниже (красная область в B ) z = 0.( B ) В результате различные варианты выбора являются оптимальными по Байесу на синих / красных границах принятия решений, если они разделены z = 0, независимо от разделения границ (сплошная или пунктирная синяя красная линия). ( C ) Если априор смещен из-за общего сдвига, достоверность решения сдвигается на одну и ту же константу по всем t. В этом случае обе границы решения могут способствовать одному и тому же выбору, которому можно противодействовать неизменным во времени сдвигом z на C1 (P +). ( D ) Если априор смещен за счет усиления одной стороны при подавлении другой, сдвиг достоверности решения становится зависимым от времени, так что оптимальный выбор на неизменной во времени границе может со временем измениться.Противодействие этому эффекту требует зависящего от времени сдвига z на C2 (P +, t). Как в C , так и в B мы выбрали P + = 0,6 для иллюстрации.
Следствием смещения начальной точки накопления является то, что для некоторого фиксированного времени принятия решения t достоверность решения на обеих границах одинакова (рис. 3 C , справа ). Это кажется противоречащим интуиции о том, что предвзятый априор должен смещать уверенность в принятии решения в пользу более вероятного варианта.Однако этот механизм в конечном итоге присваивает более вероятный вариант более высокой средней достоверности из-за времени реакции. Поскольку начальная точка теперь находится дальше от менее вероятной правильной границы, в среднем потребуется больше времени, чтобы достичь этой границы, что снижает достоверность решения, поскольку достоверность уменьшается с истекшим временем. Следовательно, даже несмотря на то, что достоверность решения на обеих границах одинакова для данного времени принятия решения, в среднем по времени принятия решения она будет ниже для априори нежелательной границы, добросовестно реализуя это предварительное решение (см. SI Приложение для математической демонстрации) .
Наш вывод о том, что простой сдвиг в начальной точке накопления является оптимальной по Байесу стратегией, противоречит предыдущей работе, в которой предполагалось, что оптимальный сдвиг переменной накопителя z (t) изменяется со временем (18). Это различие проистекает из другой реализации смещения. Несмотря на то, что мы выбрали общий сдвиг априорной величины по ее среднему значению (рис. 3 C ), альтернативная реализация состоит в умножении p (μ≥0) на P + и p (μ <0) на 1 − P + (рис. . 3 D ), что опять же приводит к P + = p (μ≥0).Следствием этого различия является то, что связанный сдвиг апостериорного убеждения μ≥0 в пространстве накопления свидетельств становится зависимым от времени. Тогда оптимальный выбор на неизменной во времени границе в этом пространстве может измениться со временем (рис. 3 D ). Более того, отмена этого сдвига для восстановления уникальной связи между границами и вариантами выбора требует не только сдвинутой начальной точки накопления, но дополнительно зависящего от времени аддитивного сигнала [C2 (P +, t) на рис. 3 D ; SI Приложение ], как было предложено в исх.18. Какой из двух подходов является более адекватным, зависит от того, насколько хорошо он соответствует предшествующему, подразумеваемому в дизайне задачи. Наш подход имеет преимущество в более простой механистической реализации, а также в простом расширении ранее полученного правила обучения. Как узнать априорные предубеждения в рамках исх. 18 остается неясным (но см. Ссылку 33).
Последовательные зависимости выбора из-за непрерывного отслеживания веса.
В повседневных ситуациях нет двух решений, которые принимаются при одинаковых обстоятельствах.Тем не менее, мы должны уметь извлекать уроки из прошлых выборов, чтобы улучшить будущие. Распространено предположение, что прошлые выборы со временем становятся все менее информативными для будущих. Один из способов выразить это формально — предположить, что мир медленно меняется с течением времени, и что наша цель — отслеживать эти изменения. Под «медленным» мы подразумеваем, что можем считать его постоянным в течение одного испытания, но нестабильным в течение часового сеанса. Мы реализовали такое отслеживание движущегося мира, как на рис.2 B , путем постепенного изменения данных, отображающих весовые коэффициенты, для принятия решений. С такими постоянно меняющимися весами обучение весу никогда не заканчивается. Скорее, входные веса постоянно корректируются, чтобы сделать правильный выбор более вероятным в ближайшем будущем. После правильного выбора это означает, что веса будут скорректированы для повторения того же выбора при наблюдении аналогичных входных данных в будущем. После неправильного выбора цель состоит в том, чтобы отрегулировать веса, чтобы вместо этого выполнить противоположный выбор.Наша модель предсказывает, что после легкого правильного выбора, при котором можно ожидать высокой уверенности, корректировки веса будут ниже, чем после жесткого правильного выбора (Рис. 1 D , Top , зеленая линия). Как следствие, мы ожидаем, что модель будет с большей вероятностью повторять один и тот же выбор после правильных и трудных испытаний, чем после правильных и простых испытаний.
Чтобы проверить это предсказание, мы использовали ту же симуляцию, чтобы сгенерировать Рис. 2 B , чтобы измерить, насколько вероятно, что модель повторяет тот же выбор после правильных решений.Рис. 4 A иллюстрирует, что эта систематическая ошибка повторения проявляется в сдвиге психометрической кривой, что увеличивает вероятность повторения предыдущего выбора. Кроме того, как и было предсказано, этот сдвиг модулируется сложностью предыдущего выбора и сильнее, если предыдущий выбор был легким (т. Е. Связан с большим | μ |; рис. 4 B ). Следовательно, если лицо, принимающее решения, ожидает действовать в нестабильном, медленно меняющемся мире, наша модель предсказывает предвзятость повторения, чтобы повторять один и тот же выбор после правильных решений, и что эта предвзятость сильнее, если предыдущий выбор был легким.
Рис. 4.Зависимости последовательного выбора из-за непрерывного обучения и эффектов зашумленной обратной связи. Оптимальное по Байесу обучение в медленно меняющейся среде предсказывает зависимости последовательного выбора по следующему шаблону. ( A ) После жесткого правильного выбора (низкое пред. | Μ |; светлые цвета) психометрическая кривая смещается в сторону повторения того же выбора (синий / красный = выбор y = 1 / -1). Этот сдвиг уменьшается после более легкого и правильного выбора (высокое пред. | Μ |; темные цвета). ( B ) Мы суммируем эти сдвиги кривой настройки в смещении повторения, которое представляет собой вероятность повторения того же выбора для стимула μ = 0 (например, зеленая стрелка для μ = -0.38 в А ). После правильного / неправильного выбора (зеленая / красная кривая) это приводит к стратегии перехода на выигрыш-остаться / проиграть. В A показана только стратегия «выигрывай — оставайся». ( C ) Если обратная связь о выборе зашумлена (инвертирована с вероятностью β), скорость обучения в целом становится ниже. В частности, для вариантов с высокой степенью уверенности с «неправильной» обратной связью скорость обучения становится нулевой, поскольку учащиеся доверяют своему выбору больше, чем обратной связи.
Ненадежная обратная связь снижает обучаемость.
Что произойдет, если обратная связь о выборе окажется не совсем надежной? Например, обратная связь сама по себе может быть не полностью достоверной или сложной для интерпретации. Мы смоделировали эту ситуацию, предположив, что обратная связь инвертируется с вероятностью β. Здесь β = 0 означает предполагаемую до сих пор совершенно надежную обратную связь, а β = 1/2 делает обратную связь совершенно неинформативной. Это изменение влияет на то, как уверенность в принятии решения модулирует скорость обучения (рис. 4 C ) следующим образом. Во-первых, это уменьшает общую величину коррекции с более слабым обучением для более высокого шума обратной связи.Во-вторых, это приводит к тому, что мы не можем научиться делать очень уверенные выборы, которые, как нам говорят, неверны. В этом случае уверенность в решении перевешивает ненадежную обратную связь. Это резко контрастирует с оптимальным правилом обучения для абсолютно надежной обратной связи, и в этом случае должно произойти сильнейшее изменение текущей стратегии.
Обсуждение
Модели диффузии применимы к модельным решениям, которые требуют некоторого накопления доказательств с течением времени, что почти всегда имеет место в естественных решениях.Мы расширили предыдущую работу над нормативными основами этих моделей на более реалистичные ситуации, в которых сенсорные свидетельства кодируются популяцией нейронов, а не двумя нейронами, как обычно предполагалось в предыдущих исследованиях. Мы сосредоточились на нормативных и механистических моделях для обучения весов от сенсорных нейронов к интегратору решений без дополнительной корректировки границ решения, поскольку изучение весов — это проблема, которую необходимо решить, даже если границы принятия решений оптимизированы одновременно.
С байесовской точки зрения, обучение весу соответствует нахождению веса апостериорно с учетом предоставленной обратной связи и привело к приближенному правилу обучения, скорость обучения которого сильно модулировалась достоверностью решения. Он подавлял обучение после правильных решений с высокой степенью достоверности, поддерживал обучение неопределенным решениям независимо от их правильности и способствовал сильному изменению весов комбинации после ошибочных решений, которые были приняты с высокой степенью уверенности (рис.1 D ). Доказательства такого обучения, основанного на уверенности, уже были обнаружены в экспериментах на людях (34), но не в задаче, которая требовала временного накопления доказательств в отдельных испытаниях. В самом деле, как мы ранее предполагали (22), такая модуляция посредством уверенности в решении должна возникать во всех сценариях байесовского обучения в задачах N -AFC, в которых лицо, принимающее решения, получает только обратную связь о правильности своего выбора, а не о том, сказал, какой выбор был бы правильным.В рассмотренной нами задаче 2-AFC сообщение о том, что один выбор был неправильным, автоматически показывает, что другой выбор был правильным, что приводит к совпадению двух случаев. Переход от одномерных к многомерным входам требует выполнения накопления свидетельств для каждого входного измерения отдельно [Рис. 1 B ; Уравнения. 6 и 12 требуют x (t), а не только wTx (t)], даже если для запуска выбора требуется только линейная комбинация x (t). Это связано с тем, что неопределенные входные веса требуют отслеживания того, как каждое входное измерение способствовало пересечению частицей границы решения, чтобы правильно улучшить эти веса при обратной связи (т.е., правильное присвоение кредита). Предсказанное нашей работой многомерное накопление свидетельств возникает естественным образом, если входные данные кодируют полные распределения по релевантным для задачи переменным, например, в линейных вероятностных кодах совокупности (35), которые запускают решения, ограничивая объединенную активность всех единиц, которые представляют накопленные свидетельства (36). ).
Непрерывное изучение веса предсказывает зависимости последовательного выбора, которые делают повторение предыдущего правильного выбора более вероятным, особенно если этот выбор был трудным (рис.4). Таким образом, исходя из предположения о нестабильной среде, которая способствует постоянной корректировке стратегии принятия решений, мы обеспечиваем рациональное объяснение зависимостей последовательного выбора, которые часто наблюдаются как у людей, так и у животных (например, ссылки 37 и 38). У грызунов, принимающих решения в ответ на обонятельные сигналы, мы, кроме того, подтвердили, что эти последовательные зависимости модулируются трудностью выбора, и что точный образец этой модуляции зависит от статистики стимула, как предсказывает наша теория (39) (но согласованность с исх.40 неясно).
Наконец, мы выяснили, как предшествующие предубеждения должны влиять на принятие байесовских решений в диффузионных моделях. Расширяя работу Hanks et al. (18) мы продемонстрировали, что точные механизмы обработки этих предубеждений зависят от специфики того, как эти предубеждения вводятся в процессе разработки задачи. В частности, мы предложили вариант, который упрощает эти механизмы и изучение этой предвзятости. Этот вариант предсказывает, что смещение накопления доказательств, которое ранее предполагалось как зависящее от времени, станет независимым от времени, и было бы интересно посмотреть, будет ли латеральная интрапериетальная активность коры головного мозга обезьян, выполняющих задачу движения случайных точек, как записано Хэнксом и др.(но см. ссылку 41), соответственно изменится.
Материалы и методы
Здесь мы даем краткое описание структуры и ее результатов. Подробные выводы приведены в Приложении SI .
Байесовский процесс принятия решений с использованием одномерных и многомерных моделей диффузии.
Мы предполагаем, что латентное состояние берется из μ∼N (m, σμ2), а мгновенное свидетельство на каждом временном шаге δt предоставляет информацию об этом скрытом состоянии посредством δzi | μ∼N (μδt, δt). Цель состоит в том, чтобы вывести знак μ и выбрать y = 1, если μ≥0, и y = −1 в противном случае.После наблюдения этого свидетельства в течение некоторого времени t≡nδt, апостериорный μ с учетом всех наблюдаемых свидетельств δz1: n определяется правилом Байеса следующим образом: p (μ | δz1: n) ∝N (μ | m, σμ2) ∏ i = 1nN (δzi | μδt, δt) ∝N (μ | σμ − 2m + z (t) σμ − 2 + t, 1σμ − 2 + t). [11]
Выше все пропорциональности относятся к μ, и мы определили z (t) = ∑i = 1nδzi и использовали t = ∑i = 1nδt. Как найти апостериорное убеждение для знака μ’s при m = 0 описано в формуле. 1.
Мы расширяем модели диффузии на многомерные входные данные с мгновенными доказательствами δxi | μ, w∼N ((aμ + b) δt, Σδt), где a, b и Σ выбираются таким образом, что wTx (t) | μ = z (t) | μ∼N (μt, t), как и раньше.Апостериорная по μ и μ≥0 такая же, как и для одномерного случая, с заменой z (t) на wTx (t). Определяя x∼ (t) = x (t) / σμ − 2 + t, находим p (μ≥0 | w, x (t), t) = Φ (wTx∼ (t)). Поскольку y = 1 и y = −1 соответствуют μ≥0 и μ <0, а y = 1 выбирается, только если p (μ≥0 | w, x (t), t) ≥1 / 2, достоверность решения при m = 0 на некоторой границе wTx (t) = ± θ (t) задается формулой Φ (θ (t) / σμ − 2 + t). Если входные веса неизвестны, и лицо, принимающее решение, полагает, что w∼N (μw, Σw) об этих весах, достоверность решения должна дополнительно учитывать неопределенность веса путем маргинализации по w, что приводит к уравнению.5.
Вероятностно-эвристические правила обучения.
Мы находим приблизительную апостериорную q (w) = N (w | μw ∗, Σw ∗), которая аппроксимирует целевую апостериорную p Eq. 4 пользователя ADF. Это требует минимизации расходимости Кульбака – Лейбера KL (p | q) (26, 29), что приводит к формуле. 6 для апостериорного среднего и следующего: Σw ∗ = Σw + ξcov (γ) ((Σw − 1 + x∼x∼T) −1 − Σw), [12]
с модуляторами скорости обучения ξw (γ) = N (γ | 0,1) / Φ (γ) и ξcov (γ) = ξw (γ) 2 + ξw (γ) γ, и где мы определили γ≡y ∗ μwTx∼ / 1 + x∼TΣwx∼ , которая монотонна в уверенности решения (ур.5). Шумная обратная связь выбора (рис. 4 C ) изменяет вероятность предположить обратную обратную связь с вероятностью β, и следуйте той же процедуре, что и выше, для получения апостериорных моментов ( SI Приложение ). Вариант ADF, который отслеживает только диагональные элементы ковариации, предполагает, что Σw диагонален, и вычисляет только диагональные элементы Σw ∗. Разложение Тейлора второго порядка журнала уравнения 4 приводит к обновлению уравнений, аналогичных уравнениям. 6 и 12, но без нормировки по неопределенности веса (подробности см. В Приложении SI ).Все правила эвристического обучения описаны в основном тексте.
Мы смоделировали нестационарные входные веса как wn | wn − 1∼N (Awn − 1 + b, Σd) после решения в испытании n − 1. Этот переход веса учитывается правилами вероятностного обучения путем установки априорных значений параметра равными μw, n = Aμw, n − 1 ∗ + b и Σw, n = AΣw, n − 1 ∗ AT + Σd. Для стационарных весов A = I, b = 0 и Σd = 0.
Байесовский оптимальный весовой вывод был сделан для стационарных весов, выполненных с помощью выборки Гиббса для пробит-моделей, и для нестационарных весов с помощью фильтрации частиц ( SI Приложение ).
Детали моделирования.
Мы использовали параметры a = w / ‖w‖2 и b = 0 для мгновенного доказательства δx. Его ковариация Σ была сгенерирована, чтобы иметь собственные значения, которые экспоненциально падают от σx2 = 2 / ‖w‖2 до нуля, пока не достигнет постоянной базовой линии шума σ02 = 0,001 / ‖w‖2, что качественно наблюдается в нейронных популяциях. Он дополнительно содержит собственный вектор w с собственным значением, установленным, чтобы гарантировать wTΣw = 1, ограничивая информацию, которую δx предоставляет о μ. Для нестационарных весов все параметры моментального свидетельства корректируются после каждого изменения веса ( SI Приложение ).Границы диффузионной модели ± θ не зависели от времени и были настроены так, чтобы максимизировать вознаграждение при использовании правильных весов. Ставка вознаграждения определяется выражением (p (правильно) −caccumt) / (titi + t), где средние значения были по испытаниям, и мы использовали затраты на накопление доказательств caccum = 0,01 и интервал между испытаниями titi = 2 с. Мы использовали σμ2 = 32, чтобы нарисовать μ в каждом испытании, и вывели w из w∼N (1, I) перед каждой пробной последовательностью. Для нестационарных весов мы повторно выбирали веса после каждого испытания в соответствии с wn | wn − 1∼N (λwn − 1 + (1 − λ), σd2I) с коэффициентом убывания λ = 1−0.01 и σd2 = 1-λ2 для достижения устойчивого среднего значения 1 и тождественной ковариации.
Чтобы сравнить эффективность обучения с отягощениями ADF с альтернативными моделями (рис. 2 A ), мы смоделировали 1000 обучающих испытаний 5000 раз и сообщили уровень вознаграждения за каждое испытание, усредненный по этим 5000 повторениям. Чтобы оценить стабильную производительность (рис. 2 B ), мы выполнили ту же процедуру с нестационарными весами и сообщили о среднем уровне вознаграждения за последние 100 испытаний и более 5000 повторений.Те же 100 испытаний были использованы для вычисления зависимостей последовательного выбора на рис. 4 A и B . Чтобы смоделировать принятие решений с помощью диффузионных моделей и неопределенных весов, мы использовали текущую среднюю оценку
Оптимально или нет; зависит от задачи
Annis, J., Evans, N.J., Miller, B.J., & Palmeri, T.J. (2018). Термодинамическая интеграция и методы отбора проб для оценки байесовских факторов: учебное пособие. Получено с сайта psyarxiv.com/r8sgn.
Balci, F., Simen, P., Niyogi, R., Saxe, A., Hughes, J.A., Холмс П. и Коэн Дж. Д. (2011). Приобретение критериев принятия решений: уровень вознаграждения в конечном итоге превосходит точность. Внимание, восприятие и психофизика , 73 (2), 640–657.
Артикул Google Scholar
Baranski, J.V., & Petrusic, W.M. (1994). Калибровка и разрешение уверенности в перцептивных суждениях. Восприятие и психофизика , 55 (4), 412–428.
Артикул PubMed Google Scholar
Богач Р., Браун Э., Мохлис Дж., Холмс П. и Коэн Дж. Д. (2006). Физика оптимального принятия решений: формальный анализ моделей производительности в двухальтернативных задачах с принудительным выбором. Психологический обзор , 113 (4), 700.
Статья PubMed Google Scholar
Богач, Р., Ху П., Холмс П. и Коэн Дж. Д. (2010). Производят ли люди компромисс между скоростью и точностью, который максимизирует вознаграждение? Ежеквартальный журнал экспериментальной психологии , 63 (5), 863–891.
Артикул PubMed Google Scholar
Браун, С.Д., Марли, А.А.Дж., Донкин, К., и Хиткот, А. (2008). Интегрированная модель выбора и времени отклика для абсолютной идентификации. Психологический обзор , 115 (2), 396.
Артикул PubMed PubMed Central Google Scholar
Колдерхед Б. и Джиролами М. (2009). Оценка байесовских факторов с помощью термодинамической интеграции и MCMC популяции. Вычислительная статистика и анализ данных , 53 (12), 4028–4045.
Артикул Google Scholar
Чидл, С., Вайарт, В., Цецос, К., Майерс, Н., Де Гарделл В., Кастаньон С.Х. и Саммерфилд К. (2014). Адаптивный контроль усиления во время выбора восприятия человеком. Нейрон , 81 (6), 1429–1441.
Артикул PubMed PubMed Central Google Scholar
Читтка Л., Дайер А.Г., Бок Ф. и Дорнхаус А. (2003). Психофизика: пчелы жертвуют скоростью добычи на точность. Nature , 424 (6947), 388.
Артикул PubMed Google Scholar
Диттерич, Дж.(2006). Свидетельства для принятия решений, зависящих от времени. Европейский журнал нейробиологии , 24 (12), 3628–3641.
Артикул PubMed PubMed Central Google Scholar
Другович, Дж., Морено-Ботэ, Р., Черчленд, А.К., Шадлен, М.Н., и Пуже, А. (2012). Стоимость накопления доказательств при принятии перцептивных решений. Журнал неврологии , 32 (11), 3612–3628.
Артикул PubMed PubMed Central Google Scholar
Эванс, Нью-Джерси, и Аннис, Дж. (2018). Термодинамическое интегрирование через дифференциальную эволюцию: метод аппроксимации предельного правдоподобия. Получено с сайта psyarxiv.com/a5v6r.
Evans, N.J., & Brown, S.D. (2017). Люди принимают оптимальную политику путем простого принятия решений после практики и рекомендаций. Psychonomic Bulletin and Review , 24 (2), 597–606.
Артикул PubMed Google Scholar
Evans, N.J., & Brown, S.D. (2018). Байесовские факторы для линейной баллистической аккумуляторной модели принятия решений. Методы исследования поведения , 50 (2), 589–603.
Артикул PubMed PubMed Central Google Scholar
Evans, N.J., Hawkins, G.E., Boehm, U., Wagenmakers, E.-J., И Браун, С. (2017). Вычисления, поддерживающие простое принятие решений: сравнение моделей распространения и срочности. Scientific Reports , 7 (1), 16433.
Статья PubMed PubMed Central Google Scholar
Evans, N.J., Rae, B., Bushmakin, M., Rubin, M., & Brown, S.D. (2017). Потребность в закрытии связана с безотлагательностью принятия перцептивных решений. Память и познание , 45 (7), 1193–1205.
Артикул Google Scholar
Friel, N., & Pettitt, A.N. (2008). Оценка предельного правдоподобия с помощью апостериорных степеней. Журнал Королевского статистического общества: серия B (статистическая методология) , 70 (3), 589–607.
Артикул Google Scholar
Hawkins, G.E., Forstmann, B.U., Wagenmakers, E.-J., Ratcliff, R., & Brown, S.Д. (2015). Пересмотр свидетельств того, что границы рушатся, и сигналов срочности при перцептивном принятии решений. Журнал неврологии , 35 (6), 2476–2484.
Артикул PubMed PubMed Central Google Scholar
Jentzsch, I., & Dudschig, C. (2009). Почему мы тормозим после ошибки? Механизмы, лежащие в основе эффектов замедления постеррора. Ежеквартальный журнал экспериментальной психологии , 62 (2), 209–218.
Артикул PubMed Google Scholar
Крюгер П.М., ван Вугт М.К., Симен П., Нистром Л., Холмс П. и Коэн Дж. Д. (2017). Накопление доказательств выделено жирным шрифтом с использованием медленного перцептивного принятия решений. Журнал методов нейробиологии , 281 , 21–32.
Артикул PubMed Google Scholar
Lerche, V., & Voss, A.(2016). Сложность модели в диффузионном моделировании: преимущества упрощения модели. Frontiers in Psychology , 7 , 1324.
Статья PubMed PubMed Central Google Scholar
Мэддокс, W.T., & Bohil, C.J. (1998). Эффекты базовой ставки и выигрыша в многомерной перцепционной категоризации. Журнал экспериментальной психологии: обучающая память и познание , 24 (6), 1459.
Google Scholar
Мальхотра, Г., Лесли, Д.С., Людвиг, К.Дж., и Богач, Р. (2017). Преодоление нерешительности путем изменения границы принятия решения. Журнал экспериментальной психологии: Общие , 146 (6), 776.
Статья Google Scholar
Pilly, P.K., & Seitz, A.R. (2009). Чем отличается параметр: психофизическое сравнение алгоритмов случайного движения точек. Vision Research , 49 (13), 1599–1612.
Артикул PubMed PubMed Central Google Scholar
Рахнев Д., Денисон Р. (2018). Неоптимальность восприятия принятия решений. Поведенческие и мозговые науки , 1–107.
Рэтклифф Р. (1978). Теория восстановления памяти. Психологический обзор , 85 (2), 59.
Статья Google Scholar
Рэтклифф Р., Смит, П.Л., Браун, С.Д., и МакКун, Г. (2016). Модель решения диффузии: текущие проблемы и история. Тенденции в когнитивных науках , 20 (4), 260–281.
Артикул PubMed PubMed Central Google Scholar
Shiffrin, R.M., Lee, M.D., Kim, W., & Wagenmakers, E.-J. (2008). Обзор подходов к оценке моделей с учебником по иерархическим байесовским методам. Когнитивная наука , 32 (8), 1248–1284.
Артикул PubMed PubMed Central Google Scholar
Симен П., Контрерас Д., Бак К., Ху П., Холмс П. и Коэн Дж. Д. (2009). Оптимизация вознаграждения при принятии двух альтернативных решений: эмпирические проверки теоретических прогнозов. Журнал экспериментальной психологии: человеческое восприятие и производительность , 35 (6), 1865.
PubMed Google Scholar
Старнс, Дж.Дж. И Р. Ратклифф (2010). Влияние старения на компромисс между скоростью и точностью: граничная оптимальность в диффузионной модели. Психология и старение , 25 (2), 377.
Статья PubMed PubMed Central Google Scholar
Старнс, Дж. Дж., И Ратклифф, Р. (2012). Возрастные различия в оптимальности границ диффузионной модели для задач, ограниченных как пробными, так и ограниченными по времени. Psychonomic Bulletin and Review , 19 (1), 139–145.
Артикул PubMed Google Scholar
Тернер Б.М., Седерберг П.Б., Браун С.Д. и Стейверс М. (2013). Метод эффективной выборки из распределений с коррелированными размерами. Психологические методы , 18 (3), 368.
Статья PubMed PubMed Central Google Scholar
Тверски А. (1972). Устранение по аспектам: теория выбора. Психологический обзор , 79 , 281–299.
Артикул Google Scholar
Тверски А. и Канеман Д. (1981). Формирование решений и психология выбора. Science , 211 (4481), 453–458.
Артикул PubMed Google Scholar
Uchida, N., & Mainen, Z.F. (2003). Скорость и точность обонятельной дискриминации у крыс. Nature Neuroscience , 6 (11), 1224.
Статья PubMed Google Scholar
van Ravenzwaaij, D., Dutilh, G., & Wagenmakers, E.-J. (2012). Распространение диффузной модели влияния алкоголя на перцептивное принятие решений. Психофармакология , 219 (4), 1017–1025.
Артикул PubMed Google Scholar
Восс, А., И Восс, Дж. (2007). Fast-dm: бесплатная программа для эффективного анализа диффузионных моделей. Методы исследования поведения , 39 (4), 767–775.
Артикул PubMed PubMed Central Google Scholar
Оптимальная мастерская | Платформа для исследования пользовательского опыта (UX)
Поймите, что наиболее важно, с нашей платформой для исследования пользователей — трансформируйте идеи в действия и принимайте решения с уверенностью
5 инструментов исследования, чтобы понять ваших пользователей
Сортировка карт
с OptimalSort
Узнайте, как люди концептуализируют, группируют и маркируют идеи с помощью OptimalSort, чтобы вы могли уверенно и легко оптимизировать структуру своего контента.
Испытание деревьев
с Treejack
Независимо от того, создаете ли вы новый веб-сайт или улучшаете структуру существующего, Treejack предоставляет вам информацию о пользователях, необходимую для построения структуры сайта, которая будет работать для людей, которые ее используют.
Тестирование в первый клик
с мелом
Быстро получайте отзывы о своих проектах. Chalkmark позволяет быстро и легко тестировать прототипы дизайна с пользователями, что означает более быстрые итерации, обратную связь и выполнение работ.
Интернет-опросы
с вопросами
Поймите своих клиентов и ответьте на эти животрепещущие вопросы, найдите подходящих людей для учебы и извлеките уроки из своих результатов с помощью вопросов.
Качественное исследование
с рефраммером
Совместно записывайте все свои исследовательские заметки, тесты удобства использования и наблюдения в Reframer, чтобы иметь единый источник правды. Затем быстро осмыслите свои выводы с помощью простых в использовании инструментов анализа.
Набор участников
с Optimal Workshop
Качественное исследование полагается на квалифицированных участников. Воспользуйтесь нашей службой набора участников, чтобы мгновенно получить доступ к миллионам пользователей со всего мира.
Я хочу использовать Optimal Workshop для:
Откройте для себя практические идеи человека
Получайте ответы, идеи и результаты за несколько дней, а не недель
Быстрое и доступное исследование пользователей
Быстро настраивайте и повторяйте исследования по мере обучения.
Охватите столько участников, сколько вам нужно
Набор и таргетинг на
70+ языков, удаленно или
лично.
Легко понять свои данные
Исследуйте свои всеобъемлющие результаты с красивой визуализацией.
Принимайте уверенные дизайнерские решения
Используйте убедительные идеи, чтобы порадовать свою команду и пользователей.
Вы в хорошей компании
Присоединяйтесь к наиболее успешным организациям, которые воспользуются информацией для создания впечатлений, которые нравятся их пользователям.
Optimal Workshop позволяет проводить исследования пользователей настолько легко, что нет оправдания для принятия необоснованных дизайнерских решений.
Я могу тестировать каркасы, не находясь физически в комнате с участниками. Это расширяет мои возможности тестирования и фактически дает мне более точные результаты, в то время как я продолжаю выполнять свою другую работу!
Начните работу с Optimal Workshop сегодня
Уже есть аккаунт? Войти
Оптимальная политика для принятия решений на основе ценностей
Постановка задачи и цель
Рассмотрим лицо, принимающее решения, которое выбирает один из вариантов, которые дают потенциально разные вознаграждения (или « ценности »), как, например, выбор между двумя вариантами обеденного меню в местный ресторан.Если лицо, принимающее решение, точно и немедленно узнает об этих наградах, ему следует немедленно выбрать более выгодный вариант. Однако в реалистичных сценариях вознаграждение, связанное с любым вариантом, является неопределенным a priori . Эта неопределенность может, например, возникнуть, если она имеет априори ограниченную информацию о вариантах выбора. Затем лучше собрать больше свидетельств о вознаграждении, связанном с сравниваемыми вариантами, прежде чем совершить выбор (например, выбирая среди обеденных меню, мы можем уменьшить неопределенность в отношении ценности любого из меню, рассматривая состав каждого курса меню. отдельно и как эти отдельные курсы дополняют друг друга).Однако сколько доказательств мы должны накопить, прежде чем сделать выбор? Слишком мало доказательств может привести к выбору варианта с меньшим вознаграждением (менее ценимое обеденное меню), в то время как длительное накопление доказательств происходит за счет как времени, так и усилий (например, отсутствие проходящего официанта еще раз). Далее мы формализуем, как лучше всего найти компромисс между скоростью и точностью такого выбора, а затем выведем, как лицо, принимающее решения, должно вести себя в таких сценариях. Сначала мы представим каждый компонент задачи принятия решений в его основной форме и обсудим их обобщения в следующих разделах.
Мы предполагаем, что в начале каждого испытания два варианта ассоциировались с истинными вознаграждениями, z 1 и z 2 , каждый из которых был получен стохастически из отдельных нормальных распределений с фиксированным средним для варианта. j ∈ {1,2} и обычная дисперсия. Эти истинные награды неизвестны лицу, принимающему решения, поскольку они никогда не наблюдаются напрямую. Вместо этого мы предполагаем, что лицо, принимающее решение, наблюдает некоторое мгновенное свидетельство со средним значением для обоих вариантов j ∈ {1,2} одновременно с небольшими временными шагами i длительностью δt .Обратите внимание, что изменчивость (и связанная с ней неоднозначность) мгновенных свидетельств может возникать из-за источников шума, которые являются как внутренними, так и внешними по отношению к лицу, принимающему решение, — источникам, которые мы более подробно обсудим ниже.
Прежде чем рассматривать какие-либо мгновенные свидетельства, мы предполагаем, что лицо, принимающее решение, придерживается нормально распределенного убеждения со средним значением и дисперсией, которые являются, соответственно, средним значением и дисперсией распределения, из которого извлекается вознаграждение в начале каждого испытания. .Другими словами, это априорное убеждение соответствует фактическому распределению, из которого извлекается истинное вознаграждение (то есть лицо, принимающее решение, использует правильную генеративную модель), и влечет за собой, что вариант j , скорее всего, принесет вознаграждение, но может также приносят другие вознаграждения, при этом распределение вознаграждений контролируется уровнем неопределенности около z j . На данный момент мы рассматриваем только случай, когда суммы вознаграждения, связанные с обоими вариантами, не коррелируют и в среднем одинаковы.С точки зрения выбора между вариантами обеденного меню, любое меню a priori принесет одинаковую награду, а истинные награды любого варианта меню независимо друг от друга извлекаются из вышеупомянутого нормального распределения (рис. 2а). Позже мы обсудим последствия корреляции между истинными значениями опционов.
Рисунок 2: Типичная задача принятия решений, основанная на ценностях.( a ) (слева) Предыдущее распределение, из которого отбираются награды за пару опций. r 1 и r 2 указывают величины вознаграждения для отдельных вариантов (например, объекты, представленные в левой и правой части экрана в каждом испытании). (справа) Типичный визуальный стимул в каждом испытании. ( b ) Задача на время реакции. В каждом испытании лицу, принимающему решение, предлагается пара вариантов. Лицо, принимающее решение, сообщает о своем выборе, как только она решает, какой из двух вариантов она предпочитает. Время реакции ( T i ) может варьироваться в зависимости от испытания, и отдельные испытания разделены фиксированным интервалом между испытаниями.
Как только ему будут представлены сенсорные доказательства δx j, i , лицо, принимающее решение, накапливает дополнительную информацию о вознаграждениях, связанных с любым вариантом выбора. Это мгновенное свидетельство δx j, i раскрывает зашумленную информацию об истинной награде z j , так что каждое дополнительное мгновенное свидетельство снижает неопределенность в отношении этой награды. Подчеркнем, что ни одна из настоящих наград никогда не обходится без шума.В результате лицу, принимающему решение, необходимо накапливать доказательства, чтобы уменьшить неопределенность в отношении лежащих в основе истинных вознаграждений путем усреднения шума. Более длительное накопление доказательств приводит к лучшему среднему значению и меньшей связанной с ним неопределенности.
Шум в самом сиюминутном свидетельстве может иметь как внутренние, так и внешние источники. Внешние источники представляют собой потенциально стохастическую природу стимулов, шума восприятия, неоднозначности и неполного знания. Например, если вы еще не прочитали основное блюдо и десерт по определенному пункту меню, это может вызвать неуверенность в его ценности из-за неполных знаний.Внутренние источники могут возникать в результате неуверенной памяти или выводов значений, которые растягиваются с течением времени. Одним из примеров такого вывода значения могло бы быть последовательное рассмотрение значения различных функций конкретного курса меню с течением времени.
Формально, после наблюдения свидетельств, связанных с ценностью δx j (0: t ) от момента 0 (появление моментальных свидетельств) до некоторого времени t , апостериорная вера лица, принимающего решение, относительно истинное вознаграждение, z j , вариант j задается
Апостериорное среднее — это взвешенная по свидетельствам комбинация априорного среднего и усредненных по времени накопленных доказательств и апостериорной дисперсии (то есть неопределенность) монотонно уменьшается со временем (см. раздел «Методы»).Из-за неопределенности мгновенных свидетельств накопленное свидетельство x j ( t ) само описывает случайный процесс. Здесь, в отличие от других моделей принятия решений (как перцептивных 19,20 , так и основанных на ценностях 15,16 ), вся стохастичность в накопленных доказательствах является результатом двусмысленности самих мгновенных свидетельств, а не шумами. в механизмах, реализующих процесс принятия решений. Другими словами, предполагается, что процесс, ответственный за накопление доказательств, является бесшумным, что согласуется с недавними нейрофизиологическими записями. 21
Какие затраты и вознаграждения несет лицо, принимающее решения, в процессе принятия решений? Что касается затрат, мы предполагаем, что лицо, принимающее решения, оплачивает центов центов в секунду за сбор доказательств с момента появления вариантов выбора до тех пор, пока не будет выбран вариант. Эта стоимость может, например, быть явной стоимостью отложенного выбора или представлять усилия, вызванные накоплением доказательств. В контексте выбора между обеденным меню эти расходы могут возникать из-за того, что снова не хватает проходящего официанта или из-за опоздания на встречу после обеда.Выбор варианта j связан с получением некоторого вознаграждения r j , которое является функцией истинного вознаграждения z j , связанного с этим вариантом, как, например, при получении вознаграждения за потребление обед. На данный момент мы предполагаем, что опытное и истинное вознаграждение равноценно, то есть r j = z j . Для единственного выбора общая цель лица, принимающего решение, состоит в том, чтобы максимизировать ожидаемое вознаграждение за вычетом ожидаемых затрат,
, где ожидание варьируется от вариантов j и времени накопления доказательств T , с учетом потока доказательств δx j (0: T ) от момента времени 0 до T .Сначала мы выводим оптимальное поведение или «политику», которая максимизирует эту целевую функцию для единичных, изолированных выборов, а затем обобщаем ее на более реалистичный сценарий, в котором общее вознаграждение в длинной последовательной последовательности максимизируется.
Оптимальные решения с DDM со схлопывающимися границами
Чтобы найти оптимальную политику, мы заимствуем инструменты из динамического программирования (DP). Одним из таких инструментов является «функция ценности», которую можно определить рекурсивно с помощью уравнения Беллмана.Далее мы покажем, что оптимальная политика, вытекающая из этой функции ценности, описывается двумя зависящими от времени параллельными границами в двумерном пространстве текущих оценок истинных вознаграждений за опционы. Эти границы параллельны наклону на единицу, со временем сближаются и вместе образуют границу разницы в оценках вознаграждения. Это различие эффективно выводится с помощью моделей распространения, так что DDM могут реализовать оптимальную стратегию для принятия решений на основе ценностей.
Уравнение Беллмана для принятия оптимальных решений на основе стоимости .Чтобы определить функцию стоимости, предположим, что лицо, принимающее решения, накопило некоторые свидетельства о вознаграждении за опцион в течение некоторого времени t . Учитывая это накопленное свидетельство, функция ценности возвращает общее вознаграждение, которое лицо, принимающее решение, ожидает получить при следовании оптимальной политике. Эта стоимость включает в себя как стоимость накопления доказательств с момента до и далее, так и вознаграждение, полученное в результате окончательного выбора. Ожидаемые вознаграждения, и прошедшее время t являются достаточной статистикой накопленных свидетельств (см. Раздел «Методы»), так что функция ценности определяется для этих величин.В каждый момент времени t во время накопления свидетельств мы можем либо сделать выбор, либо собрать больше свидетельств и сделать выбор позже. Приняв решение сделать выбор, лучше всего выбрать вариант, связанный с более высоким ожидаемым вознаграждением, таким образом, чтобы общая ожидаемая награда за немедленный выбор выражалась значением для «принятия решения» (рис. 3а). Напротив, при накоплении большего количества свидетельств в течение небольшой продолжительности δt лицо, принимающее решение, наблюдает дополнительные свидетельства, на основании которых она обновляет свое мнение об истинных вознаграждениях, оплачивая стоимость накопления cδt .На этом этапе она ожидает получить общую награду в размере. Следовательно, общее ожидаемое вознаграждение за накопление большего количества доказательств определяется значением «ожидания» (рис. 3b), где ожидание превышает распределение будущих ожидаемых вознаграждений, и, учитывая, что они есть и в момент времени t (см. раздел «Методы» для выражения этого распределения). Лицо, принимающее решение, должно собирать больше доказательств только в том случае, если это обещает большее общее вознаграждение, так что функцию ценности можно рекурсивно записать в форме, называемой уравнением Беллмана (рис.3а-с, д; см. дополнительное примечание 1 для формального вывода),
Рисунок 3: Нахождение границ решения в решении, основанном на значениях.( a ) Ожидаемые значения выбора любого из вариантов определяются как двумерная функция (поверхность) пары оценок вознаграждения, в момент времени t . Темной линией показано сечение в. ( b ) Точно так же поверхность значений для «ожидания» (то есть ожидаемое значение после наблюдения за новым свидетельством в течение короткого периода δt , вычтенная стоимость ожидания cδt ) определяется как функция от.Обратите внимание, что по диагонали значение ожидания более плавное, чем значение выбора из-за неопределенности в отношении будущих доказательств. ( c , d ) Поверхности значений для выбора и ожидания наложены друг на друга, а их разделы на. Границы принятия решения (пунктирные линии) определяются точками в пространстве оценок вознаграждения, в которых значение «принятия решения» (синий) равно значению ожидания (красный). В области, где ожидание имеет более высокую ценность, чем выбор любого из вариантов (синий цвет под красной кривой / поверхностью), лицо, принимающее решение, откладывает решение, чтобы собрать больше доказательств; в противном случае она выбирает вариант, который, как ожидается, принесет более высокую награду.Поскольку отношения между двумя поверхностями ценностей трансляционно симметричны с точки зрения среднего вознаграждения, их пересечения параллельны и не зависят от этого среднего вознаграждения. ( e ) Ожидаемое значение V ( t ) представляет собой максимум значений для выбора и ожидания. Эта поверхность определяет значение ожидания ( b ) на следующем, более раннем временном шаге, t — δt . ( f ) Границы решения и связанные варианты выбора показаны в двумерном представлении.Обратите внимание, что две границы всегда параллельны диагонали. Это связано с тем, что обе функции значения (для принятия решения и для ожидания) линейно увеличиваются с наклоном один в линиях, параллельных диагонали ( a , b ). Для значения для принятия решения, например, ниже диагонали, которая у нас есть, такая, что, и, следовательно, где C — произвольный скаляр. Можно показать, что значение для ожидания имеет то же свойство.
Зная функцию ценности, оптимальный выбор выполняется следующим образом.До накопления каких-либо доказательств субъективное ожидаемое вознаграждение, связанное с вариантом j , равно среднему значению предшествующего убеждения, так что общее ожидаемое вознаграждение на данный момент равно. Как только доказательства накапливаются и развиваются с течением времени, отражая накопленные доказательства и связанную с ними обновленную веру в истинную награду за выбранные варианты. По-прежнему выгодно накапливать доказательства до тех пор, пока общая ожидаемая награда за это больше, чем за немедленное принятие решения.Как только решение и ожидание становятся одинаково ценными, то есть лучше всего выбрать вариант j , связанный с ожидаемым вознаграждением с более высоким вознаграждением. Эта оптимальная политика приводит к двум границам принятия решений в пространстве, которые могут изменяться со временем (рис. 3f). Между этими границами по-прежнему выгодно накапливать больше доказательств, но как только любая граница будет достигнута, следует выбрать соответствующий вариант.
Параллельные границы оптимального решения .Для рассмотренной выше постановки задачи границы решения принимают удивительно простую форму. При построении графика в -пространстве оценочных вознаграждений за опцион в течение некоторого фиксированного времени t , две границы всегда параллельны диагонали (рис. 3f). Кроме того, они всегда находятся выше и ниже этой диагонали, отражая, что диагональ разделяет области, в которых выбор любого из вариантов сулит больше вознаграждения. Здесь мы приводим неофициальные аргументы, почему это так.
Аргумент основан на том факте, что для каждого момента времени t границы решения определяются пересечением между значением для принятия решения и значением для ожидания (рис.3в, г). Оба эти значения обладают тем свойством, что на линиях, параллельных диагонали, они линейно увеличиваются с наклоном один. Формально обе функции удовлетворяют для любого фиксированного времени t , оценки вознаграждения и произвольного скаляра C . Это означает, что, если они пересекаются в некоторой точке, образуя таким образом часть границы принятия решения, они будут пересекаться на всей линии, параллельной диагонали (рис. 3c, e, f). Следовательно, обе границы решения параллельны диагонали.
Как мы можем гарантировать, что значения как для принятия решения, так и для ожидания линейно увеличиваются в линиях, параллельных диагонали? Что касается значения для принятия решения, это сразу видно из его определения (рис. 3а и подпись). Отображение того же значения для ожидания требует дополнительной работы и выполняется с помощью аргумента обратной индукции по времени (подробности см. В разделе «Методы»). Интуитивно понятно, что после долгого накопления свидетельств о вознаграждении ( t → ∞ ) лицо, принимающее решения, не ожидает получить более глубокого понимания каких-либо дополнительных свидетельств.Следовательно, решение лучше, чем ожидание, так что функция ценности будет функцией для принятия решения, которая, как упоминалось ранее, линейно возрастает по линиям, параллельным диагонали, обеспечивая базовый случай. Затем можно показать, что, если функция цены в момент времени t + δt линейно возрастает по линиям, параллельным диагонали, то то же самое и значение ожидания в момент времени t , и, как следствие, также функция ценности в момент времени t — в основном потому, что неопределенность в отношении того, как оценка вознаграждения изменяется с течением времени, не зависит от сдвига (не зависит от текущих ожидаемых вознаграждений; см. раздел «Методы»).Функция ценности в момент времени t является максимумом над значением для принятия решения и для ожидания. Поскольку оба растут линейно по линиям, параллельным диагонали, то же самое и это значение (рис. 3c, e). На этом индуктивный шаг завершен.
Подводя итог, индукционный аргумент назад во времени показывает, что как значения для принятия решения, так и для ожидания возрастают линейно в строках, параллельных диагонали, для всех t . Как следствие, границы принятия решения, которые лежат на пересечении этих двух значений, параллельны этой диагонали для всех времен t .В дополнительных методах мы демонстрируем то же свойство с аргументом, который не полагается на индукцию. В обоих случаях аргумент требует для любого фиксированного t стохастической временной эволюции наших оценок ожидаемого вознаграждения, инвариантной относительно сдвигов по отношению к нашим текущим оценкам. Другими словами, для любых оценок лицо, принимающее решения, ожидает, что они будут развиваться точно так же. Это свойство сохраняется для настройки задачи, описанной выше, и некоторых ее обобщений (дополнительное примечание 1), но может быть нарушено в определенных, более сложных сценариях, как описано ниже.
Оптимальные решения с схлопывающимися границами и по диффузионным моделям . Следствием параллельных границ принятия решений является то, что оптимальный выбор может быть выполнен путем отслеживания только разницы в ожидаемых вознаграждениях за опционы, а не обоих и независимо друг от друга. Чтобы увидеть это, рассмотрим поворот этих границ в -пространстве на -45 ° так, чтобы они стали параллельны горизонтальной оси в новом -пространстве (рис. 4a, b). После поворота они связаны и не зависят от.
Рисунок 4: Границы оптимального решения, вычисленные численно с помощью DP.( a ) Границы решения и варианты выбора в трех репрезентативных временных точках ( t = 0,5, 1 и 2 с), показанные в пространстве оценок вознаграждения. ( b ) То же, что a , но показано в повернутой области. ( c ) Границы решения с точки зрения ожидаемой разницы вознаграждений, как функции времени. Расстояние между границами уменьшается с течением времени и в какой-то момент уменьшается до нуля. ( d ) Те же самые границы решения показаны в пространстве накопленных свидетельств, которое представлено местоположением частицы в DDM.Голубой след представляет собой образец траектории частицы, представляющий накопление свидетельств и последующий выбор варианта 1.
Для гауссовых a priori наград (рис. 2a) численные решения показывают, что расстояние между двумя границами со временем уменьшается, в результате в «схлопывающихся границах» (рис. 4в), что можно объяснить следующим образом. В начале принятия решения истинное вознаграждение за опцион весьма неопределенно из-за недостатка информации. Следовательно, каждое небольшое дополнительное свидетельство сделает оценку вознаграждения более достоверной.Это заставляет воздерживаться от принятия решений по сильно разнесенным границам принятия решений (рис. 4c для малых t ). Как только будет накоплено значительное количество доказательств, дальнейшие доказательства вряд ли повысят уверенность в истинной награде. Таким образом, становится более предпочтительным принять быстрое решение, а не отказываться от выбора из-за незначительного увеличения точности выбора (даже для аналогичных оценок вознаграждения, и остаточной неопределенности в отношении того, какой вариант дает более высокое вознаграждение). Сужающаяся граница раздела обеспечивает такие быстрые решения (рис.4в для больших т ).
Мы можем еще больше упростить процедуру принятия оптимального решения, выполнив расчет ожидаемой разницы в вознаграждении за опционы с помощью диффузионной модели. Пока такая реализация остается статистически оптимальной, как рассеивающая частица, x ( t ) ≡ x 1 ( t ) — x 2 ( t ), ( напомним, что) и прошедшее время t образуют набор достаточных статистик апостериорного r 1 ( t ) — r 2 ( t ) | δ x (0: t ) сверх этой разницы (см. Раздел «Методы»).Кроме того, x j ( t ) можно интерпретировать как пробный путь частицы, которая диффундирует с дисперсией σ 2 и дрейфует со скоростью z j . По этой причине x ( t ) диффундирует с дисперсией 2 σ 2 и дрейфует со скоростью z 1 — z 2 , таким образом формируя частицу в модели диффузии, которая работает статистически оптимальный вывод.Такое же сопоставление между ожидаемой разницей вознаграждения и рассеивающей частицей позволяет нам сопоставить оптимальную границу вознаграждения с границами на x ( t ) (рис. 4c, d). Следовательно, такие простые модели, как диффузионные, могут реализовать принятие оптимальных решений на основе ценности.
Переход от одиночного выбора к его последовательности
До сих пор мы сосредоточились на единственном выборе, в котором лицо, принимающее решение, обменивает ожидаемое вознаграждение, полученное за этот выбор, на затраты, связанные с накоплением доказательств истинного вознаграждения за опцион.Эта установка предполагает единственный выбор и, помимо затрат на накопление, бесконечное время для его выполнения. Однако в реалистичных сценариях такой выбор обычно включается в последовательность аналогичных выборов. Здесь мы рассмотрим, как такое вложение влияет на форму оптимальной политики.
Максимизация вознаграждения при выборе . Мы предполагаем, что каждый выбор в последовательности соответствует предыдущей настройке с одним выбором. То есть после появления вариантов выбора лицо, принимающее решение, платит центов за центов в секунду за накопление свидетельств об истинных вознаграждениях за опционы.По выбору она получает истинное вознаграждение, связанное с выбранным вариантом. После выбора следует (возможно, стохастическое) время ожидания в среднем t w секунд, после чего появляются два новых варианта выбора и накапливаются новые свидетельства. Истинное вознаграждение, связанное с любым вариантом, — это до начала варианта выбора, нарисованное в соответствии с ранее описанным гауссовским априорном (рис. 2а), так что эти вознаграждения остаются постоянными в пределах индивидуальных выборов, но варьируются в зависимости от последовательных выборов.Вместо того, чтобы максимизировать общую ожидаемую награду для каждого отдельного выбора, мы предполагаем, что цель состоит в том, чтобы максимизировать общую ожидаемую награду в течение фиксированного периода времени, независимо от того, сколько вариантов было выполнено в течение этого периода. Чтобы избежать граничных эффектов, мы предполагаем, что длительность периода близка к бесконечности, так что максимизация общего ожидаемого вознаграждения в течение этого периода становится эквивалентной максимизации нормы вознаграждения ρ , заданной
, где ожидание, как для уравнение (2) при выборе j и времени накопления свидетельств T , учитывая поток свидетельств.Здесь очень важно зафиксировать период времени, оставив открытым количество вариантов, которые можно выполнить. Если бы мы вместо этого исправляли количество вариантов, оставляя открытым время для их принятия, снова становится оптимальным максимизировать общую ожидаемую награду для каждого из этих вариантов отдельно, так что оптимальная политика для каждого такого выбора такая же, как для одиночного, изолированного выбора.
Бесконечные последовательности выбора затрудняют использование функции стандартного значения. Эта функция значения возвращает общее ожидаемое вознаграждение за все текущие и будущие варианты выбора, начиная с текущего состояния.Таким образом, для бесконечного числа таких будущих выборов функция ценности может стать бесконечной. Один из способов избежать этого — использовать вместо этого функцию «скорректированного по среднему значению», которая — в дополнение к стоимости накопления — штрафует прохождение некоторой временной продолжительности δt на — ρδt , где ρ — награда. показатель. Согласно уравнению (4) эта ставка вознаграждения представляет собой общее получаемое вознаграждение (включая затраты на накопление) за секунду, усредненное по всей последовательности выбора. Наказание функции ценности с помощью этой ставки вознаграждения делает явной неявную потерю вознаграждения из-за потенциальных будущих выборов, которые лицо, принимающее решения, упускает, когда накапливает слишком много доказательств для текущего выбора.Это наказание позволяет нам рассматривать все варианты выбора в последовательности, как если бы они были одним и тем же уникальным выбором. Дальнейшее следствие этого наказания состоит в том, что функция ценности для накопления большего количества свидетельств в течение некоторого времени δt претерпевает более существенное изменение, поскольку накопление этих свидетельств теперь требует затрат — ( c + ρ ) δt вместо из предыдущего — cδt (соответствующее уравнение Беллмана см. в разделе «Методы»). Для положительных ставок вознаграждения, ρ > 0, это увеличение стоимости подразумевает более дорогостоящее накопление доказательств, так что становится выгоднее накапливать меньше доказательств, чем для единичных, изолированных вариантов.Это изменение реализуется за счет более быстрого схлопывания границ принятия решения (формально показано в дополнительном примечании 1, см. Также дополнительный рисунок 1). Таким образом, сужение границ принятия решений реализует оптимальную политику как для одиночного выбора, так и для последовательности выборов, с той лишь разницей, что эти границы разрушаются быстрее для последнего. Продолжительность ожидания между вариантами выбора t w модулирует эту разницу, так как при t w → ∞ ставка вознаграждения, описываемая уравнением (4), уменьшается до ожидаемого вознаграждения за одиночный, изолированный выбор, уравнение (2).Следовательно, политика одиночных испытаний является частным случаем политики максимизации вознаграждения, при которой время ожидания между последовательными выборами становится почти бесконечным.
Зависимость политики от предварительного распределения вознаграждения . Как показано выше, оптимальные решения, основанные на ценности, достигаются путем накопления только разницы оценок вознаграждения, как это реализуется с помощью DDM. Однако это не означает, что абсолютные величины вознаграждения не влияют на стратегию принятия решений; они влияют на форму границы решения.На рисунке 5а показано, как оптимальные границы принятия решения зависят от среднего значения априори убеждений об истинных вознаграждениях в испытаниях. Когда оба варианта, вероятно, будут в среднем очень полезными, границы должны рухнуть быстрее, чтобы сделать больше вариантов за тот же промежуток времени. В свете гарантированно высокой награды этот более быстрый крах способствует экономии времени и усилий по сбору доказательств. Форма границы не изменяется для вариаций истинных вознаграждений (которые составляют априори, неизвестных) для одного и того же предшествующего периода, но только тогда, когда изменяется само предварительное вознаграждение.Эта чувствительность к предшествующему и соответствующему среднему вознаграждению также отличает принятие решений на основе ценности с максимизацией вознаграждения от решений, направленных на максимизацию вознаграждения за единичный, изолированный выбор (дополнительное примечание 1), и от классических парадигм перцептивного принятия решений ( Рис. 5b, см. Также раздел «Обсуждение»). Подводя итог, для решений, основанных на ценностях, которые максимизируют норму вознаграждения, априори убеждение в величинах среднего вознаграждения влияет на стратегию (и, как следствие, на среднее время реакции), модулируя скорость разрушения границ принятия решений. , даже если выбор в рамках отдельных решений основывается только на оценках относительной награды между вариантами.
Рис. 5. Влияние предварительных требований и требований задачи на скорость обрушения границ.( a ) Границы решения для решений, основанных на значениях, которые максимизируют вознаграждение в единицу времени. Среднее значение априори вознаграждения варьируется от -1 до 8, при этом сохраняется. На вставке показаны два примера предыдущих распределений (синий и красный: среднее вознаграждение 0 и 4 соответственно). На рисунке показано, что оптимальные границы принятия решения зависят от предварительных знаний о средней награде по испытаниям.( b ) Границы решения, которые максимизируют количество правильных ответов в единицу времени для решений, основанных на точности. («Правильная ставка» в решениях, основанных на ценностях, может быть определена, например, как вероятность выбора более предпочтительного варианта.) Эти границы не меняются, и все они нанесены друг на друга. Здесь границы решения были выведены с помощью той же процедуры динамического программирования, что и для случая, основанного на стоимости, за исключением того, что вознаграждения предполагались двоичными, и только одно, если лицо, принимающее решение, правильно определило вариант с большим « вознаграждением » cue z j (см. раздел «Методы»).В отличие от стратегии максимизации ставки вознаграждения для решений, основанных на ценностях ( a ), стратегия принятия решений, максимизирующая правильную ставку, инвариантна к абсолютным значениям среднего вознаграждения / силы доказательств, тем самым демонстрируя качественную разницу между основанными на ценности и перцептивное принятие решений с точки зрения оптимальной стратегии. Кроме того, оптимальные границы в случае, основанном на ценностях, со временем сближаются быстрее, чем для перцепционных решений. Более быстрое разрушение границ для решений, основанных на ценностях, согласуется с широким диапазоном средних абсолютных вознаграждений, показывая, что различие в динамике границ не только из-за разницы в ожидаемых нормах вознаграждения, но и отражает качественное различие между геометриями функций стоимости. в этих двух задачах.
Пределы моделей распространения для решений, основанных на ценностях
Для всех сценариев, которые мы рассмотрели до сих пор, модели распространения могут реализовывать оптимальную политику принятия решений. Здесь мы обсуждаем, что это все еще верно для некоторых, но не для всех обобщений задачи. Для некоторых задач оптимальная политика даже не может быть представлена параллельными границами в пространстве ожидаемых оценок вознаграждения. Это, например, тот случай, когда априорное / вероятностное распределение вознаграждения / свидетельства коррелировано определенным образом (см. Раздел о методах и дополнительное примечание 1), или когда функция полезности является нелинейной (см. Рис.6 для примера).
Рисунок 6: В некоторых сценариях оптимальная политика становится даже более сложной, чем две параллельные границы в пространстве оценок ожидаемого вознаграждения.Это свойство может, например, выйти из строя, если полезность, которую лицо, принимающее решение, получает от своего выбора, не является самой наградой, а вместо этого является нелинейной функцией этого вознаграждения. Если эта полезность растет сублинейно в вознаграждении, как это часто предполагается, границы решений сближаются с увеличением ожидаемого вознаграждения, поскольку более высокие вознаграждения дают сравнительно меньшую полезность.В таких обстоятельствах оптимальный выбор требует отслеживания как оценок ожидаемого вознаграждения, так и независимо, а не только их разницы. Чтобы продемонстрировать это, здесь мы предположили насыщающую функцию полезности, Полезность = u ( r ), которая насыщается при r → ∞ и r → −∞. Это может иметь место, например, если вознаграждения варьируются в большом диапазоне, в котором субъективно воспринимаемая полезность следует нелинейной насыщающей функции этого вознаграждения.(На этом рисунке и смоделированы с касательной гиперболической функцией, но точные детали функциональной формы не меняют качественно результаты). Логика различных панелей соответствует логике рис. 2. ( a ) Поверхность функции значения для выбора любого из двух вариантов. ( b ) Поверхности значений для откладывания решения о накоплении дополнительных доказательств на период δt . ( c ) Две поверхности значений наложены друг на друга. ( d ) Граница решения и выбор представлены в двумерном пространстве.Обратите внимание, что расстояние между границами принятия решений меньше в режиме, где оценочные вознаграждения в среднем высоки, напоминая «RM» 11,12 , которые более чувствительны к абсолютным величинам вознаграждения, чем DDM.
Таким образом, диффузионные модели, кажется, реализуют оптимальную стратегию принятия решений только в очень ограниченных обстоятельствах. Однако даже вне этих обстоятельств диффузионные модели могут быть не слишком далеки от достижения почти оптимальной производительности, но их потерю вознаграждения еще предстоит оценить в общих обстоятельствах.Лабораторные эксперименты могут удовлетворять условиям, при которых диффузионные модели должны быть близки к оптимальным даже при наличии нелинейной функции полезности. В таких экспериментах часто используются умеренные вознаграждения (например, умеренно ценные продукты питания, а не экстремальные выплаты), и в этом случае потенциально нелинейная полезность будет хорошо аппроксимирована линейной функцией в пределах проверенного диапазона вознаграждений.
Нехватка тестов на коронавирус вызывает новую стратегию: групповой скрининг
Эксперты предупреждают, что если не будет проведено широкомасштабное тестирование на COVID-19, число случаев заболевания будет расти, поскольку правительства вновь открывают новые предприятия и общественные места.Но по-прежнему ощущается острая нехватка диагностических тестов на коронавирусные инфекции из-за беспрецедентного спроса на химические вещества и расходные материалы. В США, например, проводятся сотни тысяч тестов в день, но это количество все еще далеко от миллионов ежедневных анализов, рекомендованных для безопасного возвращения к норме.
Сейчас десятки исследователей в США, Израиле и Германии реализуют стратегию значительного увеличения диагностических возможностей: групповые тесты. Объединяя образцы от многих людей в несколько групп и оценивая пулы, а не отдельных лиц, ученые думают, что они могут использовать меньше тестов на большем количестве людей.Такой подход может привести к более быстрому выявлению людей, которые являются невольными носителями болезни, и к способности быстро избавиться от других, которые не были инфицированы. Стратегия использовалась в прошлом для успешного выявления случаев ВИЧ, хламидиоза, малярии и гриппа, и изначально была задумана во время Второй мировой войны для проверки тысяч военнослужащих на сифилис.
«Пока у нас нет вакцины, мы можем остановить передачу вируса только путем тестирования и изоляции инфицированных людей», — говорит Сандра Цизек, директор Института медицинской вирусологии Франкфуртского университета Геоте в Германии.В середине февраля она одной из первых сообщила, что люди без симптомов могут распространять вирус. С тех пор Цизек работает над методикой объединенного тестирования для выявления бессимптомных носителей. Подход «пытается сделать больше с таким же количеством тестов», — говорит Томер Герц, вычислительный иммунолог из Университета Бен-Гуриона в Негеве в Израиле, который также разрабатывает стратегию пакетного тестирования. Однако есть одна оговорка: по мере того, как распространенность инфекции в сообществе растет, способность экономить ресурсы с помощью группового тестирования снижается.
Групповое тестирование — это игра в числа. Допустим, вы обследуете 100 человек, и один из них положительный. Обычно вы проводите 100 диагностических тестов, ища генетический материал вируса у каждого человека. Но при групповом тестировании вы можете разделить эти 100 человек на пять групп по 20. Это дает вам пять пулов с 20 образцами, и вы используете один тест для каждого пула. Если первые четыре пула образцов дали отрицательный результат, вы исключили 80 человек с помощью четырех тестов. Если последний пул дал положительный результат, вы повторно тестируете каждый образец в этом последнем пуле индивидуально, чтобы идентифицировать тот, у которого есть заболевание.В итоге вы сделали 25 тестов вместо 100.
Это привлекло внимание Питера Ивена, директора лаборатории общественного здравоохранения Небраски, которая использует объединенный подход. В марте Ивен столкнулся с крайней нехваткой химикатов для тестирования. Но было неясно, разрешит ли Управление по санитарному надзору за качеством пищевых продуктов и медикаментов США (FDA), которое регулирует этот вид диагностических тестов, объединенное тестирование. Он потратил две недели на то, чтобы опробовать эту технику, прежде чем представить данные, показывающие, что она позволяет сэкономить лабораторное время и ингредиенты губернатору Небраски и FDA.В течение трех дней, незадолго до того, как его запасы подошли к концу, Ивен получил письмо от губернатора, в котором он получил «полное разрешение на исследование и принятие всех разумных мер по расширению испытаний в это время».
Позже он получил электронное письмо от FDA, в котором говорилось, что оно не будет возражать против объединения пяти образцов. «Мы решили, что это было настолько близко к одобрению, насколько это возможно», — говорит Ивен. Представитель FDA сообщил Scientific American , что агентство «открыто для множества новых идей тестирования, таких как объединение образцов, и призывает всех разработчиков тестов обращаться к нам, чтобы обсудить соответствующие подходы к валидации.”
Во многих разрабатываемых стратегиях используются компьютеры и робототехника для проектирования оптимального количества пулов или оптимизации процесса. Герц и его коллеги разработали хитрость, избавляющую от необходимости проверять любой образец дважды. Вместо того, чтобы разделять образцы на отдельные пулы, они делят каждый образец на перекрывающиеся пулы. Например, предположим, что вы тестируете те же 100 образцов, что и раньше, один из которых положительный. Затем вы распределяете эти 100 семплов в различных комбинациях на 14 групп по 50.Каждый образец представлен в шести или семи различных пулах. В одном положительном случае определенная последовательность из шести пулов должна оказаться положительной. Зная, какой образец однозначно принадлежит всем шести пулам (например, пациент 74 — единственный, который появился в пулах 1, 2, 7, 9, 12 и 13), вы можете отследить этот положительный результат до конкретного человека без необходимости повторно протестируйте любые образцы. Когда в миксе более одного положительного случая, все усложняется, поэтому исследователи разработали компьютерный алгоритм для идентификации всех носителей.
ПодходHertz действительно может сделать анализы более эффективными, говорит Аллен Бейтман, помощник директора Лаборатории инфекционных заболеваний штата Висконсин, где он наблюдает за тестированием COVID-19. Но Бейтман предупреждает, что разведение каждого образца в большие пулы может сделать настоящий тест менее чувствительным, заставив его пометить некоторые положительные случаи заболевания как отрицательные. Такие ложноотрицательные результаты преследовали диагностические тесты на COVID-19 с самого начала пандемии.
Самое большое ограничение пакетного подхода, каким бы он ни был, связано не столько с самим тестом, сколько с природой заболевания. Групповое тестирование работает до тех пор, пока распространенность патогена остается низкой. Но если в протестированных образцах будет слишком много положительных случаев, большинство пулов окажутся положительными, и в любом случае придется проводить индивидуальные тесты. Комбинаторный подход Герца работает лучше всего, когда распространенность болезни в сообществе не превышает 5 процентов, при идеальном уровне около 1 процента.Более простые подходы, такие как те, что использовали Ивен и Цизек, работают, когда распространенность составляет менее 10 процентов. Фактически, в сообщении FDA Айвену говорилось, что он может тестировать пулы, если процент положительных результатов тестирования был ниже этого процента.
В настоящее время неизвестно, сколько положительных случаев циркулирует в США, что затрудняет определение того, где было бы целесообразно объединенное тестирование. Отложенное в стране развертывание тестирования на COVID-19 позволило вирусу, вызывающему болезнь, распространяться в течение нескольких недель незамеченным.В Висконсине Бейтман говорит, что от 10 до 30 процентов тестов, выполненных в его лаборатории, дают положительные результаты. Но по мере того, как кривые сглаживаются и даже падают, лаборатории в США и других странах видят возможность группового тестирования, чтобы убедиться, что люди не заражены вирусами, прежде чем они вернутся на фабрики, в больницы или школьные системы.
«Если вы проводите тестирование в относительно бессимптомной популяции, это может быть способом отследить наступление второй волны, сэкономить ресурсы и увеличить потенциал», — говорит Бенджамин Пински, медицинский директор Лаборатории клинической вирусологии Стэнфордского университета.Пинский, который использовал групповое тестирование в начале вспышки для отслеживания передачи COVID-19 среди населения в районе залива Сан-Франциско, говорит, что недавно он подумал о том, чтобы снова использовать этот подход, когда начал проверять персонал Stanford Health Care. Но он отказался от этого, потому что его лаборатория в настоящее время способна обрабатывать 10 000 тестов, которые она выполняет в неделю.
Объединенные образцы могут помочь странам справиться с тремя возможными вариантами будущего, предусмотренными эпидемиологами: повторяющиеся небольшие вспышки; вторая, еще большая волна инфекций и смертей; или постоянный кризис.Например, Цизек сотрудничал с Майклом Шмидтом из Немецкого Красного Креста, чтобы использовать высокотехнологичные машины, обычно предназначенные для скрининга донорской крови, для проведения группового тестирования на COVID-19 у пациентов, госпитализированных в Университетскую больницу Франкфурта в Германии. В результате пациенты с сердечными заболеваниями или другими заболеваниями, которые, возможно, избегали больницы из-за опасения заразиться вирусом, могут быть обследованы и помещены в отделения, не относящиеся к COVID. Исследователи говорят, что политические лидеры настаивают на распространении скрининга на все больницы в Германии по мере восстановления экономики.