Уильям Баум: Динамика выбора. Часть 2

«Геркулес на распутье» Аннибале Карраччи
«Геркулес на распутье» Аннибале Карраччи (ditherAtkinsons)

Динамика и шкала времени

На рисунке 5 показано важное различие между установившимся или равновесным поведением и динамикой, наблюдаемой в переходной фазе. При оценке устойчивого состояния потребовалось бы, чтобы некоторые из заключительных сессий усреднялись до несистематических колебаний, тогда как для просмотра динамики требуется, чтобы сессия за сессией для изменения распределения был видимыми. На практике оценка устойчивого состояния требует большого промежутка времени, тогда как для просмотра динамики требуется более короткий промежуток. На рисунке 5 более короткий временной отрезок основан на сессии как единице, но когда условия меняются от сессии к сессии, устойчивое состояние может возникать в пределах сессии, а затем более короткий временной промежуток требует меньше показатель, чем вся сессия. В процедурах, которые содержат несколько компонентов, каждый из которых имеет различное соотношение, в течение каждой отдельной сессии подход к стабильности может возникать в еще меньшем промежутке времени, и для просмотра динамики требуется еще меньший показатель, например интервал между подачей корма (Aparicio & Baum, 2009; Baum & Davison, 2004). Динамика может возникать даже в пределах интервала между подачей корма, а затем требуется показатель поменьше, например, ограниченный переключателем от одной кнопки к другой.

Самый длинный промежуток времени, который обычно изучается — стационарное состояние или равновесие на протяжении сессий, как показано на рисунке 5. В этом эксперименте были изучены несколько соотношений, кроме тех, которые показаны на рисунке 5, и соотношение между отношением поведения и соотношением в равновесии представлено на рисунке 6. Пунктирная линия на рисунке 6 представляет собой локус идеального соответствия, в котором отношение поведения (behaviour ratio) будет равно соотношению. Точки данных привязаны к линии сплошной регрессии, уравнение которой находится справа. Линия имеет наклон s = 0,8, и поэтому не сходится с пунктирной, этот результат называется несходимостью (Baum, 1974, 1979). Тщательный осмотр на рисунке 5 показывает, что три устойчивых состояния лежат недалеко от log (base 2) установленного соотношения — 6.0 для 64:1, — 5.0 для 1:32 и 7.0 для 128:1 — как можно было бы ожидать от отношения сопоставления (matching relation).

Рис.6 Соотношение соответствия (matching relation) между стационарными оценками выбора, основанными на нескольких сессиях (Baum et al., 1999). Линия регрессии показывает отношение между log (base 2) поведенческого соотношения (распределения) и log (base 2) кормового соотношения. Наклон 0,8 показывает несходимость.

Хотя сопоставление является надежным нахождением, оно не обязательно говорит нам о динамике, потому что это отношение проявляется во многих устойчивых состояниях, между которыми динамика просто опускается. Можно ли найти совпадение в динамике, как и в равновесии, вопрос, требующий от нас взглянуть на поведение между устойчивыми состояниями. Если мы узнаем, что отношение соответствия (matching relation) каким-то образом есть в динамике, мы могли бы рассмотреть соотношение соответствия (matching relation) для объяснения результатов в равновесии. Однако, если бы какое-то другое отношение было применимо к динамике, то мы ожидали бы, что это отношение будет предсказывать соответствие при равновесии, но сопоставление при равновесии не относится к динамике. Мы вернемся к этому вопросу позже, когда обсудим редукцию.

Пример динамики, которая отражает соотношение соответствия (matching relation), появляется в некоторых данных, собранных Мазуром (1992), с использованием стандартных параллельных режимов подкрепления с переменным интервалом (VI) (рисунок 2). На рисунке 7 показаны некоторые результаты Мазура из процедуры, в которой установившееся состояние было достигнуто с кормовым соотношением 1:1, а затем соотношение резко переключилось на неравное — 60:40, 75:25 или 90:10, (Banna & Newland, 2009, для недавнего аналогичного эксперимента.) Линии показывают динамику в течение первой сессии кормового соотношения. Поскольку подход к новому равновесию происходит в рамках сессии, Мазур измерил выбор в меньших показателях, в 9-ти или 15-ти минутных выборках. Выбор начинается почти с безразличием (ноль) — предыдущим устойчивым состоянием. Каждая кривая напоминает подход к равновесию, идеализированный на рисунке 4, и показанный на рисунке 5, но в меньшем временном промежутке, чем на рисунке 5. Мазур не показывал кормовое соотношение в блоках, но поскольку каждая кривая поднимается к новому уровню кормового соотношения, можно предположить, что выбор был отслежен постепенным приближением кормового соотношения к установленному соотношению. Тем не менее для каждого условия оно не подходит, но никогда не достигает уровня, который соответствовал бы соотношению несоответствия.

Рис.7 Внутрисессионная динамика в эксперименте Мазура (1992). Первая точка в каждой кривой представляет последние 15 минут исполнения при равных параллельных режимах с переменным интервалом подкрепления (50/50), а кривые показывают выбор в 9-ти и 15-ти минутных блоках первой сессии после изменения соотношения продуктов питания от 50/50 до 90/10, 75/25 или 60/40. Выбор движется к новому уровню, соответствующему новому кормовому соотношению.

Другой результат Мазура (1992) показан на рисунке 8, иллюстрирующим еще меньший временной промежуток. На этих графиках, выбор показан клеванием и первые шесть клевков сопровождались подачей корма. Каждый график основан на выборке из 500 клевков. Некоторые из этих клевков были подкреплены подачей корма, и Мазур подсчитал процент этих клевков. Он сделал то же самое для эксперимента с подачей корма после вторых клевков, третьих и так далее. При построении рисунка 8, я преобразовал проценты Мазура в соотношения клевков (только-продуктивная кнопка / не только-продуктивная кнопка). Быстрая подача корма после «щедрой» кнопки отдавала строго предпочтение продуктивной кнопке. Быстрая подача корма после клевания «щедрой» кнопки слабо отдавала предпочтение только продуктивной кнопке, но вскоре переключился на «щедрую» кнопку (отрицательное соотношение). Для режима на 75:25 отдавался приоритет «щедрой» кнопке даже после быстрой подачи корма после клеваний «скупой» кнопки. Как же эти локальные сдвиги относятся к отношению соответствия (matching relation) еще предстоит выяснить. Дэвисон и я называем такие графики «предпочтительными импульсами» (Davison & Baum, 2000; 2003; 2006).

Рис.8 Выбор в меньшем временном промежутке в эксперименте Мазура (1992). Первая точка на каждой кривой показывает первые клевки после подачи корма в выборке из 500 клевков. Вторая кнопка показывает все вторые клевки после подачи корма и т. д. Выбор показан в виде «клевок за клевком» при «скупой» альтернативе (нижний график) и «щедрой» альтернативе (верхний график) в каждом из трех условий на рисунке 7 в конце пяти сессий экспозиции. Предпочтительные импульсы проявляются при условиях 90/10, и только после подачи корма из «скупой» кнопки при условии 60/40.

Самоподобие против редукции

В примерах, которые мы рассмотрели до сих пор, вся динамика выбора была рассмотрена на временных промежутках, что позволило рассчитать соотношение поведения в каждом показателе. Если, по мере того, как анализ перемещался бы в меньший и меньший временной промежуток, все еще можно было видеть отношение соответствия (matching relation), и можно было бы сделать вывод о том, что совпадение выполняется до конца (Gallistel, King, Gottlieb, Balci, Papachristos, Szalecki, & Carbone, 2007). Когда одно и то же отношение применяется в каждом временном отрезке — это самоподобие (или масштабная инвариантность). Предположим, однако, что локальные (мелкомасштабные) процессы не отражают расширенную регулярность, т. е., предположим, что расширенное соотношение не очевидно в локальных процессах. Если такие мелкомасштабные закономерности существуют, то соответствие может быть выведено из них, но эти мелкомасштабные закономерности не могут быть выведены из отношения соответствия. Например, предположим, что приступы клевания двух кнопок изменяются обычным образом в пределах интервала между подачей корма. Это будет подразумевать регулярную динамику в переключениях от одной кнопки к другой. Динамика выбора будет редуцирована к приступам или переключениям в этом примере тому, что я назову редукцией.

На рисунке 9 показаны те же сессии, что и на рисунке 5, но с целью понимания переключения между кнопками. Верхний график показывает преобразование среднего числа клевков при пробе «скупой» альтернативы (правая вертикальная ось). Если усредненная проба — это один клевок, то измерение равно 1.0. Во всех трех кормовых соотношениях усредненная проба всегда дольше на первой сессии нового отношения (закрашенные квадраты), когда соотношение только что перешло на «щедрые» и «скупые» кнопки. После нескольких сессий можно заметить приближение к одному клевку. Нижний график показывает вероятность посещения «скупой» кнопки, рассчитанного для каждой сессии (количество посещений «скупой» кнопки, деленное на количество клевков «щедрой» кнопки). Это начинается с пика, когда альтернатива была недавно «щедрой», но падает до низкого уровня — самый низкий для 128:1, выше для 64:1 и самый высокий для 32:1. Эту схему фиксации на «щедрой» кнопке и иногда пробу «скупой» кнопки, в соответствии с кормовым соотношением можно назвать «фиксация и замер» (Aparicio & Baum, 2006; Baum et al., 1999; Baum & Davison, 2004).

Рис.9 Те же данные из Baum et al. (1999), что показаны на рисунке 5, для отображения сессии за сессией среднего числа клевков при пробе «скупой» кнопки (квадраты, вертикальная ось справа) и вероятность пробы «скупой» кнопки (треугольники, вертикальная ось слева ). Зарисованные символы отображают первую сессию нового условия. Кратковременные пробы «скупой» кнопки и оцененные вероятности пробы «скупой» кнопки согласуются с шаблоном «фиксации и замера».

Динамика выбора, наблюдаемая при пробе кнопок, может рассматриваться также в первой сессии нового кормового соотношения. На рисунке 10 показаны все пробе первой сессии трех условиях того же эксперимента: первая сессия кормового соотношения 4:1 после 1:256, 1:8 после предыдущего 4:1 и 64:1 после предыдущего 1:8. Каждый график показывает одну сессию. Вертикальная ось представляет собой такое же преобразование продолжительности пробы, как на рисунке 9, но с такой добавленной функцией, что проба левой кнопки — положительный момент и посещение правой кнопки — отрицательный. Поскольку пробы необходимо чередовать, они запечатлены как «проба за пробой». Проба ранее «щедрой» кнопки продолжительней вначале, но в какой-то момент во время сессии (в круге) это изменяется довольно резко.

Рис.10 Первая сессия каждого из трех условий у Baum et al. (1999) эксперимент показал пробы как те, что чередуются между левыми и правыми кнопками. Вертикальная ось представляет такое же преобразование продолжительности посещения, как на рисунке 9, за исключением того, что визиты справа представлены как отрицательные. Длина каждой вертикальной линии показывает продолжительность одного посещения. Маленькие бриллианты показывают подачу корма. Треугольники и квадраты показывают преобразованную продолжительность посещения в конечном стабильном состоянии; те, что слева — для предыдущего условия, а справа — для нового условия. Отсутствие каких-либо следующих за пищей клевков «скупой» кнопки (проба с нулевой длиной), выглядит как квадрат на горизонтальной оси. Каждый график показывает одну сессию. В начале сессии шаблон проб соответствует предыдущему условию, и в какой-то момент во время сессии (в круге) шаблон переключается в сторону «щедрой» кнопки; пробы «щедрой» кнопки становятся продолжительными, а пробы «скупой» кнопки — короткими.

Рисунок 11 отображает три сессии таким образом, чтобы выявить динамику и непредсказуемость сдвига. Светлая линия показывает накопленную подачу корма (правая вертикальная ось), с левой подачей корма, записана как +1, и правая подача корма, записана как -1. Каждая строка начинается с нуля (вертикальная ось справа) и склоняется в сторону «щедрой» кнопки. Толстая линия показывает накопленные клевки. Выбор сначала склонен к ранее «щедрой» кнопке, а затем поворачиваетсяв сторону «щедрой» в настоящее время кнопки. Таким образом, динамика выбора появляется при переключении между кнопками на протяжении сессии.

Рис.11 Те же данные, что и на рисунке 10, были заменены, чтобы показать относительно резкую смену шаблона. Более светлая линия показывает накопленную подачу корма (вертикальная ось справа), рассчитанная путем добавления +1 для подачи корма от левого ключа и -1 для доставки еды с правой клавиши. Линия начинается с нуля, и наклон показывает, какая альтернатива была более «щедра». Линия потолще (бриллианты) показывает накопленные клевки, рассчитанные путем добавления клевков в каждой пробе левой кнопки и вычитания клевков при каждой пробе правой кнопки. В каждой сессии накопленные клевки изначально имеют наклон, соответствующий предыдущему состоянию, а затем резко переключаются в том же направлении, что и накопленный корм.

Часть 1, Часть 3
Автор: William M Baum
Оригинал: Dynamics of Choice: A Tutorial
Вольный перевод: Евгений Дудич

Поделиться
Отправить
Запинить
Популярное