Уильям Баум: Динамика выбора. Часть 3

«Человек в котелке» Рене Магритт
«Человек в котелке» Рене Магритт (rgb_glitch)

Частые переходы в течении сессий: процедура Дэвисона-Баума

Другим подходом в изучении динамики выбора в разных временных промежутках является организация многих переходов кормового соотношения (food ratio) в течение отдельных сессий. Процедура, которую изучали Дэвисон и я, представлена семью различными соотношениями, в течение сессии, разделенных затемнениями и отсутствием сигнала, действующего в конце отключением электроэнергии. Каждое кормовое соотношение компонентов длится на протяжении нескольких подач корма, обычно 10 или 12, а затем начинается затемнение. Мы запускаем много таких сессий, как правило, от 65 до 100, а затем используем последние (от 50 до 85) в анализе. Таким образом, мы изучаем производительность, которая является стабильной от сессии к сессии, но которая показывает динамику в пределах сессий. На протяжении многих стабильных сессий мы собираем большие образцы событий в меньшем, чем сессия временном промежутке. Это позволяет нам усреднять во многих случаях мелкомасштабные события.

Верхний график на рисунке 12 показывает динамику выбора от подачи к подаче корма в пределах различных компонентов (Baum & Davison, 2004). Данные между голубями для каждого компонента были объединены во всех его случаях (т. е. один в сессии). Коэффициент поведения рассчитывался для клевков перед подачей корма (ноль по оси х), а затем для клевков, возникающих после первой и до второй подачи корма, а затем для клевков после второй и до третьей, и так далее. В среднем,мы видим интервал между подачей корма как шкалу. Выбор начинается почти безразлично, а затем движется в направлении кормового соотношения, за исключением соотношения 1: 1, для которого выбор остается почти безразличным. Мы видим равновесие, показанное на рисунке 4, но в меньшем временном отрезке, чем на рисунке 5 или в течение нескольких сессий у Мазура (1992) на рисунке 7. К девятой подаче корма выбор разделился между компонентами, хотя процесс может быть неполным или ограниченным по своей природе, поскольку большие коэффициенты практически не различаются; когда кормовое соотношение составляет 9:1 или 27:1, «щедрая» кнопка может подавать корм 12 раз подряд, делая коэффициенты неразличимыми. Закрытый осмотр показывает, что отношение поведения log (base 2) значительно сокращается по отношению к кормовому соотношению, что указывает на недочеты, как в данных Мазура на рисунке 7. Нижняя диаграмма на рисунке 12 подтверждает эти мысли, показывая соотношение поведения по сравнению с соотношением корма для последних трех подач корма. Хотя линия регрессии соответствует данным (r2 = .97), наклон линии (0,46) показывает значительное несоответствие.

Рис.12 Внутрикомпонентный выбор, рассчитанный для каждого интервала между подачами корма, из одного условия эксперимента, описанного Баумом и Дэвисоном (2004). Сверху: по мере того, как увеличивается количество подач корма, выбор переходит от равнодушия к уровню, соответствующему кормовому соотношению. Снизу: соотношение поведения (последние три точки на верхнем графике), полученное кормовое соотношение по семи компонентам. Линия регрессии точно соответствует точкам, но показывает значительное несоответствие в конце компонентов.

В этом временном промежутке мы с Дэвисоном разработали простую математическую модель для того, чтобы зафиксировать изменения в выборе между подачей корма, чередуя подачи корма с левой и правой кнопки (Baum & Davison, 2009). Мы использовали уравнение:

где Bi — отношение log peck (слева / справа) между i-ой и i + 1-ой подачей корма, A — эффект от выбора i + 1-ой подачи корма (положительный для корма, поданного клевком левой кнопки, отрицательный для корма поданного клевком правой кнопки), а w — вес корма по отношению к настоящему выбору Bi в усреднении, который предсказывает следующий выбор Bi + 1. Обновление прогнозируемого выбора с подачей корма по уровнению 1, мы смогли объяснить 90% дисперсию по выбору в этом временному промежутку.

Самоподобие и редукция на малых временных промежутках

Этот же эксперимент дает нам примеры как самоподобия, так и редукции. Обработка интервалов между подачей корма в целых единицах игнорирует динамику, которая может возникать между подачами корма. Предпочтительные импульсы, подобные показанным на рисунке 8, позволяют нам исследовать динамику в интервалах между подачей корма. Временной отрезок меньше; предпочтительные импульсы могут быть обнаружены в небольших ячейках времени (например, 1-3 с) после подачи корма или, как показано на рисунке 8, клевок за клевком, что означает, что единица представляет собой время для клевка. В любом случае, предпочтительные импульсы производятся путем усреднения по многим образцам подачи корма, например, в выборке из 80 сессий (560 компонентов) можно найти 280 экземпляров первой подачи корма, поступающем с левой кнопки.

Верхний график на рисунке 13 показывает импульсы предпочтения, следующие за различными кормовыми последовательностями в начале компонента: одна подача корма из левой кнопки (L); подача корма из правой кнопки (R); две подряд из левой кнопки (LL); и две подряд из кнопки (RR). Как и на рисунке 8, Мазур (1992), по-видимому, появляются на горизонтальной оси как суррогат для времени. Поэтому мы можем наблюдать следующую картину: 1-й клевок, затем 2-й и 3-й клевки, затем 4-7-й, 8-й-15-й, 16-й и 31-й, и далее по 32-ого. Это было сделано для того, чтобы размеры образцов были большими, потому что размер выборки неизбежно уменьшается со временем с момента подачи корма, поскольку все меньше и меньше интервалов достаточно для предоставления данных. На этих кривых мы снова видим динамическую картину тревог, за которой следует движение к равновесию (Рисунок 4). В этом временном промежутке сам корм представляет собой тревожное событие. Сразу после подачи корма выбор благоприятствовал только продуктивной кнопке — тем более, если подача производилась два раза подряд. Однако, когда время и клевки продолжались, выбор упал в сторону безразличия. Точки помеченные как «нет» показывают выбор с начала компонента перед подачей корма.

Рис.13 Динамика выбора после доставки корма в эксперименте Баума и Дэвисона (2004). Сверху: выбор после выбора компонента (бриллианты) и последующие подачи (треугольники) или две (квадраты) доставки корма с левой кнопки (заполненные символы) или правой кнопки (незаполненные символы). Первая точка представляет собой все первые клевки, вторая точка клевки 2 и 3, третья точка — 4—7, четвертая точка — 8—15, пятая точка — 16—31, а последняя точка — все за пределами 32. Импульсы предпочтения появляются после одного или двух подач корма. Нижняя часть: отношение корма, рассчитанное на основании следующей подачи корма после начала компонента (бриллианты) или одного или двух подачи корма из левой или правой кнопки. Корм, произведенный каждой группой клевков по горизонтальной оси, был суммироваа для левой и правой кнопок с рассчитанным соотношением.

На нижнем графике рисунка 13 показано кормовое соотношение, рассчитанное на основе левой или правой кнопки. Например, первый клевок произвел подачу корма, иногда этот клевок производил корм из левой кнопки, иногда из правой, а на графике показано соотношение подач корма после левой и правой кнопок. Аналогичным образом, если второй или третий клевки произвели корм, вторая точка показывает отношение подачи корма с левой точки к правой и т. д. График показывает то, что если бы следующая подача корма произошла в ближайшее время, это, скорее всего, было бы из той же кнопки, что и раньше — если бы эта кнопка произвела корм два раза подряд. Однако, если следующая подача корма произошла позже, у нее было меньше шансов быть той же кнопкой, что и раньше.

Сходство верхних и нижних графов на рисунке 13 предполагает, что сдвиги относительной вероятности корма могли быть дискриминационными и могли бы установить сдвиги в выборе; выбор может отслеживать кормовое соотношение. Рисунок 14 анализирует эту идею, построив распределение поведения по отношению к распределению корма для каждой пары точек на рисунке 13. Подгонка хороша (r2 = .88), хотя наклон линии регрессии (0.64) указывает на значительное несоответствие. Этот результат предполагает, что выбор тяготел к распределению корма, но сдвиги по выбору недооценивали сдвиги в относительной вероятности корма. Сравнивая рисунок 14 с нижним графиком на рисунке 12, мы видим сходные отношения между выбором и распределением корма, но в разных временных масштабах. На рисунке 14 показано соотношение в меньшем временном промежутке, чем на рисунке 12. Наклон линии на рисунке 14 является более крутым, поскольку динамика между подачами корма была значительной; выбор варьировался в пределах предпочтительного импульса, а выбор измерения по интервалу между подачами корма, как на рисунке 12, усреднялся по импульсу предпочтения. Тем не менее эти два отношения напоминают друг друга, и оба они напоминают сильно расширенное соотношение, показанное на рисунке 6. Таким образом, можно было бы рассмотреть три графика вместе, чтобы представить самоподобие во временных масштабах.

Рис.14 Выбор отслеживания относительного корма в эксперименте Баума и Дэвисона (2004). Линия регрессии указывает, что выбор имеет тенденцию соответствовать относительному корму, но со значительным несоответствием. Этот результат можно интерпретировать как пример самоподобия во временных масштабах.

Для примера редукции мы переходим к еще меньшему временному интервалу: шкале проб, приступов или переключений (Рисунок 10). Как показано на рисунке 13, мы смотрим между подачами корма в приступах после одной подачи корма и до следующей подачи корма. На рисунке 15 показаны пробы только что производительной кнопки и затем переключения; переключения сразу после корма опущены, из-за того, что они были относительно редки (Baum & Davison, 2004). Пробу можно определить как серию клевков, начинающихся с корма или переключения до следующего переключения. Таким образом, пробы были двух типов: посткормовые и постпереключенные. Пробы были усреднены способом, аналогичным усреднению в импульсах предпочтения, через сессии и компоненты в соответствии с последовательностью подач корма. Посткормовые пробы всегда были длиннее, чем пробы постпереключенные. Каждый треугольник показывает среднюю пробу, после ряда подач корма подряд из одной и той де кнопки. Строки без символов, спускающихся с треугольника, показывают последующие девять проб после перерыва. Первый треугольник и линии ниже него показывают 10 проб после первой подачи корма. Второй треугольник и линии под ним показывают 10 проб, следующих за двумя подачами корма подряд из одной и той же кнопки и так далее. Очевидна динамическая картина. Треугольник указывает на длительную посткормовую пробу к исключительно продуктивной кнопке, и линия под треугольником показывает первую короткую сессию после перехода к не-продуктивной кнопке, а затем следующая постпереключенная проба к просто продуктивной кнопке, который короткий, но немного длиннее, чем проба непроизводительной кнопки и т. д. Реагирование переключалось между кнопками, переходы на доступ к быстродействующей кнопке оставались дольше, чем при переходе на неэффективную кнопку. Действительно, проба не-продуктивной кнопке всегда были примерно одинаковыми — между 1.5 и 1.8 клювами, что указывает на то, что многие из них состоят из одного клевка, соответствующего шаблону «фиксация и замер» (Рисунок 9). Поскольку больше корма продолжалось до подачи корма из одной и той же кнопки, динамический шаблон расширяется, становясь стабильным после восьми подач корма подряд. Линия, начинающаяся с бриллианта в ноль на оси х, показывает, что этот динамический рисунок был заметен до некоторой степени, и даже, до любой подачи корма, в то время как анализ начинается с того, какая кнопка клевалась вначале компоненты.

Рис.15 Пробы или приступы внутри компонентов в эксперименте Баума и Дэвисона (2004). Треугольники показывают первую пробу кнопки после серии от 1 до 11 подач корма из той же кнопки. Строки, простирающиеся вниз от треугольников, показывают пробу после этой пробы, чередуя не только продуктивную кнопку, но и просто производительную кнопку. Динамическая картина длительной пробы, сопровождаемая более короткими чередующимися пробами, появляется после первой подачи корма и становится более выраженной с дальнейшими продолжениями. Линия, начинающаяся с алмаза в ноль по оси x, показывает рисунок в пробах перед любой подачей корма, когда расчеты рассчитываются с первой кнопки. Квадраты показывают первую пробу после подачи корма с другой кнопки. Динамический шаблон проявляется только сначала, когда подача корма предшествует переключению кнопки; когда предшествует более одного продолжения, проба послепродажного обслуживания является относительно которой, и проба на обеих кнопках все еще короче, что указывает на быстрое чередование. Эта динамика представляет собой пример сокращения в небольшой временной шкале.

Квадраты на рисунке 15 показывают пробы послекормового обслуживания после прекращения приема — одна или несколько подач корма из одной кнопки, за которым следует подчаа из другой кнопки. Они намного короче проб посткорма после продолжений (треугольники). Тот же динамический шаблон появляется в сильно затухающей форме, за исключением первого квадрата, прекращение после следующей подачи на другой кнопке (2 по оси x). Кроме того, рисунок лезвия пилы исчезает, хотя проба постпереключения следует за пробой посткорма короче и ближе к минимальной пробой (около двух клевков за пробу). Чем больше предшествующих продолжений, тем меньше паттернов появляется в пробах после прекращения.

Рисунок 15 является примером редукции, поскольку динамика, очевидная при переключении, даже если они отражают предпочтение между кнопками и не имеет никакого сходства с законом соответствия, который появляется на рисунке 14. Мы не можем выводить схемы переключения как на рисунке 15 из предпочтительных импульсов на рисунке 13, но мы можем получить импульсы предпочтения из схем переключения. Чтобы проиллюстрировать это, мы можем создать простую модель проб следующим образом. Предположим, что посткормовые пробы длинные, в среднем от 0 до 10 клевков с распределением по частоте, как показано в таблице 1. Такое распределение приближается к тем, которые действительно происходят, за исключением того, что реальные имеют хвост после пробы 10-ти клевками (Aparicio & Baum, 2006; Baum & Davison, 2004). Предположим, что пробы постпереключения короче — всего 1 или 2 (одинаково часто) на не-продуктивной кнопке и 3 или 4 клевков (одинаково часто) на только что производительной кнопке. Построим последовательности проб следующим образом. Каждой из 11 проб после отправления следуют две последовательности постпереключения 1-4 и 2-3. Эти 22 последовательности проб устанавливают 22 последовательности клевков. Для каждого клевка после подачи корма, мы суммируем частоты клевков левой кнопки и клевки правой кнопки через 22 последовательности после подачи корма от левой кнопки и соотношение лево-право от первых клевков, вторых клевков и т. д., до 25-го клевка. Результат показан на рисунке 16. Этой простой модели достаточно для формирования импульса предпочтения. То, что мы можем получить импульс предпочтения от проб, но не наоборот, показывает то, что мы можем редуцировать выбор шаблонов переключения.

Рис.16 Аппроксимация импульса предпочтений, полученного из простой модели динамики переключения, показанной на рисунке 15. Импульс предпочтения и соответствие, могут быть получены из динамики переключения, но не наоборот.
Таб.1 Частотное распределение длины посткормовой пробы, используемое в модели на рисунке 16, импульс предпочтения, от проб или переключений.

Рисунок 16 подразумевает, что приступы или переключения представляют меньший временной промежуток, чем предпочтительные импульсы. Это упорядочивание может показаться нелогичным, потому что импульсы вычисляются по кнопке. Кнопки, однако, выдерживают время — каждый представляет собой единицу времени, и импульс можно вычислить, используя вместо этого небольшую единицу времени, такую ​​как секунда. Вычисление импульса игнорирует переключения, размывание различных проб и усреднение по ним, тогда как переключения, заканчивающие пробы, представляют собой короткие события, связанные только с одной кнопкой. Длительность проб кнопки зависит от вероятности переключения на другую кнопку, и это переключение является событием в меньшем временном промежутке, чем временные единицы импульса.

Вывод

Самоподобие или инвариантность могут возникать во всех временных промежутках или во всех, кроме самых маленьких. Редукция происходит тогда, когда рассматривается динамика выбора в наименьших временных отрезках. Можно подумать, что отношения в наименьшем временном промежутке должны быть «фундаментальными», но традиционный молекулярный взгляд на поведение будет приоритезировать малые промежутки, совпадающие с его предположениями о дискретных моментных событиях и смежности (Baum, 2002; 2004). В то же время молярный взгляд рассматривает закономерности во всех временных масштабах как релевантные и обоснованные. Ничто не является «фундаментальным», потому что все может быть интересным или полезным. Практические соображения могут благоприятствовать исследованиям или применению в любом временном масштабе. В прикладном анализе поведения, в частности, закономерности в наименьшей временной шкале могут быть малопригодными или интересными (Baum, 2003). Например, когда речь идет о проблемном поведении в классе, вознаграждение учительским вниманием или похвалой в определенные моменты может быть непрактичным и, во всяком случае, достаточно отношения в более длительном временном промежутке. Таким образом, прикладные проблемы могут потребовать вмешательства в длительном временном отрезке в качестве практического вопроса, а вмешательства в небольшом промежутке могут оказаться менее эффективными. В целом, для изучения поведения в разных временных масштабах наиболее полезным является использование молярной концепции поведения (Baum, 2002; 2004).

Часть 1, Часть 2
Автор: William M Baum
Оригинал: Dynamics of Choice: A Tutorial
Вольный перевод: Евгений Дудич

Поделиться
Отправить
Запинить
Популярное