Позднее Ctrl + ↑

Геймификация как инструмент поведенческой экономики

Геймификация как инструмент поведенческой экономики

Несмотря на то, что геймификация является самодостаточной концепцией (относительно самодостаточной в рамках бихевиоризма), ее можно связать с теорией «подталкивания». Принципы геймификации могут применяться в различных областях для модификации поведения человека, поэтому ее можно рассмотреть как один из инструментов подталкивания для улучшения жизни людей.
Геймификация — новый термин и имеет свое происхождение в цифровой индустрии. Несмотря на то, что эксперты уже использовали этот термин в 2008 году, он привлек большое внимание общественности в конце 2010 года. До сих пор геймификация является спорной темой среди экспертов из различных отраслей, таких как цифровые медиа, технологии, экономика, дизайн и психология. Это является причиной не только появления множества разных терминов, например, «серьезные игры», «игровой дизайн», «игривый дизайн» и т. д., но и путаница в значении всех этих терминов [1]. Несмотря на эти путаницы игровой элемент становятся все более важными в формировании повседневной жизни и взаимодействии людей: «Игровой дизайн является ценным инструментом для создания неигровых продуктов, услуг или приложений, более приятных, мотивирующих и привлекательных в использовании.» [1]
Также необходимо прояснить то, что игра не ограничивается цифровыми продуктами. Хоть в настоящее время и существуют более цифровые примеры геймификации, эта концепция имеет как цифровую так и аналоговую имплементацию.«Геймификация — это использование игрового дизайна в неигровых контекстах.»[1]

Самый яркий и популярный пример геймифицированных подталкиваний — это инициатива под названием «The Fun Theory» от Volkswagen, которая «посвящена той идеи, что игра и забава — самый простой способ изменить поведение людей в лучшую сторону». Главный вопрос, который поставили перед собой разработчики проекта: «Если бы лестницы издавали звуки музыкальных нот во время хождения по ним, предпочли бы люди воспользоваться эскалатором?». Оказалось, что 66% людей начали использовать музыкальную лестницу, вместо эскалатора! Стоит заметить, что в дальнейшем, по мере того как часто человек проходил данное место и оно становилось рутинным, он, скорей всего, возвращался к эскалатору, но для новых пешеходов до некоторого времени сохранялось чувство игры.

Piano Stairs - Behind the scenes
Проект геймификации «Piano Stairs» в Стокгольме

Компания Volkswagen провела еще несколько экспериментов, связанных геймификацией гражданского поведения.

Проект «The World’s Deepest Bin». Геймификация выброса мусора

Проект «Bottle Bank Arcade Machine». Геймификация сдачи бутылок для утилизации.

Теоретическая база игрового дизайна и геймификации уже достаточно проработана и состоит из множества концепций и классификаций. Например, «серьезные игры» — игры без развлекательных целей, но с фокусом в сторону образования [2]. Данный тип игр приоритезирует использование вместо расширения, дизайн вместо игровых технологий, отдельные элементы вместо полноценных игр, неигровой контекст [1]. Чтобы лучше ознакомится с термином ludification of culture и увидеть корреляций между геймификацией и связанными с ней концепциями нужно взглянуть на следующий рисунок:

Концепция «Ludification Culture
Концепция «Ludification Culture»[1]

Для полного представления об элементах игры, их нужно отделить от самой игры. Игра состоит из целей, правил и усилий участников игры в достижении этих целей. Она предполагает развлечение, забаву, растянутую во времени, неопределенную и захватывающую управляемыми правилами [3]. Для концепции геймификации существуют некоторые требования, которые должны быть реализованы. Она не должна полностью развлекать, но скорее мотивировать и повышать продуктивность игрока. Таким образом, элементами геймификации являются рейтинги лидеров, уровни, виртуальные товары, подарки, бейджи и социальные атрибуты. Кроме того, система должна устанавливать цели для игроков и правила, в рамках которых их можно достичь. Наконец, мгновенная обратная связь необходима для поддержания сильных и запоминающихся впечатлений у игрока [4]. Учитывая теорию маркетинга, геймификация предназначается для создания и повшения ценности сервисов для пользователя, так как геймификация работает в том случае, если пользователь активно вовлечен процесс [5]. Таким образом, степень полученного от игры удовольствия и азарта всегда основаны на индивидуальном восприятии пользователя: «Геймификация связана с процессом улучшения сервиса и возможностью получения игрового опыта и создания ценности для пользователя.»[6]

____________________________________________________________
1.S Deterding, R Khaled, LE Nacke, D Dixon (2011) Gamification: Toward a definition
2.P Bajdor, L Dragolea (2011) The gamification as a tool to improve risk management in the enterprise
3.K Erenli (2013) Gamify Your Teaching-Using Location-Based Games for Educational Purposes
4.P Herzig, M Ameling, A Schill (2012) A generic platform for enterprise gamification
5.P Zotz, W Dominik (2016) Decision Making in Design Context Reflections on Nudge Concept and Gamification
6.K Huotari, J Hamari (2012) Defining gamification: a service marketing perspective

Nudge: область применения и факторы архитектуры выбора

Nudge: область применения и факторы архитектуры выбора

Область применения подталкиваний

При разработке подталкиваний необходимо учитывать такие важные факторы: (1) временной промежуток в  выгодах и издержках (costs & benefits), (2) уровень сложности, (3) частота, (4) обратная связь и (5) предпочтения:
1. Чрезвычайно сложно для человека принять правильное решение, когда последствия трудно связать с самим действием и нет мгновенной обратной связи. Поэтому решение, например, о ежедневных физических упражнениях и длительных диетах требует определенных усилий. Напротив, очень легко начать потреблять сладости и алкоголь из-за их мгновенной положительной обратной связи. Следовательно, человек вынужден страдать от недугов, таких как ожирение, алкоголизм, и в таких ситуациях принято применять «подталкивания»[1, c.80].
2. Уровень сложности является важным фактором определяющим необходимость подталкивания. Обычному человеку не требуется толчок для простого решения, но когда выбор становится более сложным, подталкивания очень ценны. Поэтому для процесса принятия решений в сложной ситуации, подобной выбору наилучшей ипотеки люди могут использовать подталкивания [1, c.81].
3. Уровень сложности решения уменьшается по мере возрастания частоты его принятия. Здесь проблема заключается в том, что большинство сложных решений на протяжении жизни принимаются человеком не так уж и часто, например, покупка дома, автомобиля или выбор образовательного учреждения.
4. Первый упомянутый выше фактор касался своевременной корреспонденции или прямой обратной связи, но нужно понимать, что сама обратная связь является одним из важнейших факторов оптимального принятия решений. Если человек не понимает, что он делает, он не сможет научиться на своих ошибках. Следовательно, подталкивание можно и нужно применять тогда, когда у принимающего решение человека существуют некоторые проблемы с обратной связью [1, c.82].

5. Одно из основных условий оптимального выбора состоит в том,что люди должны осознавать свои предпочтения. Очевидно, что многие люди действительно не знают, чего они хотят в некоторых ситуациях и поэтому легко принимают неоптимальные для себя решения. Одной из причин таких случаев является неспособность соотнести существующий выбор с результатом этого выбора в будущем: «Когда людям трудно предсказать, как их выбор в конечном итоге повлияет на жизнь, у них остается меньше шансов на успех из-за множественности вариантов выбора» [1, c.84].

2527900 Книга Thaler& Sunstein «Nudge. Improving Decisions About health, wealth, and happiness»

Во все описанных выше ситуациях, можно проектировать «подталкивания» с целью помочь людям улучшить свою жизнь. Поскольку данные ситуации могут возникать в различных контекстах, концепция «подталкивания» может оказывать положительное влияние на частные и общественные проблемы, такие как охрана окружающей среды, семейное право, выбор образовательного учреждения, экономика, политика и многое другое.

Факторы архитектуры выбора

Концепцию «подталкивания» необходимо использовать дизайнерам среды, так как хороший дизайн должен направлять пользователя в правильную сторону и положительно влиять на его жизнь. Концепция подталкивания дает инструментарий для разработки среды и ее состявляющих делая ее более близкими пользователю и обеспечив качественный пользовательский интерфейс. По этой причине необходимо скрупулёзно подойти к тому, как проектировать подталкивания исходя из принципов оптимальной архитектуры выбора. Существуют 6 фундаментальных факторов архитектуры оптимального выбора: (1) стимулы, (2) понимание сопоставлений, (3) вариант по умолчанию, (4) обратная связь, (5) ожидаемая ошибка и (6) сложная структура архитектуры выбора [1, c.109].
1. Несмотря на то, что стимул, является наиболее очевидным и рациональным фактором влияния в процессе принятия решений, он, при условии своей скрытости, может быть крайне опасен для человека. Ни для кого не секрет,что в процессе выбора, люди осознают издержки, связанные с результатом выбора,но также они учитывают соотношение выгод и издержек (costs & benefits). Однако в неоптимальной архитектуре выбора эти факты могут быть скрыты, из-за того, что человек неправильно интерпретирует стимулы. Хорошим примером является скрытые издержки после принятия решения о покупке. Покупка автомобиля — единовременная инвестиция по сравнению с расходами в процессе его использования. Тем не менее большинство людей недооценивают эти расходы, такие как топливо, стоимость страхования, дальнейший ремонт и т. д. Поэтому правильное подталкивание должно состоять из «прозрачных» стимулов.
2. Поскольку людям сложно правильно оценивать сложные продукты или услуги, дизайнеры среды должны сделать варианты выбора более доступными для понимания: «Хорошая система архитектуры выбора помогает людям улучшить их способность сопоставлять и выбирать оптимальные для себя варианты»[1, c.101].
3. Дефолтный вариант являются наиболее важным фактором, так как нет такой ситуации, в которой вариант по умолчанию не влиял бы на сам процесс выбора из-за приоритетной возможности для лица, принимающего решения, ничего не делать. Иногда архитектура выбора предполагает «необходимый выбор», для которого лицо, принимающее решения, обязано активно участвовать в процессе принятия решений для получения результата. Но в большинстве случаев вся архитектура выбора сводится к «автоматическому» дефолтному варианту из-за лени и/или халатности лица, делающего выбор. Таким образом, архитектора выбора должна обеспечить наилучшее возможное состояние по умолчанию для того, чтобы положительно влиять на результаты поведения.
4. Как уже упоминалось, обратная связь — лучший помощник для человека при обучении на своих ошибках и улучшения способности принимать долгосрочные решения: «Лучший способ помочь людям оптимизировать свой выбор — обеспечить обратную связь. Хорошо спроектированные системы сообщают людям, когда они на правильном пути,а когда совершают ошибки».
5. Для того чтобы разработать оптимальный процесс принятия решений, архитектора выбора должна учитывать коэффициент ошибок человека. Поскольку никто не идеален, система должна быть настолько прощающей, насколько это возможно, чтобы человек мог вскоре принять правильное решение, несмотря на недоразумение или ошибку с его стороны [1, c.96-99].
6. Наконец, основное внимание уделяется сложной структуре архитектуры выбора. В целом, люди склонны уменьшать глубину процесса оценки из-за сложности структуры выбора. Во избежание путаницы предпочитается использовать стратегии упрощающие процесс принятия решения,поскольку люди не могут учитывать каждую деталь в сложной архитектуре выбора и, следовательно, совершают ошибки.Поэтому архитектура выбора должна быть настолько логичной и простой, насколько это возможно для обычного человека.

В своем увлекательном докладе Касс Санстайн поведал о теории «nudge» и поведенческой экономике, разбавив сухую теорию увлекательными примерами из практики применения подталкиваний. Приятного просмотра!

____________________________________________________________
1.Thaler, R. H., & Sunstein, C. R. (2009). Nudge. Improving Decisions About health, wealth, and happiness

Либертарный патернализм как благо

Либертарный патернализм как благо

Талер и Санстайн впервые представили концепцию «nudge» в 2008 году. В ней подробно рассматривается процесс принятия решений, и предполагается, что любая среда, независимо от намерения создавшего ее субъекта, «подталкивает» человека. Поэтому, с помощью концепции «подталкивания» можно оптимизировать архитектуру выбора человека относительно различных аспектов его жизни. Например, на процесс выбора детей в школьной столовой влияет сама архитектура столовой, включая витрину, порядок расположения продуктов,освещение и т. д. «Подталкивание средой» происходит независимо от того была ли она кем-то сконструирована или создалась произвольно. Например, оптимизировав расположение ассортимента можно увеличить потребление продуктов здорового питания на 25% [1, c.1-4].
Еще одним популярным примером подталкивания можно привести участок дороги на озере Шор Драйв и Оак Стрит в Чикаго. Резкий поворот делает его одним из самых опасных участков дороги в городе. Чтобы попытаться уменьшить случаи ДТП в сентябре 2006 года были нарисованы перпендикулярные белые линии. Линии сужаются по мере того, как водитель приближается к самому опасному месту дороги, давая ему иллюзию ускорения и подталкивая его притормозить. Согласно анализу, проведенному инженерами городского транспорта, процент аварий упал на 36% за 6-месячный период по сравнению с тем же 6-месячным периодом предыдущего года (сентябрь 2006 года — март 2007 года и сентябрь 2005 года — март 2006 года).

Сама концепция «подталкивания» и лежащие в ее основе антропологические и психологические теории могут эффективно использоваться в дизайне среды. Концептуальной основой для теории «подталкивания» является синтез политических направлений ((https://en.wikipedia.org/wiki/Libertarian_paternalism
либерализма и патернализма)), несмотря на их смысловую контрастность. Либеральный аспект теории тяготеет к сохранению свободы выбора каждого, как и пишут авторы: «Люди должны быть свободны делать то, что им нравится, и иметь право отказаться от нежелательных договоренностей, если они этого хотят» [1, c.5].
Патерналистский аспект представляет мнение о том, что дизайнерам среды разрешено незначительно влиять на поведение людей, если это пойдет им на пользу. Общее улучшение жизни человека является законной причиной применения концепции подталкивания, особенно в тех случаях, когда он сам, скорей всего, сделает необдуманный выбор [1, c.5]. Тонкий момент концепции заключается в том, что самого «подталкивания» при желании можно легко избежать.Поэтому, с гуманистической точки зрения концепция «подталкивания» в целом воспринимается позитивно, поскольку она направлена ​​на борьбу с человеческими ошибками. Особенно тогда, когда люди недостаточно информированы, неопытны или не получают своевременного отклика о правильности или неправильности своих действий, они не могут сделать наилучший выбор самостоятельно [1, c. 10]. Одним из примеров человеческого мышления, пытающегося упростить сложную систему принятия решений, является «status quo bias», который основан на тех предпосылках, что человек с большей вероятностью будет инерционно придерживаться «выбора по умолчанию», чем попытается обдумать и изменить свое решение. Люди, как «экономические агенты» в идеале должны перманентно выстраивать свою архитектуру выбора, делая полную оценку ситуации в каждый момент своей жизни, а это, как мы знаем, требует огромных когнитивных ресурсов. Поэтому дизайнерам среды необходимо мягко и ювелирно ее конструировать, не отнимая свободу выбора, например установив опцию по умолчанию. Также, неправильным есть представление о том, что либеральный патернализм должен постоянно действовать. Свобода выбора, встроенная в концепцию, обеспечивает удачную архитектуру выбора [1, c.12].

Чтобы получить целостный взгляд на важность «подталкивания», есть определенные наработки в области человеческой психологии и, особенно, проблемах самоконтроля в сумме с искушением и бессмысленностью. Эти два фактора человеческой психологии являются причиной поведения, которое называется «динамической несогласованностью». Это означает, что человек внезапно меняет свое мнение: например, остается в постели до обеда из-за теплого одеяла, хотя накануне вечером он планировал рано встать и отправиться на утреннюю пробежку. Это происходит потому, что люди действуют в соответствии с их «отражающей системой» мозга, когда они принимают дальновидные решения, не поддаваясь влиянию факторами во время принятия этого решения. Напротив, «автоматическая система» мозга берет верх, когда люди испытывают давление различных соблазнов.

Также, концепция «подталкивания» основана на поведении человека под давлением со стороны окружения и других социальных конструкций. Человеку нравится соответствовать его социальному окружению. Его действительно очень заботит мнение о себе. Степень конформности может доходить до того, что человек скорее навредит себе для избежания критики социума в свою сторону. Основанные на этой теории исследования подтверждают высокую вероятность того, что человек наберет вес, если люди из его окружения тоже набирают вес. Поведенческий паттерн переедания и нездорового питания, в данном случае является заразным [1, c.59].
Поэтому целью концепции nugde является использование знаний о человеческом мозге и поведении и разработка архитектуры выбора, которая поможет улучшить процесс принятия решений [1, c.67].

____________________________________________________________
1.Thaler, R. H., & Sunstein, C. R. (2009). Nudge. Improving Decisions About health, wealth, and happiness

Уильям Баум: Динамика выбора. Часть 3

«Человек в котелке» Рене Магритт
«Человек в котелке» Рене Магритт (rgb_glitch)

Частые переходы в течении сессий: процедура Дэвисона-Баума

Другим подходом в изучении динамики выбора в разных временных промежутках является организация многих переходов кормового соотношения (food ratio) в течение отдельных сессий. Процедура, которую изучали Дэвисон и я, представлена семью различными соотношениями, в течение сессии, разделенных затемнениями и отсутствием сигнала, действующего в конце отключением электроэнергии. Каждое кормовое соотношение компонентов длится на протяжении нескольких подач корма, обычно 10 или 12, а затем начинается затемнение. Мы запускаем много таких сессий, как правило, от 65 до 100, а затем используем последние (от 50 до 85) в анализе. Таким образом, мы изучаем производительность, которая является стабильной от сессии к сессии, но которая показывает динамику в пределах сессий. На протяжении многих стабильных сессий мы собираем большие образцы событий в меньшем, чем сессия временном промежутке. Это позволяет нам усреднять во многих случаях мелкомасштабные события.

Верхний график на рисунке 12 показывает динамику выбора от подачи к подаче корма в пределах различных компонентов (Baum & Davison, 2004). Данные между голубями для каждого компонента были объединены во всех его случаях (т. е. один в сессии). Коэффициент поведения рассчитывался для клевков перед подачей корма (ноль по оси х), а затем для клевков, возникающих после первой и до второй подачи корма, а затем для клевков после второй и до третьей, и так далее. В среднем,мы видим интервал между подачей корма как шкалу. Выбор начинается почти безразлично, а затем движется в направлении кормового соотношения, за исключением соотношения 1: 1, для которого выбор остается почти безразличным. Мы видим равновесие, показанное на рисунке 4, но в меньшем временном отрезке, чем на рисунке 5 или в течение нескольких сессий у Мазура (1992) на рисунке 7. К девятой подаче корма выбор разделился между компонентами, хотя процесс может быть неполным или ограниченным по своей природе, поскольку большие коэффициенты практически не различаются; когда кормовое соотношение составляет 9:1 или 27:1, «щедрая» кнопка может подавать корм 12 раз подряд, делая коэффициенты неразличимыми. Закрытый осмотр показывает, что отношение поведения log (base 2) значительно сокращается по отношению к кормовому соотношению, что указывает на недочеты, как в данных Мазура на рисунке 7. Нижняя диаграмма на рисунке 12 подтверждает эти мысли, показывая соотношение поведения по сравнению с соотношением корма для последних трех подач корма. Хотя линия регрессии соответствует данным (r2 = .97), наклон линии (0,46) показывает значительное несоответствие.

Рис.12 Внутрикомпонентный выбор, рассчитанный для каждого интервала между подачами корма, из одного условия эксперимента, описанного Баумом и Дэвисоном (2004). Сверху: по мере того, как увеличивается количество подач корма, выбор переходит от равнодушия к уровню, соответствующему кормовому соотношению. Снизу: соотношение поведения (последние три точки на верхнем графике), полученное кормовое соотношение по семи компонентам. Линия регрессии точно соответствует точкам, но показывает значительное несоответствие в конце компонентов.

В этом временном промежутке мы с Дэвисоном разработали простую математическую модель для того, чтобы зафиксировать изменения в выборе между подачей корма, чередуя подачи корма с левой и правой кнопки (Baum & Davison, 2009). Мы использовали уравнение:

где Bi — отношение log peck (слева / справа) между i-ой и i + 1-ой подачей корма, A — эффект от выбора i + 1-ой подачи корма (положительный для корма, поданного клевком левой кнопки, отрицательный для корма поданного клевком правой кнопки), а w — вес корма по отношению к настоящему выбору Bi в усреднении, который предсказывает следующий выбор Bi + 1. Обновление прогнозируемого выбора с подачей корма по уровнению 1, мы смогли объяснить 90% дисперсию по выбору в этом временному промежутку.

Самоподобие и редукция на малых временных промежутках

Этот же эксперимент дает нам примеры как самоподобия, так и редукции. Обработка интервалов между подачей корма в целых единицах игнорирует динамику, которая может возникать между подачами корма. Предпочтительные импульсы, подобные показанным на рисунке 8, позволяют нам исследовать динамику в интервалах между подачей корма. Временной отрезок меньше; предпочтительные импульсы могут быть обнаружены в небольших ячейках времени (например, 1-3 с) после подачи корма или, как показано на рисунке 8, клевок за клевком, что означает, что единица представляет собой время для клевка. В любом случае, предпочтительные импульсы производятся путем усреднения по многим образцам подачи корма, например, в выборке из 80 сессий (560 компонентов) можно найти 280 экземпляров первой подачи корма, поступающем с левой кнопки.

Верхний график на рисунке 13 показывает импульсы предпочтения, следующие за различными кормовыми последовательностями в начале компонента: одна подача корма из левой кнопки (L); подача корма из правой кнопки (R); две подряд из левой кнопки (LL); и две подряд из кнопки (RR). Как и на рисунке 8, Мазур (1992), по-видимому, появляются на горизонтальной оси как суррогат для времени. Поэтому мы можем наблюдать следующую картину: 1-й клевок, затем 2-й и 3-й клевки, затем 4-7-й, 8-й-15-й, 16-й и 31-й, и далее по 32-ого. Это было сделано для того, чтобы размеры образцов были большими, потому что размер выборки неизбежно уменьшается со временем с момента подачи корма, поскольку все меньше и меньше интервалов достаточно для предоставления данных. На этих кривых мы снова видим динамическую картину тревог, за которой следует движение к равновесию (Рисунок 4). В этом временном промежутке сам корм представляет собой тревожное событие. Сразу после подачи корма выбор благоприятствовал только продуктивной кнопке — тем более, если подача производилась два раза подряд. Однако, когда время и клевки продолжались, выбор упал в сторону безразличия. Точки помеченные как «нет» показывают выбор с начала компонента перед подачей корма.

Рис.13 Динамика выбора после доставки корма в эксперименте Баума и Дэвисона (2004). Сверху: выбор после выбора компонента (бриллианты) и последующие подачи (треугольники) или две (квадраты) доставки корма с левой кнопки (заполненные символы) или правой кнопки (незаполненные символы). Первая точка представляет собой все первые клевки, вторая точка клевки 2 и 3, третья точка — 4—7, четвертая точка — 8—15, пятая точка — 16—31, а последняя точка — все за пределами 32. Импульсы предпочтения появляются после одного или двух подач корма. Нижняя часть: отношение корма, рассчитанное на основании следующей подачи корма после начала компонента (бриллианты) или одного или двух подачи корма из левой или правой кнопки. Корм, произведенный каждой группой клевков по горизонтальной оси, был суммироваа для левой и правой кнопок с рассчитанным соотношением.

На нижнем графике рисунка 13 показано кормовое соотношение, рассчитанное на основе левой или правой кнопки. Например, первый клевок произвел подачу корма, иногда этот клевок производил корм из левой кнопки, иногда из правой, а на графике показано соотношение подач корма после левой и правой кнопок. Аналогичным образом, если второй или третий клевки произвели корм, вторая точка показывает отношение подачи корма с левой точки к правой и т. д. График показывает то, что если бы следующая подача корма произошла в ближайшее время, это, скорее всего, было бы из той же кнопки, что и раньше — если бы эта кнопка произвела корм два раза подряд. Однако, если следующая подача корма произошла позже, у нее было меньше шансов быть той же кнопкой, что и раньше.

Сходство верхних и нижних графов на рисунке 13 предполагает, что сдвиги относительной вероятности корма могли быть дискриминационными и могли бы установить сдвиги в выборе; выбор может отслеживать кормовое соотношение. Рисунок 14 анализирует эту идею, построив распределение поведения по отношению к распределению корма для каждой пары точек на рисунке 13. Подгонка хороша (r2 = .88), хотя наклон линии регрессии (0.64) указывает на значительное несоответствие. Этот результат предполагает, что выбор тяготел к распределению корма, но сдвиги по выбору недооценивали сдвиги в относительной вероятности корма. Сравнивая рисунок 14 с нижним графиком на рисунке 12, мы видим сходные отношения между выбором и распределением корма, но в разных временных масштабах. На рисунке 14 показано соотношение в меньшем временном промежутке, чем на рисунке 12. Наклон линии на рисунке 14 является более крутым, поскольку динамика между подачами корма была значительной; выбор варьировался в пределах предпочтительного импульса, а выбор измерения по интервалу между подачами корма, как на рисунке 12, усреднялся по импульсу предпочтения. Тем не менее эти два отношения напоминают друг друга, и оба они напоминают сильно расширенное соотношение, показанное на рисунке 6. Таким образом, можно было бы рассмотреть три графика вместе, чтобы представить самоподобие во временных масштабах.

Рис.14 Выбор отслеживания относительного корма в эксперименте Баума и Дэвисона (2004). Линия регрессии указывает, что выбор имеет тенденцию соответствовать относительному корму, но со значительным несоответствием. Этот результат можно интерпретировать как пример самоподобия во временных масштабах.

Для примера редукции мы переходим к еще меньшему временному интервалу: шкале проб, приступов или переключений (Рисунок 10). Как показано на рисунке 13, мы смотрим между подачами корма в приступах после одной подачи корма и до следующей подачи корма. На рисунке 15 показаны пробы только что производительной кнопки и затем переключения; переключения сразу после корма опущены, из-за того, что они были относительно редки (Baum & Davison, 2004). Пробу можно определить как серию клевков, начинающихся с корма или переключения до следующего переключения. Таким образом, пробы были двух типов: посткормовые и постпереключенные. Пробы были усреднены способом, аналогичным усреднению в импульсах предпочтения, через сессии и компоненты в соответствии с последовательностью подач корма. Посткормовые пробы всегда были длиннее, чем пробы постпереключенные. Каждый треугольник показывает среднюю пробу, после ряда подач корма подряд из одной и той де кнопки. Строки без символов, спускающихся с треугольника, показывают последующие девять проб после перерыва. Первый треугольник и линии ниже него показывают 10 проб после первой подачи корма. Второй треугольник и линии под ним показывают 10 проб, следующих за двумя подачами корма подряд из одной и той же кнопки и так далее. Очевидна динамическая картина. Треугольник указывает на длительную посткормовую пробу к исключительно продуктивной кнопке, и линия под треугольником показывает первую короткую сессию после перехода к не-продуктивной кнопке, а затем следующая постпереключенная проба к просто продуктивной кнопке, который короткий, но немного длиннее, чем проба непроизводительной кнопки и т. д. Реагирование переключалось между кнопками, переходы на доступ к быстродействующей кнопке оставались дольше, чем при переходе на неэффективную кнопку. Действительно, проба не-продуктивной кнопке всегда были примерно одинаковыми — между 1.5 и 1.8 клювами, что указывает на то, что многие из них состоят из одного клевка, соответствующего шаблону «фиксация и замер» (Рисунок 9). Поскольку больше корма продолжалось до подачи корма из одной и той же кнопки, динамический шаблон расширяется, становясь стабильным после восьми подач корма подряд. Линия, начинающаяся с бриллианта в ноль на оси х, показывает, что этот динамический рисунок был заметен до некоторой степени, и даже, до любой подачи корма, в то время как анализ начинается с того, какая кнопка клевалась вначале компоненты.

Рис.15 Пробы или приступы внутри компонентов в эксперименте Баума и Дэвисона (2004). Треугольники показывают первую пробу кнопки после серии от 1 до 11 подач корма из той же кнопки. Строки, простирающиеся вниз от треугольников, показывают пробу после этой пробы, чередуя не только продуктивную кнопку, но и просто производительную кнопку. Динамическая картина длительной пробы, сопровождаемая более короткими чередующимися пробами, появляется после первой подачи корма и становится более выраженной с дальнейшими продолжениями. Линия, начинающаяся с алмаза в ноль по оси x, показывает рисунок в пробах перед любой подачей корма, когда расчеты рассчитываются с первой кнопки. Квадраты показывают первую пробу после подачи корма с другой кнопки. Динамический шаблон проявляется только сначала, когда подача корма предшествует переключению кнопки; когда предшествует более одного продолжения, проба послепродажного обслуживания является относительно которой, и проба на обеих кнопках все еще короче, что указывает на быстрое чередование. Эта динамика представляет собой пример сокращения в небольшой временной шкале.

Квадраты на рисунке 15 показывают пробы послекормового обслуживания после прекращения приема — одна или несколько подач корма из одной кнопки, за которым следует подчаа из другой кнопки. Они намного короче проб посткорма после продолжений (треугольники). Тот же динамический шаблон появляется в сильно затухающей форме, за исключением первого квадрата, прекращение после следующей подачи на другой кнопке (2 по оси x). Кроме того, рисунок лезвия пилы исчезает, хотя проба постпереключения следует за пробой посткорма короче и ближе к минимальной пробой (около двух клевков за пробу). Чем больше предшествующих продолжений, тем меньше паттернов появляется в пробах после прекращения.

Рисунок 15 является примером редукции, поскольку динамика, очевидная при переключении, даже если они отражают предпочтение между кнопками и не имеет никакого сходства с законом соответствия, который появляется на рисунке 14. Мы не можем выводить схемы переключения как на рисунке 15 из предпочтительных импульсов на рисунке 13, но мы можем получить импульсы предпочтения из схем переключения. Чтобы проиллюстрировать это, мы можем создать простую модель проб следующим образом. Предположим, что посткормовые пробы длинные, в среднем от 0 до 10 клевков с распределением по частоте, как показано в таблице 1. Такое распределение приближается к тем, которые действительно происходят, за исключением того, что реальные имеют хвост после пробы 10-ти клевками (Aparicio & Baum, 2006; Baum & Davison, 2004). Предположим, что пробы постпереключения короче — всего 1 или 2 (одинаково часто) на не-продуктивной кнопке и 3 или 4 клевков (одинаково часто) на только что производительной кнопке. Построим последовательности проб следующим образом. Каждой из 11 проб после отправления следуют две последовательности постпереключения 1-4 и 2-3. Эти 22 последовательности проб устанавливают 22 последовательности клевков. Для каждого клевка после подачи корма, мы суммируем частоты клевков левой кнопки и клевки правой кнопки через 22 последовательности после подачи корма от левой кнопки и соотношение лево-право от первых клевков, вторых клевков и т. д., до 25-го клевка. Результат показан на рисунке 16. Этой простой модели достаточно для формирования импульса предпочтения. То, что мы можем получить импульс предпочтения от проб, но не наоборот, показывает то, что мы можем редуцировать выбор шаблонов переключения.

Рис.16 Аппроксимация импульса предпочтений, полученного из простой модели динамики переключения, показанной на рисунке 15. Импульс предпочтения и соответствие, могут быть получены из динамики переключения, но не наоборот.
Таб.1 Частотное распределение длины посткормовой пробы, используемое в модели на рисунке 16, импульс предпочтения, от проб или переключений.

Рисунок 16 подразумевает, что приступы или переключения представляют меньший временной промежуток, чем предпочтительные импульсы. Это упорядочивание может показаться нелогичным, потому что импульсы вычисляются по кнопке. Кнопки, однако, выдерживают время — каждый представляет собой единицу времени, и импульс можно вычислить, используя вместо этого небольшую единицу времени, такую ​​как секунда. Вычисление импульса игнорирует переключения, размывание различных проб и усреднение по ним, тогда как переключения, заканчивающие пробы, представляют собой короткие события, связанные только с одной кнопкой. Длительность проб кнопки зависит от вероятности переключения на другую кнопку, и это переключение является событием в меньшем временном промежутке, чем временные единицы импульса.

Вывод

Самоподобие или инвариантность могут возникать во всех временных промежутках или во всех, кроме самых маленьких. Редукция происходит тогда, когда рассматривается динамика выбора в наименьших временных отрезках. Можно подумать, что отношения в наименьшем временном промежутке должны быть «фундаментальными», но традиционный молекулярный взгляд на поведение будет приоритезировать малые промежутки, совпадающие с его предположениями о дискретных моментных событиях и смежности (Baum, 2002; 2004). В то же время молярный взгляд рассматривает закономерности во всех временных масштабах как релевантные и обоснованные. Ничто не является «фундаментальным», потому что все может быть интересным или полезным. Практические соображения могут благоприятствовать исследованиям или применению в любом временном масштабе. В прикладном анализе поведения, в частности, закономерности в наименьшей временной шкале могут быть малопригодными или интересными (Baum, 2003). Например, когда речь идет о проблемном поведении в классе, вознаграждение учительским вниманием или похвалой в определенные моменты может быть непрактичным и, во всяком случае, достаточно отношения в более длительном временном промежутке. Таким образом, прикладные проблемы могут потребовать вмешательства в длительном временном отрезке в качестве практического вопроса, а вмешательства в небольшом промежутке могут оказаться менее эффективными. В целом, для изучения поведения в разных временных масштабах наиболее полезным является использование молярной концепции поведения (Baum, 2002; 2004).

Часть 1, Часть 2
Автор: William M Baum
Оригинал: Dynamics of Choice: A Tutorial
Вольный перевод: Евгений Дудич

Уильям Баум: Динамика выбора. Часть 2

«Геркулес на распутье» Аннибале Карраччи
«Геркулес на распутье» Аннибале Карраччи (ditherAtkinsons)

Динамика и шкала времени

На рисунке 5 показано важное различие между установившимся или равновесным поведением и динамикой, наблюдаемой в переходной фазе. При оценке устойчивого состояния потребовалось бы, чтобы некоторые из заключительных сессий усреднялись до несистематических колебаний, тогда как для просмотра динамики требуется, чтобы сессия за сессией для изменения распределения был видимыми. На практике оценка устойчивого состояния требует большого промежутка времени, тогда как для просмотра динамики требуется более короткий промежуток. На рисунке 5 более короткий временной отрезок основан на сессии как единице, но когда условия меняются от сессии к сессии, устойчивое состояние может возникать в пределах сессии, а затем более короткий временной промежуток требует меньше показатель, чем вся сессия. В процедурах, которые содержат несколько компонентов, каждый из которых имеет различное соотношение, в течение каждой отдельной сессии подход к стабильности может возникать в еще меньшем промежутке времени, и для просмотра динамики требуется еще меньший показатель, например интервал между подачей корма (Aparicio & Baum, 2009; Baum & Davison, 2004). Динамика может возникать даже в пределах интервала между подачей корма, а затем требуется показатель поменьше, например, ограниченный переключателем от одной кнопки к другой.

Самый длинный промежуток времени, который обычно изучается — стационарное состояние или равновесие на протяжении сессий, как показано на рисунке 5. В этом эксперименте были изучены несколько соотношений, кроме тех, которые показаны на рисунке 5, и соотношение между отношением поведения и соотношением в равновесии представлено на рисунке 6. Пунктирная линия на рисунке 6 представляет собой локус идеального соответствия, в котором отношение поведения (behaviour ratio) будет равно соотношению. Точки данных привязаны к линии сплошной регрессии, уравнение которой находится справа. Линия имеет наклон s = 0,8, и поэтому не сходится с пунктирной, этот результат называется несходимостью (Baum, 1974, 1979). Тщательный осмотр на рисунке 5 показывает, что три устойчивых состояния лежат недалеко от log (base 2) установленного соотношения — 6.0 для 64:1, — 5.0 для 1:32 и 7.0 для 128:1 — как можно было бы ожидать от отношения сопоставления (matching relation).

Рис.6 Соотношение соответствия (matching relation) между стационарными оценками выбора, основанными на нескольких сессиях (Baum et al., 1999). Линия регрессии показывает отношение между log (base 2) поведенческого соотношения (распределения) и log (base 2) кормового соотношения. Наклон 0,8 показывает несходимость.

Хотя сопоставление является надежным нахождением, оно не обязательно говорит нам о динамике, потому что это отношение проявляется во многих устойчивых состояниях, между которыми динамика просто опускается. Можно ли найти совпадение в динамике, как и в равновесии, вопрос, требующий от нас взглянуть на поведение между устойчивыми состояниями. Если мы узнаем, что отношение соответствия (matching relation) каким-то образом есть в динамике, мы могли бы рассмотреть соотношение соответствия (matching relation) для объяснения результатов в равновесии. Однако, если бы какое-то другое отношение было применимо к динамике, то мы ожидали бы, что это отношение будет предсказывать соответствие при равновесии, но сопоставление при равновесии не относится к динамике. Мы вернемся к этому вопросу позже, когда обсудим редукцию.

Пример динамики, которая отражает соотношение соответствия (matching relation), появляется в некоторых данных, собранных Мазуром (1992), с использованием стандартных параллельных режимов подкрепления с переменным интервалом (VI) (рисунок 2). На рисунке 7 показаны некоторые результаты Мазура из процедуры, в которой установившееся состояние было достигнуто с кормовым соотношением 1:1, а затем соотношение резко переключилось на неравное — 60:40, 75:25 или 90:10, (Banna & Newland, 2009, для недавнего аналогичного эксперимента.) Линии показывают динамику в течение первой сессии кормового соотношения. Поскольку подход к новому равновесию происходит в рамках сессии, Мазур измерил выбор в меньших показателях, в 9-ти или 15-ти минутных выборках. Выбор начинается почти с безразличием (ноль) — предыдущим устойчивым состоянием. Каждая кривая напоминает подход к равновесию, идеализированный на рисунке 4, и показанный на рисунке 5, но в меньшем временном промежутке, чем на рисунке 5. Мазур не показывал кормовое соотношение в блоках, но поскольку каждая кривая поднимается к новому уровню кормового соотношения, можно предположить, что выбор был отслежен постепенным приближением кормового соотношения к установленному соотношению. Тем не менее для каждого условия оно не подходит, но никогда не достигает уровня, который соответствовал бы соотношению несоответствия.

Рис.7 Внутрисессионная динамика в эксперименте Мазура (1992). Первая точка в каждой кривой представляет последние 15 минут исполнения при равных параллельных режимах с переменным интервалом подкрепления (50/50), а кривые показывают выбор в 9-ти и 15-ти минутных блоках первой сессии после изменения соотношения продуктов питания от 50/50 до 90/10, 75/25 или 60/40. Выбор движется к новому уровню, соответствующему новому кормовому соотношению.

Другой результат Мазура (1992) показан на рисунке 8, иллюстрирующим еще меньший временной промежуток. На этих графиках, выбор показан клеванием и первые шесть клевков сопровождались подачей корма. Каждый график основан на выборке из 500 клевков. Некоторые из этих клевков были подкреплены подачей корма, и Мазур подсчитал процент этих клевков. Он сделал то же самое для эксперимента с подачей корма после вторых клевков, третьих и так далее. При построении рисунка 8, я преобразовал проценты Мазура в соотношения клевков (только-продуктивная кнопка / не только-продуктивная кнопка). Быстрая подача корма после «щедрой» кнопки отдавала строго предпочтение продуктивной кнопке. Быстрая подача корма после клевания «щедрой» кнопки слабо отдавала предпочтение только продуктивной кнопке, но вскоре переключился на «щедрую» кнопку (отрицательное соотношение). Для режима на 75:25 отдавался приоритет «щедрой» кнопке даже после быстрой подачи корма после клеваний «скупой» кнопки. Как же эти локальные сдвиги относятся к отношению соответствия (matching relation) еще предстоит выяснить. Дэвисон и я называем такие графики «предпочтительными импульсами» (Davison & Baum, 2000; 2003; 2006).

Рис.8 Выбор в меньшем временном промежутке в эксперименте Мазура (1992). Первая точка на каждой кривой показывает первые клевки после подачи корма в выборке из 500 клевков. Вторая кнопка показывает все вторые клевки после подачи корма и т. д. Выбор показан в виде «клевок за клевком» при «скупой» альтернативе (нижний график) и «щедрой» альтернативе (верхний график) в каждом из трех условий на рисунке 7 в конце пяти сессий экспозиции. Предпочтительные импульсы проявляются при условиях 90/10, и только после подачи корма из «скупой» кнопки при условии 60/40.

Самоподобие против редукции

В примерах, которые мы рассмотрели до сих пор, вся динамика выбора была рассмотрена на временных промежутках, что позволило рассчитать соотношение поведения в каждом показателе. Если, по мере того, как анализ перемещался бы в меньший и меньший временной промежуток, все еще можно было видеть отношение соответствия (matching relation), и можно было бы сделать вывод о том, что совпадение выполняется до конца (Gallistel, King, Gottlieb, Balci, Papachristos, Szalecki, & Carbone, 2007). Когда одно и то же отношение применяется в каждом временном отрезке — это самоподобие (или масштабная инвариантность). Предположим, однако, что локальные (мелкомасштабные) процессы не отражают расширенную регулярность, т. е., предположим, что расширенное соотношение не очевидно в локальных процессах. Если такие мелкомасштабные закономерности существуют, то соответствие может быть выведено из них, но эти мелкомасштабные закономерности не могут быть выведены из отношения соответствия. Например, предположим, что приступы клевания двух кнопок изменяются обычным образом в пределах интервала между подачей корма. Это будет подразумевать регулярную динамику в переключениях от одной кнопки к другой. Динамика выбора будет редуцирована к приступам или переключениям в этом примере тому, что я назову редукцией.

На рисунке 9 показаны те же сессии, что и на рисунке 5, но с целью понимания переключения между кнопками. Верхний график показывает преобразование среднего числа клевков при пробе «скупой» альтернативы (правая вертикальная ось). Если усредненная проба — это один клевок, то измерение равно 1.0. Во всех трех кормовых соотношениях усредненная проба всегда дольше на первой сессии нового отношения (закрашенные квадраты), когда соотношение только что перешло на «щедрые» и «скупые» кнопки. После нескольких сессий можно заметить приближение к одному клевку. Нижний график показывает вероятность посещения «скупой» кнопки, рассчитанного для каждой сессии (количество посещений «скупой» кнопки, деленное на количество клевков «щедрой» кнопки). Это начинается с пика, когда альтернатива была недавно «щедрой», но падает до низкого уровня — самый низкий для 128:1, выше для 64:1 и самый высокий для 32:1. Эту схему фиксации на «щедрой» кнопке и иногда пробу «скупой» кнопки, в соответствии с кормовым соотношением можно назвать «фиксация и замер» (Aparicio & Baum, 2006; Baum et al., 1999; Baum & Davison, 2004).

Рис.9 Те же данные из Baum et al. (1999), что показаны на рисунке 5, для отображения сессии за сессией среднего числа клевков при пробе «скупой» кнопки (квадраты, вертикальная ось справа) и вероятность пробы «скупой» кнопки (треугольники, вертикальная ось слева ). Зарисованные символы отображают первую сессию нового условия. Кратковременные пробы «скупой» кнопки и оцененные вероятности пробы «скупой» кнопки согласуются с шаблоном «фиксации и замера».

Динамика выбора, наблюдаемая при пробе кнопок, может рассматриваться также в первой сессии нового кормового соотношения. На рисунке 10 показаны все пробе первой сессии трех условиях того же эксперимента: первая сессия кормового соотношения 4:1 после 1:256, 1:8 после предыдущего 4:1 и 64:1 после предыдущего 1:8. Каждый график показывает одну сессию. Вертикальная ось представляет собой такое же преобразование продолжительности пробы, как на рисунке 9, но с такой добавленной функцией, что проба левой кнопки — положительный момент и посещение правой кнопки — отрицательный. Поскольку пробы необходимо чередовать, они запечатлены как «проба за пробой». Проба ранее «щедрой» кнопки продолжительней вначале, но в какой-то момент во время сессии (в круге) это изменяется довольно резко.

Рис.10 Первая сессия каждого из трех условий у Baum et al. (1999) эксперимент показал пробы как те, что чередуются между левыми и правыми кнопками. Вертикальная ось представляет такое же преобразование продолжительности посещения, как на рисунке 9, за исключением того, что визиты справа представлены как отрицательные. Длина каждой вертикальной линии показывает продолжительность одного посещения. Маленькие бриллианты показывают подачу корма. Треугольники и квадраты показывают преобразованную продолжительность посещения в конечном стабильном состоянии; те, что слева — для предыдущего условия, а справа — для нового условия. Отсутствие каких-либо следующих за пищей клевков «скупой» кнопки (проба с нулевой длиной), выглядит как квадрат на горизонтальной оси. Каждый график показывает одну сессию. В начале сессии шаблон проб соответствует предыдущему условию, и в какой-то момент во время сессии (в круге) шаблон переключается в сторону «щедрой» кнопки; пробы «щедрой» кнопки становятся продолжительными, а пробы «скупой» кнопки — короткими.

Рисунок 11 отображает три сессии таким образом, чтобы выявить динамику и непредсказуемость сдвига. Светлая линия показывает накопленную подачу корма (правая вертикальная ось), с левой подачей корма, записана как +1, и правая подача корма, записана как -1. Каждая строка начинается с нуля (вертикальная ось справа) и склоняется в сторону «щедрой» кнопки. Толстая линия показывает накопленные клевки. Выбор сначала склонен к ранее «щедрой» кнопке, а затем поворачиваетсяв сторону «щедрой» в настоящее время кнопки. Таким образом, динамика выбора появляется при переключении между кнопками на протяжении сессии.

Рис.11 Те же данные, что и на рисунке 10, были заменены, чтобы показать относительно резкую смену шаблона. Более светлая линия показывает накопленную подачу корма (вертикальная ось справа), рассчитанная путем добавления +1 для подачи корма от левого ключа и -1 для доставки еды с правой клавиши. Линия начинается с нуля, и наклон показывает, какая альтернатива была более «щедра». Линия потолще (бриллианты) показывает накопленные клевки, рассчитанные путем добавления клевков в каждой пробе левой кнопки и вычитания клевков при каждой пробе правой кнопки. В каждой сессии накопленные клевки изначально имеют наклон, соответствующий предыдущему состоянию, а затем резко переключаются в том же направлении, что и накопленный корм.

Часть 1, Часть 3
Автор: William M Baum
Оригинал: Dynamics of Choice: A Tutorial
Вольный перевод: Евгений Дудич

Поведенческая экономика: прошлое, настоящее и будущее

Поведенческая экономика: прошлое, настоящее и будущее

В  данной лекции Ричард Талер рассказал об истории «поведенческой экономики», о ее настоящем развитии и попытках объединиться с другими социальными науками, в целях обогащения стандартной экономической модели. Этот интерес к психологии человеческого поведения возвращает экономику к ее корням. Адам Смит, уже в 18-м веке писал о таких ключевых понятиях, как «отвращение к потерям», самоуверенность и самоконтроль. Еще один великий экономист и основатель поведенческих финансов Дж. М. Кейнс при анализе поведения экономических агентов сослался на (( https://en.wikipedia.org/wiki/Animal_spirits_(Keynes)
«животную природу» человека)). Другими экономистами поддерживающими иррациональность человеческого поведения были В.Парето, И. Фишер, Дж.Кларк, Г.Саймон и т. д. Тем не менее, современная версия поведенческой экономики еще с 1980-х годов встречала сопротивления со стороны неоклассических экономистов. Они аргументировали это такими присущими каждому агенту чертами, как рациональность, эгоизм, суверенность в принятии решений и неискаженнность убуждений, тем самым описав homo economicus Талер рассказал о том, что эти аргументы были отвергнуты, как теоретически, так и эмпирически, и поэтому настало время двигаться дальше. С точки зрения теории основная проблема заключается в том, что мы полагаемся на одну теорию для достижения двух довольно разных целей, а именно для характеристики оптимального поведения и прогнозирования фактического поведения. Мы не должны отказываться от первого типа теорий, поскольку они являются важными строительными блоками для любого экономического анализа, но мы должны расширить их с помощью дополнительных описательных теорий, которые основаны на данных, а не на аксиомах [1].
Новый подход к экономике должен включать два типа теорий: нормативные модели,характеризующие оптимальное решение конкретных проблем и описательные модели, которые фиксируют поведение людей. Последние теории должны включать такие переменные, которые он называет «несущественными» факторами при учитывании которых мы можем улучшить объяснительную силу экономических моделей.
В своей концепции «nudge» Ричарду Талеру удалось гармонично обьединить два этих типа, о чем он и поведал на своей «нобелевской лекции».

____________________________________________________________

  1. Thaler, Richard H. 2016. «Behavioral Economics: Past, Present, and Future» American Economic Review, 106 (7): 1577-1600.
Ранее Ctrl + ↓