Геймификация и бихевиоризм. Часть 2

Геймификация и бихевиоризм. Часть 2

Режимы подкрепления в игровых контекстах

Использование подкрепления последствий, будь то реальными показателями (баллы в кредитном бюро) или виртуальными (показатели социальной значимости в соц.сетях и т. д.), является решающим и центральным аспектом поддержания определённого поведения. Но это не просто вопрос обратной связи, реальная наука анализа поведения заключается в планировании этих последствий. Посредством экспериментальных исследований поведенческие психологи обнаружили значительные временные и контекстуальные компоненты среды, влияющие на реакцию организма (Ferster et al., 1957). Сила любого стимула, выступающего в качестве вознаграждения или наказания изменяется со временем через научение. Скиннер и его коллеги специально исследовали, как этот процесс происходит, и как с помощью этих факторов предсказать и контролировать последующее поведение. Поскольку использование элементов игрового дизайна в неигровых контекстах обычно осуществляется для поощрения, возбуждения или поддержания определенного поведения, эти процессы важны для понимания геймификации.
Поведенческие психологи используют термин «режим подкрепления» для описания контекстуальных аспектов, определяющих опыт подкрепления организма. В частности, две переменные были идентифицированы как значимые: интервал — промежуток времени, прошедший с момента последнего подкрепления, и соотношение как количество желаемых ответов испытуемого необходимых для получения подкрепления (Ferster et al.,1957). Исследователи обнаружили, что варьированием любым из них оказывает значительное влияние на поведение. В четырех разных конфигурациях производятся разные паттерны поведения и это можно увидеть на рисунке 1.

Сравнение режимов подкрепления
Рис.1 Сравнение режимов подкрепления

 Режим подкрепления с постоянным интервалом (fixed interval, FI) — режим, в котором испытуемый подкрепляется после того, как твердо установленный или постоянный временной интервал проходит с момента предыдущего подкрепления. Любопытно, что данный режим дает устойчивую низкую скорость ответа сразу после подкрепления — феномен, названный паузой после подкрепления. Данный режим действителен при выплате зарплаты за работу, выполненную за час, неделю или месяц. Университеты также обычно работают в соответствии с интервальным режимом.
 Режим подкрепления с вариативным интервалом (variable interval, VI) аналогичен режиму подкрепления с постоянным интервалом, за исключением того, что интервал между подкреплениями неопределен и его невозможно рассчитать. Как правило, скорость ответа при данном режиме является прямой функцией от длительности интервала: короткие интервалы порождают высокую скорость, а длинные интервалы — низкую. Также при режиме подкрепления с вариативным интервалом (VI) испытуемый стремится установить постоянную скорость ответа, и при отсутствии подкрепления ответа угасают медленно. В конечном итоге организм не может точно предвидеть, когда будет следующее подкрепление.
 Режим подкрепления с постоянным соотношением (fixed ratio, FR) подкрепляет после каждого n-ого ответа. Например, при режиме FR5 подкрепление происходит после каждого пятого ответа. Этот режим обеспечивает высокую и постоянную скорость с паузой после подкрепления, и поэтому приводит к поведенческому паттерну, при котором большинство желаемых ответов циклично происходят незадолго до ожидаемого подкрепления и их частота стремительно падает сразу же после подкрепления. Этот режим является популярным в повседневной жизни и ему принадлежит значительная роль в контроле над поведением. Во многих сферах занятости сотрудникам платят отчасти или даже исключительно в соответствии с количеством единиц, которые они производят или продают. В промышленности эта система известна как плата за единицу продукции.
 Режим подкрепления с вариативным соотношением (variable ratio, VR) аналогичен режиму с постоянным соотношением, за исключением того, что количество ответов, необходимого для подкрепления постоянно колеблется. Этот режим обеспечивает наиболее высокую и устойчивую скорость ответа. Данный режим — источник многих исследований и дискуссий, поскольку созданная им активность настолько непропорциональна полученному вознаграждению, что реализация этого режима в игре, сервисе или рабочей среде может рассматриваться как эксплуатация. Действительно, работа, в которой оплата может варьироваться по желанию работодателя является нечестной и даже незаконной в некоторых юрисдикциях. Режим подкрепления с вариативным соотношением (VR) был представлен как объяснение зависимости от азартных игр, поскольку ясно демонстрирует доказательство нереалистичных ожиданий (Haw 2008, King, Delfabbro и Griffiths 2010). Например, рассмотрим действия человека у игрального автомата, где нужно опускать монетку или специальной рукояткой вытягивать приз. Эти аппараты запрограммированы таким образом, что подкрепление (выигрыш) распределяется в соответствии с числом попыток, за которые человек платит. Однако выигрыш непредсказуем, непостоянен и редко позволяет получать выше вложенного игроком и это объясняет тот факт, почему владельцы казино получают значительно больше подкреплений, чем их постоянные клиенты. Действительно, Karlsen (2011) расширил этот анализ, чтобы объяснить зависимость от многопользовательских онлайн-игр. Излишне говорить, что реализация режима подкрепления с вариативным соотношением (VR) в геймификации сервисов, как и эффективная стратегия мотивации к участию, критикуется на основании эксплуатации.
Результаты исследований режимов подкрепления демонстрируют то, что не оптимально предлагать вознаграждение или наказание после каждого действия, которое совершает пользователь. Для того чтобы поддерживать поведение в течение определенного периода времени, необходимо манипулировать либо количеством требуемых ответов, либо интервалом между подкреплениями (Ferster et al., 1957).Различные режимы подходят в разных контекстах, в зависимости от типа поведения, которое необходимо создать у пользователя.
Если у людей есть последовательная история того, как их усилия были подкреплены, рабочая нагрузка, необходимая для достижения тех того же вознаграждения, может постепенно возрастать со временем без потери общей мотивации (Catania 1998, Cooper, Heron, и Heward 2006). Поведенческие психологи ссылаются на эту методику постепенного распределения подкрепления в зависимости от режима научения. Этот метод также наблюдается в компьютерных играх, в которых первые несколько задач выполненных игроком, часто подкрепляются новыми предметами, навыками и баллами. По мере того, как игрок прогрессирует и проводит больше времени в игре, количество требуемых действий, необходимых для подкрепления, возрастает.
Методика режима научения проявляется в онлайн-играх в социальных сетях (Deterding et al., 2010) и особенно в многопользовательских ролевых онлайн-играх, таких, как «World of Warcraft». Например, рассмотрим архетипический пример популярной игры «Dungeons and Dragons», в которой игроки получают «очки опыта» (XP). Получив определенное количество XP, персонаж движется вверх по «уровням» и получает дополнительные навыки и способности. Тем не менее количество XP, необходимое для повышения уровня, увеличивается с каждым завершенным уровнем, постепенно увеличивая время, затрачиваемое на завершение каждого последующего уровня как представлено в таблице 1. Принимая во внимание этот метод в играх, мы должны рассматривать ее именно как характерный элемент геймдизайна, который сам отбирался последствиям разработчиками игр, но без применения специального поведенческого анализа.

Уровень персонажа

Необходимые очки опыта (XP)

1

0

2

1000

3

3000

4

6000

5

10000

Таб.1 Режим подкрепления на примере уровней персонажа в Dungeons and Dragons


Примечательно, что известный исследователь игр Ричард Бартл критиковали использование таких методов в играх, как режим подкрепления с вариативным соотношением (VR), подчеркивая его высокую эффективность при правильном использовании и сходство с эксплуатацией игрока. Критики предполагают, что для некоторых игроков режимы остаются эффективными даже после того, как игрок теряет чувство самой игры. Игрок скорее рассматривается как участник в повторяющейся, монотонной, черновой задаче, аналогичной работе с низкой зарплатой, чем пользователь, получающий сложный опыт. По сути, игровые исследователи предполагают, что использование этих элементов игрового дизайна приравнивается к ленивому или невдохновленному геймдизайну, а хорошие игры должны поддерживать вовлеченность и мотивацию благодаря предоставлению поистине интересного опыта (Bartle 2011).
Учитывая, что игровым исследователям становится все более неудобно использовать эти элементы в отдельных играх, были высказаны опасения относительно применения этих методов в неигровых контекстах (Bogost 2011). Важно помнить, однако, что эти методы были успешно использованы в образовании в течение десятилетий и помогли улучшить жизнь огромного количества людей, страдающих задержкой психического развития и другими поведенческими проблемами (Cooper et al., 2006).
Экономика токенов — специально разработанный контекст, в котором соответствующее поведение вознаграждается за счет зарабатывания токенов, которые можно накопить и обменять на предпочтительные предметы. Она дает особенно яркий пример того игровое поведенческое вмешательство может оказать глубокое положительное влияние на поведение даже в самой сложной среде (Corrigan 1995). Независимо от того, считаете ли вы эти элементы игрового дизайна полезными инструментами или потенциально эксплуататорскими практиками, знание эффективности этих методов, а также споры вокруг их использования, необходимы разработчикам игр.

Оценка эффективности подкрепления

Чтобы успешно применять режимы подкрепления, важно помнить о различии между вознаграждением и подкреплением. Как указывалось ранее, вознаграждение — предоставляемый испытуемому стимул, который предположительно увеличит вероятность наступления данного поведения в будущем. Однако простое вознаграждение пользователя не имеет большого значения, если испытуемый не изменит поведение на желаемое (если нет, значит данное вознаграждение не было хорошим подкреплением). В экспериментальных и прикладных исследованиях поведенческие психологи обязаны постоянно проверяют обратную связь на момент того, есть ли изменения в целевом поведении и последствия систематически модифицируются «в режиме онлайн», чтобы достичь желаемого показателя поведения.
Особенно в прикладных контекстах (Cooper et al., 2006) предлагается множество различных видов поощрений, и психолог должен анализировать данные, чтобы лучше понять, соблюдаются ли последовательные паттерны поведения после каждого вознаграждения. Этот процесс необходим, так как существует очень мало (если есть) точно подкрепляющих или наказывающих стимулов, действующих без исключения на всех людей и все время. Например, некоторые люди слушают классическую музыку для того, чтобы поднять себе настроение, в то время как другие считают ее скучной. Деликатесы, такие как икра, кокореци (мясо органов) или устрицы часто воспринимаются как отталкивающими так и привлекательными для разных людей. Таким образом, необходимо оценить влияние разных вознаграждений, чтобы оценить, являются ли они для человека действительно желаемыми. Если частота целевого поведения возрастает в результате вознаграждения, тогда этот стимул можно классифицировать как подкрепление в этом контексте. Затем идентифицированный подкрепляющий элемент можно использовать в будущем в результате поведения, которое психолог хочет усилить. Тот же процесс применим при идентификации наказаний. Например, в контексте игры поведенческий аналитик предлагает широкий спектр вознаграждений за требуемое поведение в определенном режиме (например, FR1), с низким требуемым количеством необходимых ответов, а затем сокращает количество предоставляемых игроку вознаграждений, убирая те, которые не подкрепляют игрока.
Вышеупомянутая процедура применима как к отдельным играм, так и к неигровым контекстам. Например, компьютерная игра Ultima Online предоставляет множество возможных типов поведения для взаимодействия с пользователем, от ремесла до изучения и борьбы, дает возможность продвижения в игре. Процесс развитие игроком навыков ремесла вознаграждается так же, как успехи в битве с драконами. В результате, желания разных игроков удовлетворяются и поведение в игре подкрепляется, несмотря на то, что оно диаметрально различается.
Очевидным следствием анализа эффективности подкрепления для геймифицирванных сервисов является наличие различных видов вознаграждений для разных пользователей, и необходимо точно оценивать какое вознаграждение наиболее подходит для каждого пользователя. Поведенческие психологи разработали точные методы для этого, и кажется, что эти методы могут быть идеальными для использования в компьютерных играх или геймифицированных сервисах. Например, закон соответствия Гернштейна (Herrnstein 1961) является математическим способом определения того, какие обстоятельства испытуемый находит наиболее полезным при доступности нескольких вариантов. В опытах с животными Гернштейн обнаружил, что количество времени и работы, которые были посвящены каждому из вариантов, соответствовали скорости, с которой эта работа была вознаграждена. По сути, закон соответствия является математическим способом определения того, какие обстоятельства испытуемые считают наиболее вознаграждаемыми. Понимание закона соответствия может помочь игровым дизайнерам создавать адаптивные и увлекательные игры или геймифицированные сервисы, поскольку алгоритм Гернштейна позволяет нам отслеживать относительную привлекательность каждого из различных подкреплений, предлагаемых в данной игре. Постоянно контролируя поведение игрока, система может автоматически подсчитывать, какое вознаграждение лучше подкрепляет действия игрока для большего вовлечения его в игру.
Например, в приложении Foursquare, посредством мониторинга поведения пользователя, можно легко обнаружить то, что пользователи в два раза чаще отмечаются в других заведениях на следующий день после получения большого бонуса за отметку, чем после получения бейджа. Используя закон соответствия, приложение может определить соотношения подкрепления бонус к бейджу, как 1:2. Таким образом, используя эту простую стратегию, геймифицированное приложение может динамически оценивать эффективность вознаграждений для каждого отдельного игрока и использовать эти данные в собственной системе вознаграждения.

Часть 1 → • → Часть 3Часть 4

Поделиться
Отправить
Запинить
Популярное