Шнобелевская премия
Достижения, которые вызывают смех, а затем – раздумья

Анализ обзоров видеоигр на платформе Steam
проанализирован 35 983 481 обзор с использованием методов обработки естественного языка
Анализ обзоров видеоигр на платформе Steam
платформа цифровой дистрибуции Steam

Тибор Гужсвинец (Tibor Guzsvinecz), Юдит Сюч (Judit Szucs), Университет Паннонии, Венгрия, "Анализ длины и тональности обзоров топовых жанров видеоигр на платформе Steam", "Компьютеры в поведении человека" (Computers in Human Behavior), 149, декабрь 2023 г.,
Тибор Гужсвинец (Tibor Guzsvinecz)
Тибор Гужсвинец (Tibor Guzsvinecz)

Введение
В процессе разработки игр часто возникает неопределённость, связанная с эмоциональными реакциями игроков на новые игры. В некоторой степени понять игровой опыт можно, поскольку игроки склонны описывать свой опыт в обзорах. Анализ текстовых обзоров может дать полезную информацию об игроках и играх. Поскольку геймерам сложно угодить, и их опыт может считаться важной обратной связью для разработчиков. В обзорах можно найти следующие темы: общий опыт, социальное взаимодействие, социальное влияние, достижения, аксессуары, визуальная составляющая/ценность, повествование и ошибки в игре. Однако игроки реже жалуются на ошибки, чем на элементы игрового дизайна. При сравнении текстовых обзоров игровые критики и игроки выделяют разные аспекты игр. Можно понять факторы, влияющие на популярность игры. Цель исследования - предоставить разработчикам видеоигр более глубокое понимание эмоциональных реакций игроков на популярные жанры.

Платформы цифровой дистрибуции и жанры видеоигр
Несколько платформ цифровой дистрибуции предлагают видеоигры как для консолей, так и для ПК. К таким платформам относятся Steam (Valve Corporation), Epic Games Store (Epic Games, Inc.), GOG.com (GOG sp. Z o. o.), Microsoft Store (Microsoft Corporation) и другие. Steam остаётся одним из крупнейших: по состоянию на март 2021 года в его каталоге можно найти более 50 000 видеоигр (Dean, 2023 г.).
Юдит Сюч (Judit Szucs)
Юдит Сюч (Judit Szucs)

Steam особого типа игровая платформа, демонстрирует бизнес-модель, основанную на экономических особенностях игр. С одной стороны, Steam сопоставим с другими рыночными платформами, поскольку ориентирован на привлечение издателей игр и игровых сообществ в многосторонний рынок, контролируемый владельцем платформы. С другой стороны, он отличается от других платформ активной интеграцией экономики, управляемой игроками, на разных уровнях своей платформы. Это делает Steam наглядной иллюстрацией того, как платформы можно определить и проанализировать как «запутанные рынки», извлекающие ценность на пересечении различных рыночных контекстов. Эта специфическая бизнес-модель влияет на игровой дизайн, платформу и экономические практики за её пределами.

Guzsvinecz (2023) проанализировал влияние различных механик ролевых игр (RPG) в стиле Souls-like на эмоции в текстовых обзорах игр. Каждая игровая механика оказывала значительное влияние как минимум на одну из 8 основных эмоций (гнев, страх, предвкушение, доверие, удивление, грусть, радость, отвращение). Однако каждый жанр видеоигр имеет свою игровую механику, и не было найдено ни одного исследования, сравнивающего письменные эмоции между самими жанрами. С включением жанров верхнего уровня (TLG) данное исследование призвано устранить этот пробел.

Одна из важнейших функций Steam - возможность оставлять отзывы на странице игры. Именно поэтому Steam выбран для данного исследования. Обзоры может читать любой, но компания Valve Corporation также создала интерфейс прикладного программирования (API), позволяющий собирать данные из обзоров. После сбора данных обзоры можно анализировать различными методами, чтобы понять впечатления игроков или просто оценить их полезность. Большинство обзоров пишутся вскоре после выпуска приложения. Затем частота написания быстро снижается с течением времени. Обзоры могут содержать несколько тем, таких как запросы функций, пользовательский опыт и сообщения об ошибках.

Каждую видеоигру можно отнести к жанру. В Steam это делают разработчики, а пользователи могут создавать теги. Каждый жанр имеет свой стиль и предоставляет игрокам различные возможности. Согласно документации Steamworks (Valve Corporation, 2022c), помимо жанров, игры можно разделить на супержанры (или, другими словами, TLG) и поджанры. В указанной документации также указано, что существует 11 TLG, 68 жанров и 61 поджанр. В Steam у каждой игры есть как минимум один TLG, жанр и поджанр.

Материалы и методы
Необходимо было собрать и оценить обзоры всех приложений на платформе Steam. Использовался статистический программный пакет R.

Процесс сбора данных
В процессе сбора данных использовался API Steam. Для сбора обзоров всех приложений в Steam необходимо собрать их идентификаторы. Это сделано с помощью функции Metalist (Valve Corporation, 2022b). В результате идентификаторы и названия 145 155 приложений сохранены в фрейме данных R. Следующий шаг - найти TLG каждого приложения и прикрепить их к идентификаторам. Согласно документации Steam, существуют TLG для экшенов, приключений, казуальных игр, экспериментальных игр, головоломок, гонок, ролевых игр, симуляторов, спортивных игр, стратегий и настольных игр. Естественно, одна игра может вписываться в несколько TLG. Чтобы прикрепить TLG к идентификатору приложения, в R использовалась функция readapt для загрузки страницы каждого приложения в Steam. Затем, с помощью функций телетекста и grell, в разделе тегов каждого приложения были найдены 11 имён TLG. Наконец, TLG прикреплены к идентификаторам приложений в фрейме данных.

Далее - сам процесс извлечения данных. Использовалась функция GET в R. Поскольку весь набор данных Steam большой, со страницы игры извлечены только англоязычные обзоры и последние 1000 если их много. Извлечение производилось в алфавитном порядке, поэтому экшен-игры первые, а настольные игры - последние. В результате сбора данных и благодаря тому, что некоторые игры принадлежат к нескольким TLG, сформирован набор данных из 35 983 481 обзора. Из них 81,16% положительные.

Помимо текстовой составляющей, извлечены следующие данные: тип обзора (положительный или отрицательный); количество голосов за обзор; количество людей, считавших обзор забавным; время игры на момент создания обзора; общее время, проведённое игроком в игре; получена ли игра бесплатно; количество игр, сыгранных игроком; был ли обзор написан в период раннего доступа; и количество комментариев к обзору.

Анализ данных
Для анализа сначала анализировался текст обзора на основе длины. После подсчета количество слов группировалось по TLG. Позже обзоры группировались по положительным или отрицательным отзывам. Кроме того, целью было найти связь между длиной обзора и временем на момент обзора, а также между последним и тем, являются ли обзоры положительными или нет. Что касается эмоций, в R использовался пакет обработки естественного языка (NLP) под названием syuzhet. В этом лексиконе восемь базовых эмоций и два тона. Эмоции — это гнев, страх, предвкушение, доверие, удивление, грусть, радость и отвращение, при этом тональности могут быть как положительными, так и отрицательными.

Выводы
В данном исследовании 35 983 481 обзор Steam был проанализирован с использованием методов обработки естественного языка для понимания опыта игроков и их эмоций. Для анализа эмоций игроков было выбрано 11 групп TLG. Таким образом, отзывы игроков были сравнены между ними. Можно сделать следующие выводы.

1. Количество слов в разных группах TLG значительно различается. Самые длинные положительные и отрицательные обзоры написаны для ролевых игр, а самые короткие - для гоночных. Однако количество слов в отрицательных обзорах значительно больше в каждой группе TLG. В целом, медианное количество слов для положительных отзывов составляет 19, а для отрицательных - 40.

2. Положительные отзывы пишутся гораздо позже (6,76 часов игрового времени), чем отрицательные (2,06). В случае отрицательных обзоров наибольшее количество часов до написания обзора приходится на настольные игры, в то время как в случае положительных обзоров наибольшее количество часов приходится на симуляторы. В обоих типах обзоров наименьшее количество времени до написания обзора составляли экспериментальные игры.

3. Корреляции между количеством слов и временем, проведенным за обзором, нет. Это наблюдается во всех TLG. Независимо от того, положительный или отрицательный тип обзора, он лишь слабо влияет на силу коэффициента корреляции. Тем не менее, анализ следует проводить в более мелких жанрах или поджанрах.

4. Несмотря на то, что отрицательные обзоры содержат больше негативных сентенций, все обзоры начинаются с несколько положительной эмоциональной валентности. Когда люди пишут обзоры, они, как правило, испытывают отрицательные эмоции, снижая их по мере повествования. В большинстве TLG снижение эмоциональной валентности по мере повествования сильнее в отрицательных обзорах. В некоторых TLG валентность немного увеличивается в конце.

5. Среднее количество эмоций в обзоре значительно различается в разных TLG. Тем не менее, некоторые сходства в среднем количестве эмоций между группами TLG можно обнаружить в положительных отзывах, тогда как в отрицательных их количество увеличивается. Анализ эмоций в тексте показал, что гоночные и спортивные игры наиболее схожи в случае отрицательных отзывов.

Благодаря этим выводам сделан шаг к пониманию эмоций игроков и их опыта. Разработчики игр также могут учитывать эти результаты при создании новой игры в рамках определенной группы TLG. В конце концов, сам игровой рынок — это огромный рынок, и разработчикам необходимо создавать игры, которые нравятся игрокам. Поэтому крайне важно понимать, что игрокам нравится в видеоиграх, и использовать эти 11 групп TLG. Однако это требует дальнейшего изучения, поскольку понимание взаимосвязи между видеоиграми и игроками — обширная область исследований.

17.08.2025



(c)2010-2025 Шнобелевская премия
ig-nobel@mail.ru