В статье рассматривается проблема характеристики поведения электронного клиента на основе данных журнала веб-сервера. Мы описываем пользовательские сессии с помощью ряда сессионных функций и стремимся идентифицировать функции, указывающие на высокую вероятность совершения покупки для двух групп клиентов: традиционных клиентов и инновационных клиентов. Мы обсуждаем наш подход, направленный на оценку вероятности покупки в пользовательском сеансе в зависимости от категорий просматриваемых продуктов и особенностей сеанса. Мы применяем правила ассоциации ассоциаций к реальным данным онлайн-магазина. Результаты показывают различия в факторах, указывающих на высокую вероятность покупки в сеансе для обоих типов клиентов. Обнаруженные правила ассоциации позволяют нам сформулировать некоторые прогнозы для интернет-магазина, например, что зарегистрированный пользователь, который просматривал только традиционные печатные книги, находился в магазине от 10 до 25 минут и открыл от 30 до 75 страниц, примет решение подтвердить покупку с вероятностью более 92%.

Наряду с развитием информационного общества и экономики, основанной на знаниях, электронная торговля приобретает все большую популярность во всем мире. Наиболее распространенным типом электронной коммерции была торговля B2C (Business-toConsumer), обычно реализуемая через онлайн-магазины. В электронной среде подробные данные о поведении электронных клиентов могут быть легко собраны и проанализированы с использованием методов интеллектуального анализа данных. Полученные знания могут затем использоваться для улучшения обслуживания клиентов в интернет-магазине, для повышения удовлетворенности клиентов и, следовательно, для повышения коэффициента конверсии интернет-магазина в долгосрочной перспективе.
В этой статье мы рассмотрим типичный онлайн-магазин, реализованный в виде веб-сайта B2C, размещенного на веб-сервере, поддерживаемом серверами приложений и баз данных. Веб-сайт состоит из множества страниц, на которых пользователь может выполнять различные функции, такие как просмотр предложения магазина, добавление выбранных товаров в виртуальную корзину или подтверждение заказа (что означает фактическую покупку в Интернете). Сайт может быть доступен одновременно многим веб-пользователям через их интернет-браузеры. Пользователь взаимодействует с сайтом через серию связанных запросов страниц, сделанных в течение одного пользовательского сеанса.

Мы предлагаем обнаружить связи между различными функциями пользовательских сессий в отношении покупок, совершаемых в интернет-магазине (в нашем случае – в онлайн-магазине книг). Мы выделяем две группы клиентов: традиционные клиенты, которые просматривают, а иногда и покупают только типичные продукты (печатные книги), и инновационные клиенты, которые просматривают, а иногда и покупают, не только типичные продукты, но и инновационные (аудиокниги и мультимедийные продукты). Мы стремимся определить функции этих сессий для обеих групп клиентов, которые указывают на высокую вероятность совершения покупки в сессию. Для этого мы применяем правила майнинга ассоциаций.

Мотивировкой для нашего исследования была проблема непредсказуемости поведения покупателей в интернет-магазинах и необходимость того, чтобы интернет-магазины могли определять потенциальных или будущих покупателей на основе их поведения в Интернете. На практике лишь небольшой процент посетителей интернет-магазинов становятся покупателями. Таким образом, способность онлайн-ритейлера прогнозировать сеансы покупок увеличивает шансы на достижение конкурентного преимущества, сосредоточившись на группе или группах ключевых клиентов.

Эта способность еще более важна ввиду непредсказуемости и высокой изменчивости веб-трафика. Иногда пиковое время может привести к перегрузке сервера и, как следствие, к длительным задержкам, заброшенным корзинам и незавершенным транзакциям. Такие ситуации могут часто наблюдаться в Черную пятницу и Кибер-понедельник, самые загруженные дни покупок в Интернете, после Дня благодарения в Соединенных Штатах. Способность онлайн-магазинов прогнозировать покупки позволила бы реализовать интеллектуальную, ориентированную на бизнес политику контроля доступа и планирования на веб-сервере, например. таким образом, что при большой нагрузке веб-сайт может предложить более высокое качество обслуживания посетителей с большей вероятностью совершения покупки.

Сосредоточение внимания на конкретных группах клиентов было мотивировано результатами некоторых предыдущих исследований, например, Чанг и соавт. (2007) и (Shim et al. (2012), показывая, что стоит сосредоточиться на ключевых покупателях интернет-магазина, а не на всех посетителях. Различение инновационных и традиционных групп покупателей стало результатом опыта онлайн-продавца книг и того факта, что Подавляющее большинство транзакций в книжном магазине завершается именно этими двумя группами покупателей.

Заключение

В этой статье мы предложили подход, основанный на обнаружении правил ассоциации в сеансах электронного клиента, чтобы оценить вероятность покупки в онлайн-сеансе. Две группы клиентов были выделены на основе предпочтений клиентов по типам продуктов: инновационные клиенты и традиционные клиенты. Подход был применен для анализа исторических данных, полученных из реального онлайн книжного магазина.

Наши результаты дают важный вклад в выявление особенностей, характеризующих поведение покупателей в онлайн-магазинах. Новые функции сеанса, принятые во внимание при создании правил ассоциации, включают в себя: среднее время на страницу, тип источника посещения, просмотренные категории продуктов и тот факт, зарегистрировался ли пользователь на сайте или вошел ли в него, добавили ли он продукт в корзина покупок, и размещены ли они заказ. Были обнаружены различные ассоциации для двух групп клиентов, и разные наборы функций сеанса оказались хорошими предикторами покупок. Эти результаты подтверждают результаты других исследований, показывающих, что стоит разделить клиентов из-за некоторых существенных особенностей их навигационного и покупательского поведения перед анализом.

Основное преимущество нашего подхода перед другими методами интеллектуального анализа данных, применяемыми для прогнозирования покупок, заключается в том, что его относительно легко внедрить на веб-сайтах электронной коммерции, и в результате он может легко адаптироваться к изменениям моделей поведения клиентов в режиме реального времени. Хотя обнаруженные правила ассоциации не могут быть обобщены для других интернет-магазинов, предложенная методология может быть легко адаптирована к специфике других веб-сайтов электронной коммерции.

Есть много возможных будущих разработок нашего подхода. Во-первых, можно использовать больше возможностей сеанса пользователя на основе файлов журнала, например, операционная система, клиентский веб-браузер, время и дата покупки или день недели. Анализ данных журнала, зарегистрированных за более длительный период, позволит учесть факторы сезонности и историю предыдущих посещений и покупок клиента. Другим направлением дальнейших исследований является более глубокий анализ оставленных корзин покупок в контексте пользовательской навигации по сайту с целью выявления поведенческих моделей и возможных причин отказа от намерения покупки и выявления сеансов, которые, скорее всего, будут отменены до начала Процесса оформления заказа.

В этом документе два класса клиентов были априори различены в зависимости от типа просматриваемых продуктов. В будущей работе мы планируем изучить различные методы кластеризации для автоматического разделения всего набора пользовательских сеансов на кластеры с учетом информации о категориях продуктов и поведенческих моделях. Мы также планируем сравнить эффективность обнаружения правил ассоциации и других методов интеллектуального анализа данных при прогнозировании покупок в Интернете. Такое сравнительное исследование может быть выполнено с использованием симулятора веб-сервера электронной коммерции. Имитационные эксперименты, основанные на модели веб-трафика, разработанной для реальных данных электронной коммерции, позволили бы проверить, сколько кликов пользователей в активном сеансе должно наблюдаться, чтобы распознать покупателя.

Использованные источники

  1. Adnan M, Nagi M, Kianmehr K, Tahboub R, Ridley M, Rokne J (2011) Promoting where, when and what? An analysis of Web logs by integrating data mining and social network techniques to guide ecommerce business promotions. Soc Netw Anal Min 1(3):173–185.
  2. Adomavicius G, Tuzhilin A (2001) Expert-driven validation of rule-based user models in personalization applications. Data Min Knowl Disc 5(1–2):33–58
  3. Agrawal R, Srikant R (1994)  Fast algorithms for mining  association  rules in large databases. In: Proceedings of the VLDB’94. Morgan Kaufmann Publishers, San Francisco, pp 487–499
  4. Agrawal R, Imielin´ski T, Swami A (1993) Mining association rules between sets of items in large databases. In: Proceedings of SIGMOD’93. ACM, New York, pp 207–216
  5. Borzemski L, Kamin´ska-Chuchmała A (2012) Client-perceived Web performance knowledge discovery through turning bands method. Cybernet Syst 43(4):354–368
  6. Borzemski L, Suchacka G (2010) Business-oriented admission control and request scheduling for e-commerce websites. Cybernet Syst 41(8):592–609
  7. Carmona CJ, Ram´ırez-Gallego S, Torres F, Bernal E, del Jesus MJ, Garc´ıa S (2012) Web usage mining to improve the design of an e-commerce website: OrOliveSur.com. Expert Syst Appl 39(12):11243–11249
  8. Catledge LD, Pitkow JE (1995) Characterizing browsing strategies in the World-Wide Web. Comput Netw ISDN 27(6):1065–1073
  9. Chang H-J, Hung L-P, Ho C-L (2007) An anticipation model of potential customers’ purchasing behavior based on clustering analysis and association rules analysis. Expert Syst Appl 32(3):753–764 Changchien SW, Lee C-F, Hsu Y-J (2004) On-line personalized sales promotion in electronic commerce. Expert Syst Appl 27(1):35–52
  10. Chen Z, Fu AW-C, Tong FC-H (2004) Optimal algorithms for finding user access sessions from very large Web logs. World Wide Web 6:259–279
  11. Chen Y-L, Kuo M-H, Wu S-Y, Tang K (2009) Discovering recency, frequency, and monetary (RFM) sequential patterns from customers’ purchasing data. Electron Commer Res Appl 8(5):241–251
  12. Cheng C-H, Chen Y-S (2009) Classifying the segmentation of customer value via RFM model and RS theory. Expert Syst Appl 36(3):4176–4184
  13. Chiang WY (2011) To mine association rules of customer values via a data mining procedure with improved model: an empirical case study. Expert Syst Appl 38(3):1716–1722
  14. Cho YS, Moon SC, Oh I-B, Shin J-H, Ryu KH (2013) Incremental weighted mining based on RFM analysis for recommending prediction in u-commerce. Int J Smart Home 7(6):133–144
  15. Chou P-H, Li P-H, Chen K-K, Wu M-J (2010) Integrating web mining and neural network for personalized e-commerce automatic service. Expert Syst Appl 37(4):2898–2910
  16. Cooley R, Mobasher B, Srivastava J (1999) Data preparation for mining World Wide Web browsing patterns. Knowl Inf Syst 1:5–32

Using association rules to assess purchase probability in online stores
Graz_yna  Suchacka,    Grzegorz  Chodak

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *