За последние годы во многих статьях, блогах и форумах сообщалось об использовании ценовой дискриминации в онлайн-билетах. Как правило, эти утверждения основаны на неподтвержденных данных. В этом разделе мы кратко перечислим несколько примечательных случаев и обсуждений.

В 2011 году массовый «ретвитнутый» твит [23] подразумевал, что Ryanair отслеживает пользователей с помощью файлов cookie и повышает их цены на основе предыдущих посещений пользователя. В последующем сообщении в блоге [7] подобные заявления были высказаны людьми, участвующими в обсуждении: TheTrainline.com, Expedia, Easyjet, Virgin, Lastminute и Eurostar были обвинены в ценовой дискриминации на основе предыдущих посещений или поисковых запросов. Год спустя Wall Street Journal сообщил, что интернет-агентство путешествий (OTA) Orbitz [3] сначала представляет компьютеры под брендом Apple с более дорогими результатами поиска авиабилетов и отелей [14], и эта практика называется поисковой дискриминацией [ 17].

В 2013 году в колонке, опубликованной в USA Today [16], конкретно обсуждались текущие технические возможности и правовые последствия ценовой дискриминации в сфере туризма. Кроме того, они утверждают, что наблюдали разницу в цене с браузером, очищенным от файлов cookie, в тестах, проведенных в 2007 году.

Совсем недавно, в январе 2014 года, блогер объяснил, как он получил менее дорогой тариф (например, с помощью системы: авіаквитки) от Kayak [2], механизма метапоисков путешествий, используя канадский вместо американского IP-адреса [6].

Масштабный анализ

Как отмечалось в предыдущем разделе, авиакомпании были обвинены в обслуживании разных цен в зависимости от географического местоположения клиента, используемого им устройства, его профиля потребителя или их предыдущих поисковых запросов. Мы оцениваем это утверждение, анализируя 25 авиакомпаний непрерывно в течение 3 недель, используя десятки уникальных пользовательских профилей. Эти профили построены в свете методов отслеживания пользователей и потенциальных дискриминационных факторов.

Чтобы правильно оценить эту практику, мы эмулируем реальных пользователей, выполняющих поисковые запросы для конкретных маршрутов полета. Мы делаем это неоднократно для всех различных профилей пользователей на всех рассматриваемых авиакомпаниях. По каждому проведенному поисковому запросу мы отслеживаем цены, представленные данному конкретному пользователю.
В следующих параграфах мы объясним методы, используемые для автоматизации поисковых запросов и создания различных пользовательских профилей.

Автоматизированные поисковые запросы

В течение 21 дня мы обращались к 25 авиакомпаниям два раза в день с 66 профилями пользователей из двух разных географических мест одновременно, в результате чего было получено более 130 000 запросов. Мы автоматизировали этот крупномасштабный анализ, построив скребок с помощью CasperJS [1], который является утилитой для навигации и тестирования сценариев для PhantomJS [4], безголового браузера. Мы позаботились о том, чтобы наш скребок выполнял те же действия, что и обычный пользователь при поиске авиабилетов. Скребок работал с 15 января 2014 года по 5 февраля 2014 года, запрашивая рейсы, вылетающие 22 марта 2014 года и возвращающиеся 30 марта 2014 года. Запрашиваемые маршруты конкретных рейсов были разными для каждой авиакомпании, но фиксировались на протяжении всего анализа. , Порядок, в котором скребок повторял 66 пользовательских профилей для каждой авиакомпании, был рандомизирован при каждом запуске.

 Построение профилей пользователей

Мы создали в общей сложности 66 уникальных пользовательских профилей, которые являются результатом объединения нескольких различных подпрофилей, описанных в следующих разделах. Большинство из них использовали способность PhantomJS легко настраивать внутренние параметры браузера и настройки файлов cookie. Кроме того, были созданы два географических субпрофиля, которые были объединены с 66 профилями пользователей.

Профили браузера и ОС Профили браузера и операционной системы (ОС) настроены для наблюдения за потенциальной дискриминацией в зависимости от устройства пользователя. С точки зрения веб-сервера строка User-Agent является наиболее простой функцией для идентификации клиентского интернет-браузера и ОС. При выполнении веб-запроса клиент отправляет эту строку в виде HTTP-заголовка на веб-сервер. Кроме того, строка User-Agent также находится в Javascript-объекте навигатора браузера вместе с другими показательными строками, такими как vendor, platform, appCodeName, appName и appVersion. Веб-сервер может использовать эту информацию, чтобы определить, какой браузер и ОС использует конкретный клиент. Например, строка «Пользователь-агент» Safari Mobile, работающая на iPad с iOS 4.3.5, легко распознается:

Mozilla / 5.0 (iPad; U; CPU OS 4_3_5, как Mac OS X; en-gb) AppleWebKit / 533.17.9 (KHTML, как Gecko) Версия / 5.0.2 Mobile / 8L1 Safari / 6533.18.5

Подделав информацию в строке User-Agent и объекте навигатора, мы смогли имитировать различные ОС и профили браузера. Наш скребок был запрограммирован на эмуляцию нескольких различных профилей: Internet Explorer 9 в Windows 7, Chrome 29 в Windows 7, Firefox 22 в OS X 10.7, Safari 6 в OS X 10.7 и Safari Mobile 5 в iOS (iPad).

Кроме того, мы настроили дополнительные профили Chrome, Safari и Internet Explorer с заголовком «Не отслеживать» (DNT), установленным в 1. Заголовок DNT – это заголовок HTTP, который пользователи могут использовать для запроса из веб-приложения об отключении их отслеживания [25 ].

Профили потребителей вдохновленные исследованиями Mikians et al. [17], мы разработали 3 профиля потребителя: богатый, бюджетный и рейс сравнения. Эти профили были составлены путем сбора файлов cookie веб-сайтов, которые могут быть связаны с ними. Например, файлы cookie для богатого профиля были собраны путем посещения сайтов, связанных с предметами роскоши и финансовыми новостями. Для профиля бюджета мы собрали файлы cookie с веб-сайтов, предлагающих скидки и обзоры продуктов. А для профиля сравнения путешествий были включены онлайн-агентства путешествий и системы метапоисков путешествий, такие как kayak.com.

Для каждого профиля мы сохранили отдельный файл cookie: все файлы cookie, собранные конкретным профилем потребителя, были сохранены в изолированном файле. Когда пользовательский профиль должен быть создан, его файл cookie может быть просто загружен в PhantomJS. Таким образом, потенциальные сторонние трекеры могут получить доступ к файлам профиля потребителя, пока наши сканеры посещают веб-сайт каждой авиакомпании.

Профили настройки файлов cookie Как обсуждалось в разделе 2.1, веб-сайты могут использовать собственные и сторонние файлы cookie для отслеживания пользователей между загрузками одной и той же страницы и между различными веб-сайтами. В нашем эксперименте мы учитывали четыре разных параметра cookie, когда собирали цены на билеты для каждой авиакомпании:

– Только файлы cookie профиля потребителя (собранные заранее)
– Файлы cookie профиля пользователя вместе с файлами cookie первого лица.
– Только собственные куки-файлы (также известные как сторонние куки-файлы)
– Нет cookie.

В наших экспериментах первичные файлы cookie – это файлы cookie, устанавливаемые самими авиакомпаниями, которые могут использоваться для отслеживания предыдущих посещений и поисков пользователя и потенциально могут влиять на цены, показанные пользователям с течением времени.

Географический профиль Веб-сайты часто используют IP-адрес пользователя в качестве показателя локальности [6, 17]. Чтобы настроить различные географические профили, скребок работал одновременно из двух разных мест: одного в Нью-Йорке, США, и одного в Левене, Бельгия.

Гипотезы

Чтобы оценить наличие систематической ценовой дискриминации, мы проверяем следующую гипотезу: если авиакомпании представляют неравные цены различным пользователям в зависимости от их профиля потребителя, местоположения или истории просмотров, мы должны иметь возможность наблюдать это при сравнении представленных цен. для набора эмулированных пользователей, которые отличаются этими характеристиками в течение нескольких моментов времени. Например, если компания представляет более высокие цены пользователям продуктов Apple, график цен на билеты во временном ряду должен поставить нашего эмулированного пользователя Apple «выше» других пользователей.

Ограничения и допущения

Поисковые запросы выполнялись не параллельно, а последовательно для каждого профиля в каждом местоположении. Рациональным для этого выбора дизайна является следующее: выполнение большого количества одновременных поисковых запросов может нарушить работу веб-сервера авиакомпании. Кроме того, если они участвуют в какой-либо форме ограничения ставки, наши запросы могут быть отклонены, что лишает нас возможности надежного измерения цен. Точно так же мы выполняли все поисковые запросы только два раза в день для каждой авиакомпании, а не постоянно для нашего трехнедельного измерения.
Все профили из одного географического местоположения имели одинаковый IP-адрес. Однако из-за широкого использования технологии NAT обычно считается, что веб-сервер не может различать пользователей по их IP-адресу. Поскольку охватить все возможные географические различия практически невозможно, мы использовали только два географических профиля во время наших измерений. В предварительных экспериментах было также оценено дополнительное местоположение (Франция), но никаких дополнительных различий не наблюдалось.
Наконец, обратите внимание, что в этой статье мы рассматривали только сайты, предоставляемые каждой авиакомпанией, а не агрегаторы путешествий и системы мета-поиска. Таким образом, наши результаты не должны быть обобщены для характеристики последнего.

Результаты

Большая часть проведенных поисковых запросов выдает несколько вариантов полета, различающихся с точки зрения маршрутов полета и времени вылета. Поэтому после извлечения цен из всех результатов поиска были рассчитаны минимальная, максимальная и средняя цена за запрос. Далее эти данные были представлены в виде временных рядов для каждого профиля. Вопреки нашим ожиданиям, мы не смогли найти каких-либо явных доказательств ценовой дискриминации: большинство графиков не выявили постоянной разницы в ценах между профилями пользователей.

Например, мы проанализировали колебания минимальных цен Ryanair, зафиксированные scraper located , расположенным в Соединенных Штатах. Мы сгруппировали все профили, которые имели одинаковую динамику цен на протяжении всего эксперимента, что привело к двум отдельным подмножествам. Из 42 измерений только один экземпляр (# 33) дает другую цену для подмножества профилей. Изучая точную временную метку измерения каждого профиля, мы обнаруживаем, что все профили с более высокой ценой в # 33 были записаны последовательно и до всех измерений с более низкой ценой. Это показывает, что, скорее всего, наблюдаемая разница в ценах связана с активным падением цены при проведении измерений для № 33, а не из-за ценовой дискриминации.

Чтобы оценить ценовую дискриминацию на основе местоположения, мы изучили рассчитанную статистику географических профилей, например, мы сравнили абсолютные минимумы всех американских профилей с абсолютными минимумами бельгийских профилей. Опять же, никаких явных доказательств ценовой дискриминации обнаружено не было: почти все авиакомпании показывают одинаковые цены для обоих местоположений. Однако, как видно на рис. 3, с United Airlines было одно исключение: в течение первых 15 дней бельгийская цена была неизменно выше американской. Время от времени бельгийская цена была на 67,92 доллара выше американской. Примечательно, что ближе к концу эксперимента минимальная цена в Бельгии упала ниже американской цены в несколько раз.
В предварительном эксперименте мы рассмотрели ценовую дискриминацию на многоязычных и многоязычных веб-сайтах. Мы сравнили родной регион или язык (в отношении происхождения авиакомпании) с альтернативой, отличной от родной. Особенно интересной находкой стал аргентинский сайт American Airlines. Как показано на рис. 4, цена была примерно на 19% выше, чем цена с американского сайта. Изучив это явление, мы обнаружили, что с 18 марта 2013 года правительство Аргентины ввело налог в размере 20% на покупки по кредитным картам и праздничные пакеты [21]. Эти налоги являются контрмерой для высокого уровня инфляции в Аргентине и прекрасно объясняют систематическую разницу в ценах.

Использованные источники

  1. Casperjs – navigation scripting and testing utility for phan http:// casperjs.org
  2. Kayak – flight, hotel and car rental search kayak.com
  3. Orbitz travel orbitz.com
  4. Phantomjs – a headless webkit scriptable with a javascript phantomjs. org
  5. Acar, , Juarez, M., Nikiforakis, N., Diaz, C., Gu¨rses, S., Piessens, F., Preneel, B.: FPDetective: Dusting the Web for fingerprinters. In: Proceedings of the ACM Conference on Computer and Communications Security (CCS) (2013)
  6. Casanova, : How i hacked kayak and booked a cheaper flight (2014), josecasanova.com/blog/how-i-hacked-kayak-and-booked-a-cheaper-flight/
  7. Dawson, : Save money on ryanair fares by deleting your cookies?  (2011), bitterwallet.com/save-money-on-ryanair-fares-by-deleting- your-cookies/42133
  8. Disabatino, :  Southwest  pulls  flight  data  to  hinder  orbitz  (2001),  edition.cnn.com/2001/TECH/industry/07/11/southwest.pulls.data.idg/
  9. Eckersley, P.: How Unique Is Your Browser? In: Proceedings of the 10th Privacy Enhancing Technologies Symposium (PETS). 1–17 (2010)
  10. Elliott, : The low airfare that vanishes in a click (2010), elliott.org/ the-navigator/the-low-airfare-that-vanishes-in-a-click/
  11. Jonjak, :     Lan     surprises    tourists     with     $178.50   fee    (2009),    http: //archive.peruthisweek.com/features-891-art-culture-lifestyle-lan- surprises-tourists-with-178-50-fee
  12. Krishnamurthy, , Wills, C.: Privacy diffusion on the web: A longitudinal perspec-tive. In: Proceedings of the 18th International Conference on World Wide Web. pp. 541–550. WWW ’09, ACM, New York, NY, USA (2009)
  13. Matt, :  How  to  be  a  travel  hacker  (2011), nomadicmatt.com/ travel-tips/travel-hacking-guide/
  14. Mattioli, : On orbitz, mac users steered to pricier hotels (2012), http://online. wsj.com/article/SB10001424052702304458604577488822667325882.html
  15. Mayer, R., Mitchell, J.C.: Third-party web tracking: Policy and technology. In:Proceedings of the IEEE Symposium on Security and Privacy. pp. 413–427 (2012)
  16. McGee, : Do travel deals change based on your browsing history (2013), usatoday.com/story/travel/columnist/mcgee/2013/04/03/do- travel-deals-change-based-on-your-browsing-history/2021993/
  17. Mikians, , Gyarmati, L., Erramilli, V., Laoutaris, N.: Detecting price and search discrimination on the internet. In: Proceedings of the 11th ACM Workshop on Hot Topics in Networks. pp. 79–84. HotNets-XI (2012)
  18. Mikians, , Gyarmati, L., Erramilli, V., Laoutaris, N.: Crowd-assisted Search for Price Discrimination in E-Commerce: First results. In: Proceedings of the 9th In- ternational Conference on emerging Networking EXperiments and Technologies (CoNEXT) (2013)
  19. Nikiforakis, , Kapravelos, A., Joosen, W., Kruegel, C., Piessens, F., Vigna, G.: Cookieless monster: Exploring the ecosystem of web-based device fingerprinting. In: Proceedings of the IEEE Symposium on Security and Privacy. pp. 541–555 (2013)
  20. Odlyzko, : Privacy, economics, and price discrimination on the internet. In: Pro- ceedings of the 5th International Conference on Electronic Commerce. pp. 355–366. ICEC ’03, ACM, New York, NY, USA (2003), doi.acm.org/10.1145/948005.948051
  21. Popper, :     Argentina     hikes    levy    on    credit     card    purchases   abroad (2013),                   reuters.com/article/2013/03/18/argentina-dollar- idUSL1N0CA3OI20130318
  22. Roesner, , Kohno, T., Wetherall, D.: Detecting and defending against third-party tracking on the web. In: NSDI’12: Proceedings of the 9th USENIX conference on Networked Systems Design and Implementation. pp. 12–12. USENIX Association, Berkeley, CA, USA (2012)
  23. Sampson, :  Ryanair  exhibit  a.  (2011),  twitter.com/sampsonian/ status/50199798099357696
  24. Vissers, , Nikiforakis, N., Bielova, N., Joosen, W.: Online airline price discrimi- nation dataset (2014),  people.cs.kuleuven.be/~thomas.vissers/data/ price_discrimination.zip
  25. W3C: Tracking preference expression (dnt) (2014),  w3.org/TR/ tracking-dnt/

Crying Wolf ? On the Price Discrimination of Online Airline Tickets
Thomas Vissers, Nick Nikiforakis, Nataliia Bielova, Wouter Joosen

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *