Python w badaniach nad Airbnb – jak to działa?

Strona główna » Python w badaniach nad Airbnb – jak to działa?
Python & airbnb

Python to język programowania wykorzystywany w metodologii data science. Do swoich badań nad Airbnb używa go między innymi Kristóf Gyódi, członek zespołu badawczego Delab UW. Porozmawialiśmy z nim o tym, jak w praktyce wyglądają tego typu badania i jakie można wyciągnąć z nich wnioski.

Na co dzień zajmuje się Pan badaniem działalności Airbnb w europejskich miastach i wykorzystuje Pan do tego metody data science. Dlaczego w swoich badaniach zainteresowało Pana akurat Airbnb?

Rozpocząłem studia doktoranckie z planem badania zjawisk powiązanych z cyfryzacją. Na początku tej drogi zajmowałem się różnymi tematami, jak Industry 4.0 lub e-commerce, ale najciekawsze zagadnienia dotyczyły coraz bardziej popularnych usług świadczonych przez platformy takie jak Uber czy Airbnb.

Pojawienie się zjawisk tzw. „gig economy” oraz „sharing economy” spowodowało pojawienie się szeregu nowych pytań badawczych, które są niezwykle istotne dla rozwoju miast. W przypadku Airbnb głównie zaintrygowało mnie to, na ile możemy w tym kontekście mówić o „ekonomii współdzielenia”, jaka jest skala profesjonalizacji tych usług, w jaki sposób rozprzestrzeniają się oferty w dużych miastach.

Jak wygląda proces badawczy w przypadku korzystania z metodologii data science?

Moim środowiskiem pracy jest Python, który bardzo cenię za dużą elastyczność i przejrzystość. Projekt badawczy składa się z różnych etapów: najpierw tworzę bazy danych na podstawie ofert Airbnb, często korzystając z metod web-scrapingu (głównie z pakietu Selenium Webdriver).

Po wyczyszczeniu danych (Pandas) przychodzi czas na ich analizę, np. przestrzenną (PySAL). Do wizualizacji danych zwykle używam Matplotlib, Seaborn oraz Altair, a do map Folium. Oferty Airbnb zawierają również dane tekstowe, które przetwarzam z udziałem pakietu NLTK.

Z jakiego rodzaju największymi problemami spotyka się Pan w badaniach, jeśli chodzi o zbieranie danych?

Jednym z powodów, dlaczego wybrałem Airbnb jako przedmiot moich badań, jest możliwość zbierania danych dotyczących ofert bezpośrednio ze strony internetowej.

Ze względu na dużą liczbę ofert jest to jednak dość czasochłonne, nawet przy wykorzystaniu narzędzi typu Selenium. Dane zbierane w taki sposób mają jednak swoje ograniczenia, np. nie poznamy dokładnej liczby dokonanych rezerwacji.

W Berlinie udowodniono, że rosnąca liczba ofert w Airbnb spowodowała podniesienie stawek czynszów. Skąd takie korelacje i czy to samo może czekać/a może już dzieje się w Polsce?

Popularność Airbnb pośród turystów stworzyła dużą zachętę do inwestowania w mieszkania do najmu krótkoterminowego. Z perspektywy inwestorów, najem krótkoterminowy stał się łatwą i bardziej dochodową alternatywą najmu długoterminowego, obniżając tym podaż mieszkań dostępnych dla zwykłych mieszkańców oraz przyczyniając się do wzrostu cen najmu nieruchomości i czynszów. Polska nie jest wyjątkiem, Airbnb prawdopodobnie było jednym z czynników napędzających cen w ostatnich latach.

Co Pana najbardziej zaskoczyło podczas zbierania danych o Airbnb w Polsce w 2020 r.? I czego możemy spodziewać się w 2021 r.?

Ciekawe było to, że ceny na Airbnb nie uległy dużemu spadkowi w trakcie wiosny, szczególnie w kontekście znaczących obniżek cen hoteli.

Gospodarze Airbnb mieli różne możliwości wykorzystania swoich mieszkań – mogli je wynająć na tzw. długi okres lub eksperymentować z takimi usługami jak mieszkanie do pracy zdalnej czy kwarantanny. Co do 2021r., sytuacja zależeć będzie od tego, jak szybko i jak licznie powrócą turyści do polskich miast.

Czytaj takżeW jaki sposób wdraża się projekty AI w Polsce?

ZOBACZ RÓWNIEŻ