Plotly+Seaborn+Folium可视化探索爱彼迎租房数据

您所在的位置：网站首页 › 爱彼迎优惠价 › Plotly+Seaborn+Folium可视化探索爱彼迎租房数据

Plotly+Seaborn+Folium可视化探索爱彼迎租房数据

2024-01-18 14:26| 来源: 网络整理| 查看: 265

Airbnb是AirBed and Breakfast ( “Air-b-n-b” )的缩写，中文名称之为：空中食宿，是一家联系旅游人士和家有空房出租的服务型网站，可以为用户提供各式各样的住宿信息。

本文针对kaggle上爱彼迎在新加坡的一份数据进行探索分析。原notebook学习地址：https://www.kaggle.com/bavalpreet26/singapore-airbnb/notebook

爱彼迎将全球的租房数据进行了收集，并且放在了自己的官网上供参考，官方数据地址：http://insideairbnb.com/get-the-data.html

上面很多城市的数据，国内的有北京、上海等，都是免费可下载的，感兴趣的朋友可以玩转这些数据。

本文选择的是花园城市-狮城新加坡，是个出国旅游的好去处！

本文相关数据集和代码大家可以直接在Kaggle官网下载。

导入库

导入数据分析需要的库：

import pandas as pd import numpy as np# 二维图形 import matplotlib import matplotlib.pyplot as plt import seaborn as sns import geopandas as gpd plt.style.use('fivethirtyeight') %matplotlib inline# 动态图 import plotly as plotly import plotly.express as px import plotly.graph_objects as go from plotly.offline import init_notebook_mode, iplot, plot init_notebook_mode(connected=True)# 地图制作 import folium import folium.plugins# NLP：词云图 import wordcloud from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator# 机器学习建模相关 import sklearn from sklearn import preprocessing from sklearn import metrics from sklearn.metrics import r2_score, mean_absolute_error from sklearn.preprocessing import LabelEncoder,OneHotEncoder from sklearn.model_selection import train_test_split from sklearn.linear_model import LinearRegression,LogisticRegression from sklearn.ensemble import RandomForestRegressor, GradientBoostingRegressor# 忽略告警 import warnings warnings.filterwarnings("ignore") 数据基本信息

导入我们获取到的数据：

查看数据的基本信息：形状shape、字段、缺失值等

# 数据形状 df.shape(7907, 16)# 字段信息 columns = df.columns columnsIndex(['id', 'name', 'host_id', 'host_name', 'neighbourhood_group','neighbourhood', 'latitude', 'longitude', 'room_type', 'price','minimum_nights', 'number_of_reviews', 'last_review','reviews_per_month', 'calculated_host_listings_count','availability_365'],dtype='object')

具体解释下每个字段的中文含义为：

id：记录ID

name：房屋名字

host_id：房东id

host_name：房东名字

neighbourhood：区域

latitude：纬度

longitude：经度

room_type：房间类型

price：价格

minimum_nights：预订最低天数

number_of_reviews：评论数量