数据分析实战(二)
数据集地址 提取码: us2a Age: 年龄,指登船者的年龄 Fare: 价格,指船票价格 Embark: 登船的港口 Q1: 按照港口分类,使用python求出各类数据年龄、票价格的统计量(均值、方差、标准差、变异系数等) import pandas as pd data = pd.read_excel("D:\data\data.xlsx") data = data.set_index("ID") portS = data[data["Embarked"]=="S"] portC = data[data["Embarked"]=="C"] portQ = data[data["Embarked"]=="Q"] portS_age = portS["Age"] portS_fare = portS["Fare"] portC_age = portC["Age"] portC_fare = portC["Fare"] portQ_age = portQ["Age"] portQ_fare = portQ["Fare"] port_details = pd.DataFrame({"均值":[portS_age.mean(),portC_age.mean(),portQ_age.mean(),portS_fare.mean(),portC_fare.mean(),portQ_fare