python假设检验实战,是否服从正态分布,异常数据,相关性
1.要解决的问题 给出的数据集为人体的体温数据,下载链接为 https://pan.baidu.com/s/1t4SKF6U2yyjT365FaE692A* 包括三个数据字段: gender:性别,1为男性,2为女性 Temperature:体温 HeartRate:心率 要解决的问题如下: 人体体温的总体均值是否为98.6华氏度? 人体的温度是否服从正态分布? 人体体温中存在的异常数据是哪些? 男女体温是否存在明显差异? 体温与心率间的相关性(强?弱?中等?) 首先导入数据集: import pandas as pd import numpy as np import matplotlib . pyplot as plt import seaborn as sns from scipy import stats data = pd . read_csv ( 'test.csv' ) temp = data [ 'Temperature' ] gender = data [ 'Gender' ] heartRate = data [ 'HeartRate' ] 查看该数据集的各项数据 data . describe ( ) 输出: Temperature Gender HeartRate count 130.000000 130.000000 130.000000 mean 98