个性化阅读
专注于IT技术分析

Python数据分析的数学运算指南

点击下载

Python是进行数据分析的一种出色语言, 主要是因为以数据为中心的Python软件包具有奇妙的生态系统。大熊猫是这些软件包之一, 使导入和分析数据更加容易。

熊猫系列可以执行一些重要的数学运算, 以简化使用Python的数据分析并节省大量时间。

要获取使用的数据集, 请单击这里.

s=read_csv("stock.csv", squeeze=True)
#reading csv file and making seires
函数 采用
s.sum() 返回序列中所有值的总和
s.mean() 返回序列中所有值的平均值。等于s.sum()/ s.count()
s.std() 返回所有值的标准偏差
s.min()或s.max() 返回序列的最小值和最大值
s.idxmin()或s.idxmax() 返回序列的最小值或最大值的索引
s.median() 返回所有值的中位数
s.mode() 返回系列的模式
s.value_counts() 返回具有每个值的频率的序列
s.describe() 根据所传递数据的dtype返回带有平均值, 众数等信息的序列

代码1:

# import pandas for reading csv file
import pandas as pd
  
#reading csv file
s = pd.read_csv( "stock.csv" , squeeze = True )
  
#using count function
print (s.count())
  
#using sum function
print (s. sum ())
  
#using mean function
print (s.mean())
  
#calculatin average
print (s. sum () /s.count())
  
#using std function
print (s.std())
  
#using min function
print (s. min ())
  
#using max function
print (s. max ())
  
#using count function
print (s.median())
  
#using mode function
print (s.mode())

输出如下:

3012
1006942.0
334.3100929614874
334.3100929614874
173.18720477113115
49.95
782.22
283.315
0    291.21

代码2:

# import pandas for reading csv file
import pandas as pd
  
#reading csv file
s = pd.read_csv( "stock.csv" , squeeze = True )
  
#using describe function
print (s.describe())
  
#using count function
print (s.idxmax())
  
#using idxmin function
print (s.idxmin())
  
#count of elements having value 3
print (s.value_counts().head( 3 ))

输出如下:

dtype: float64
count    3012.000000
mean      334.310093
std       173.187205
min        49.950000
25%       218.045000
50%       283.315000
75%       443.000000
max       782.220000
Name: Stock Price, dtype: float64

3011
11
291.21    5
288.47    3
194.80    3
Name: Stock Price, dtype: int64

意外的输出和限制:

.sum()、. mean()、. mode()、. median()和其他此类数学运算不适用于字符串或数字值以外的任何其他数据类型。

字符串系列上的.sum()会提供意外的输出, 并通过串联每个字符串返回一个字符串。

首先, 你的面试准备可通过以下方式增强你的数据结构概念:Python DS课程。


赞(0)
未经允许不得转载:srcmini » Python数据分析的数学运算指南

评论 抢沙发

评论前必须登录!