今天学习的是
1;pandas的另外一个数据类型:DataFrame。
2;以及生成Series和DataFrame
3;pandas的数据类型
DataFrame(data=None, index: 'Axes | None' = None, columns: 'Axes | None' = None, dtype: 'Dtype | None' = None, copy: 'bool | None' = None)
1;data:数据
2;index:行的标签
3;columns: 列的标签。
4;dtype: 输出的类型。
来举几个例子:
import pandas as pd
a = {'col1': [1, 2], 'col2': [3, 4]}
b = pd.DataFrame(a)
print(b)
a = {'姓名':['张三','李四'],'年龄':[20,25],'身高':[1.73,1.75]}
b=pd.DataFrame(a)
print(b)
a = {'姓名':['张三','李四'],'年龄':[20,25],'身高':[1.73,1.75]}
b=pd.DataFrame(a,index=(1,2))
print(b)
1;字典的键是行的内容,字典的值是列的内容,一一对应
2;index 可更改标签数值,如果默认则从0开始,可以看第三个例子,标签的个数需要与值的个数一致,否则会报错。
生成Series,Series是一个带有标签的一维数组,这个数组可以由任何类型数据构成,包括整型、浮点、字符、Python对象等。它的轴标签被称为索引,它是Pandas最基础的数据结构。
数据是:列表和元组的情况下:
import pandas as pd
a = [1,2,3,4,5,6]
b = pd.Series(a)
print(b)
a = (1,2,3,4,5,6)
b = pd.Series(a)
print(b)
结果都是一样,左边是索引值,右边是值。
数据是:NumPy的ndarray结构:
import pandas as pd
import numpy as np
a = pd.Series(np.random.rand(6),index=[1,2,3,4,5,6])
print(a)
Numpy 可以轻松地生产一组数组并且给这组随机数标记。
数据是:字典
import pandas as pd
import numpy as np
a = {'张三':18,'李四':20,'王二':25}
b = pd.Series(a)
print(b)
原数据是字典的标记值就是字典的键,如果要更改标记值就更改index=
生成DataFrame,DataFrame是二维数据结构,数据以行和列的形式排列,表达一定的数据意义。DataFrame的形式类似于CSV、Excel和SQL的结果表,有多个数据列,由多个Series组成。
数据是:字典
import pandas as pd
import numpy as np
a = {'男性':['张三','李四','王二'],'女性':['刘梅','安红','妞妞']}
print(pd.DataFrame(a))
pandas的数据类型:
常见的3种数据类型:
int64:整数
float64:浮点数
object:文字
Python检查类型用的是type,pandas用的是types
留言与评论(共有 0 条评论) “” |