中国高校课件下载中心 》 教学资源 》 大学文库

《Python数据分析》课程电子教案(PPT课件)第4章 pandas统计分析基础

文档信息
资源类别:文库
文档格式:PPTX
文档页数:70
文件大小:1MB
团购合买:点击进入团购
内容简介
《Python数据分析》课程电子教案(PPT课件)第4章 pandas统计分析基础
刷新页面文档预览

第 4 章 Pandas统计分析基础 Python数据分析

第 4 章 Pandas统计分析基础 • Pandas(Python Data Analysis Library)是基于 NumPy的数据分析模块,它提供了大量标准数据模 型和高效操作大型数据集所需的工具,可以说 Pandas是使得Python能够成为高效且强大的数据分 析环境的重要因素之一。 • 导入方式:import pandas as pd

4.1 Pandas中的数据结构 Pandas有三种数据结构:Series、DataFrame和 Panel。Series类似于一维数组;DataFrame是类似 表格的二维数组;Panel可以视为Excel的多表单 Sheet

❖4.1.1 Series Series 是一种一维数组对象,包含了一个值序列,并且包含了 数据标签,称为索引(index),可通过索引来访问数组中的数据。 4.1 Pandas中的数据结构

1. Series的创建 pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) 【例4-1】通过列表创建Series In[1]: import pandas as pd obj = pd.Series([1, -2, 3, -4]) #仅有一个数组构成 print(obj) Out[1]: 0 1 1 -2 2 3 3 -4 dtype: int64 4.1 Pandas中的数据结构

1. Series的创建 【例4-2】创建Series时指定索引 In[2]: i = ["a", "c", "d", "a"] v = [2, 4, 5, 7] t = pd.Series(v, index = i, name = "col") print(t) Out[2]: a 2 c 4 d 5 a 7 Name: col, dtype: int64 尽管创建Series指定了index参数,实际Pandas还是有隐藏的index位置信息的。所以 Series有两套描述某条数据的手段:位置和标签 4.1 Pandas中的数据结构

1. Series的创建 【例4-3】Series位置和标签的使用 4.1 Pandas中的数据结构

1. Series的创建 2)通过字典创建 如果数据被存放在一个Python字典中,也可以直接通过这个字典来 创建Series。 In[4]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj3 = pd.Series(sdata) print(obj3) Out[4]: Ohio 35000 Texas 71000 Oregon 16000 Utah 5000 dtype: int64 4.1 Pandas中的数据结构

【例4-6】键值和指定的索引不匹配 In[6]: sdata = {"a" : 100, "b" : 200, "e" : 300} letter = ["a", "b","c" , "e" ] obj = pd.Series(sdata, index = letter) print(obj) Out[6]: a 100.0 b 200.0 c NaN e 300.0 dtype: float64 1. Series的创建 2)通过字典创建 4.1 Pandas中的数据结构

1. Series的创建 2)通过字典创建 【例4-7】不同索引数据的自动对齐 In[7]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj1 = pd.Series(sdata) states = ['California', 'Ohio', 'Oregon', 'Texas'] obj2 = pd.Series(sdata, index = states) print(obj1+obj2) Out[7]: California NaN Ohio 70000.0 Oregon 32000.0 Texas 142000.0 Utah NaN dtype: float64 4.1 Pandas中的数据结构

刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档