《Python数据分析》课程电子教案(PPT课件)第4章 pandas统计分析基础

第 4 章 Pandas统计分析基础 Python数据分析

第 4 章 Pandas统计分析基础 • Pandas(Python Data Analysis Library)是基于 NumPy的数据分析模块,它提供了大量标准数据模 型和高效操作大型数据集所需的工具,可以说 Pandas是使得Python能够成为高效且强大的数据分 析环境的重要因素之一。 • 导入方式:import pandas as pd

4.1 Pandas中的数据结构 Pandas有三种数据结构:Series、DataFrame和 Panel。Series类似于一维数组;DataFrame是类似 表格的二维数组;Panel可以视为Excel的多表单 Sheet

❖4.1.1 Series Series 是一种一维数组对象,包含了一个值序列,并且包含了 数据标签,称为索引(index),可通过索引来访问数组中的数据。 4.1 Pandas中的数据结构

1. Series的创建 pd.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False) 【例4-1】通过列表创建Series In[1]: import pandas as pd obj = pd.Series([1, -2, 3, -4]) #仅有一个数组构成 print(obj) Out[1]: 0 1 1 -2 2 3 3 -4 dtype: int64 4.1 Pandas中的数据结构

1. Series的创建 【例4-2】创建Series时指定索引 In[2]: i = ["a", "c", "d", "a"] v = [2, 4, 5, 7] t = pd.Series(v, index = i, name = "col") print(t) Out[2]: a 2 c 4 d 5 a 7 Name: col, dtype: int64 尽管创建Series指定了index参数,实际Pandas还是有隐藏的index位置信息的。所以 Series有两套描述某条数据的手段:位置和标签 4.1 Pandas中的数据结构

1. Series的创建 【例4-3】Series位置和标签的使用 4.1 Pandas中的数据结构

1. Series的创建 2)通过字典创建 如果数据被存放在一个Python字典中,也可以直接通过这个字典来 创建Series。 In[4]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj3 = pd.Series(sdata) print(obj3) Out[4]: Ohio 35000 Texas 71000 Oregon 16000 Utah 5000 dtype: int64 4.1 Pandas中的数据结构

【例4-6】键值和指定的索引不匹配 In[6]: sdata = {"a" : 100, "b" : 200, "e" : 300} letter = ["a", "b","c" , "e" ] obj = pd.Series(sdata, index = letter) print(obj) Out[6]: a 100.0 b 200.0 c NaN e 300.0 dtype: float64 1. Series的创建 2)通过字典创建 4.1 Pandas中的数据结构

1. Series的创建 2)通过字典创建 【例4-7】不同索引数据的自动对齐 In[7]: sdata = {'Ohio': 35000, 'Texas': 71000, 'Oregon': 16000, 'Utah': 5000} obj1 = pd.Series(sdata) states = ['California', 'Ohio', 'Oregon', 'Texas'] obj2 = pd.Series(sdata, index = states) print(obj1+obj2) Out[7]: California NaN Ohio 70000.0 Oregon 32000.0 Texas 142000.0 Utah NaN dtype: float64 4.1 Pandas中的数据结构
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《Python数据分析》课程电子教案(PPT课件)第3章 NumPy数值计算基础.pptx
- 《Python数据分析》课程电子教案(PPT课件)第2章 Python编程基础.pptx
- 《Python数据分析》课程电子教案(PPT课件)第1章 数据分析与可视化概述新.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第10章 排序 10.8 外排序.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第10章 排序 10.5 归并排序 10.6 基数排序 10.7 各种内排序方法的比较和选择.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第10章 排序 10.4 选择排序.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第10章 排序 10.1 排序的基本概念 10.2 插入排序 10.3 交换排序.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第9章 查找 9.4 哈希表查找.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第9章 查找 9.3 树表的查找(2/2).pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第9章 查找 9.3 树表的查找(1/2).pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第9章 查找 9.1 查找的基本概念 9.2 线性表的查找.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第8章 图 8.6 拓扑排序 8.7 AOE网与关键路径.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第8章 图 8.5 最短路径.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第8章 图 8.4 生成树和最小生成树.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第8章 图 8.3 图的遍历.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第8章 图 8.1 图的基本概念 8.2 图的存储结构.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第7章 树和二叉树 7.9 树算法设计和并查集.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第7章 树和二叉树 7.6 线索二叉树 7.7 哈夫曼树 7.8 二叉树与树、森林之间的转换.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第7章 树和二叉树 7.4 二叉树的层次遍历 7.5 二叉树的构造.pptx
- 河池学院:《数据结构》课程电子教案(PPT教学课件)第7章 树和二叉树 7.3 二叉树先序、中序和后序遍历.pptx
- 《Python数据分析》课程电子教案(PPT课件)第5章 Pandas数据载入与预处理.pptx
- 《Python数据分析》课程电子教案(PPT课件)第6章 Matplotlib数据可视化基础.pptx
- 《Python数据分析》课程电子教案(PPT课件)第7章 利用Seaborn绘图.pptx
- 《Python数据分析》课程电子教案(PPT课件)第8章 pyecharts可视化.pptx
- 《Python数据分析》课程电子教案(PPT课件)第9章 时间序列数据分析.pptx
- 《Python数据分析》课程电子教案(PPT课件)第10章 SciPy科学计算.pptx
- 《R语言》课程教学资源(PPT课件)第01章 进入R的世界.pptx
- 《R语言》课程教学资源(PPT课件)第02章 R语言基础.pptx
- 《R语言》课程教学资源(PPT课件)第03章 R函数与流程控制.pptx
- 《R语言》课程教学资源(PPT课件)第04章.pptx
- 《R语言》课程教学资源(PPT课件)第05章 基本图形.pptx
- 《R语言》课程教学资源(PPT课件)第06章 数据预处理.pptx
- 《R语言》课程教学资源(PPT课件)第07章 数据处理与描述性统计.pptx
