百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术分析 > 正文

Pandas入门-数据导入

liebian365 2025-03-05 17:47 14 浏览 0 评论

锋哥一直推荐大家学习并使用python来处理日常工作,很多同学会问,同样excel和vba就能做自动化,有没有必要做得这么高大上?因为python中有非常多的资源库,可以上九天揽月,也可以下五洋捉鳖。这里就不讨论python的好处,有兴趣的朋友,我们一起来学习。

Pandas是python上面最受欢迎的结构化数据分析库了,表哥表姐能够把pandas中的一些常用功能熟悉起来,完全能够应付日常工作。我们今天开始来谈谈pandas的数据导入。

一、导入数据类型

平日能够接触到的外部数据主要是:xlsx,csv。而大家最为常用的是excel中的xlsx。在超过上万条数据时,pandas的读取xlsx的速度可能变慢,所以建议大家事先将xls或xlsx另存为“以逗号分隔的CSV”文件,这样,哪怕有几十万条数据,pandas也能给你一个满意的速度。

二、导入数据

(一)xlsx格式

df=pd.read_excel(r"文件路径及文件名",sheet_name="表格名称")

在read_excel()中,除了路径,sheet_name,之外还有其他参数可以使用。

1.指定行索引"index_col",即指定哪一列作为索引,未指定时,行索引为0开始,即第一列作为索引,index_col=0

2.指定列索引"header",说白了就是列表题,默认值为0,即header=0

3.指定导入列"usecols",xlsx可能有上百列几十万行,在使用数据时,没有必要把不需要的列导入进来拖延运算速度,usecols可以采用列序号或者列标题来指定,格式为usecols=[0,1]这里是表明只导入第一列和第二列的数据,或者采用传入列表题的方式如usecols=["姓名","学号"]

例:

df=pd.read_excel(r"C:\Users\lenovo\Desktop\表格.xlsx",sheet_name="Sheet1",usecols=["学号","名称"])

(二)CSV格式

导入csv和excel文件的方法如出一辙,使用read_csv导入,如果我们是通过excel把数据另存为csv的,分隔符号默认是","逗号,这里要谈到sep参数,如果分割符号是逗号,那么参数sep=",",如果分割符号是空格或者制表符,sep=" "或者sep="\t",csv文件不像Excel表格那样存在多个sheet,所以在导入csv文件的时候,没有"sheet_name"这个参数。

例如:

在python中,使用得最多的两种编码格式是UTF-8和gbk,我们在导入时,如果不指定参数encoding,那么默认是采用UTF-8。在excel另存为csv文件时,如果选择保存的文件格式为"CSV逗号分隔",那么文本编码为gbk,如果保存的文件格式为"CSV UTF-8(逗号分隔)",那么文本编码为UTF-8。若文本编码为gbk,那么在read_csv中,需要加入参数encoding="utf-8"

相关推荐

python如何对字符串进行操作(python如何对字符串进行操作输出)

1.字符串的创建可通过直接赋值、构造或转义字符来创建字符串。#普通字符串s="Hello,World!"#多行字符串(使用三引号)multi_line_str='''Thisi...

Excel表格中11个常用的字符串函数

今天和大家聊聊常用的字符串函数,在不同的条件下,如何选择字符串函数很关键。下面我为大家列举了11个关于字符串的函数公式。一、EXACT(两个字符串进行结果比较)比较两个字符串是否完全相同(这里是要区分...

详细介绍一下Python中如何对字符串进行操作?

在Python中,字符串做为一种常见的数据处理类型,几乎在每个应用程序中都会被用到。而作为Python中使用最广泛的数据类型Python也是提供了很多强大的方法来支持对于字符串的处理操作。下面我们就来...

Java中你知道几种从字符串中找指定的字符的数量

遇到这样的问题,常规的思路估计就是遍历String,然后逐个对比。下面先看循环遍历循环遍历privatestaticintgetNum(StringoriginStr,Stringtarg...

C语言strcspn函数详解:字符串的“扫雷探测器”

strcspn是C语言标准库中的一个函数,定义在头文件中。它用于计算从字符串的开始到首次出现任何属于指定字符集合的字符之间的字符数量。换句话说,strcspn计算的是主字符串中不包含指定字符集...

如何使用 Python 的 f-string 进行字符串格式化

Python中的字符串格式化曾经有点麻烦。必须在...

java判断字符串中是否包含某个字符

1使用String类的contains()方法contains()方法用于判断字符串中是否包含指定的字符或字符串。语法如下:publicbooleancontains(CharSequence...

Python基础:f-string不同数据类型的格式化选项,终极指南!

上一篇文章我们介绍了4种字符串格式化方法,其中最现代、最直观的方式是f-string,从Python3.6开始引入,而且时不时就增加一些超级优雅的小改进。今天,钢铁老豆想要继续给大家展开介绍不同数据...

Excel查找指定字符串,返回相应的结果

通过下面的函数,可以实现查找指定字符串,若找到返回“有”,若找不到返回“无”。=IF(ISNUMBER(SEARCH("失业",G3)),"有","无")...

一个list中,有b.a.b.c.b.b.写个方法去掉所有b

importjava.util.ArrayList;importjava.util.List;publicclassRemoveBFromStringList{/**...

掌握Python f-string(掌握催眠能力之后的日常生活)

f-string,通常称为格式化字符串文本,是Python3.6中添加的一项强大功能,它提供了一种将表达式包含在字符串文本中的清晰实用的方法。,...

深入了解字符串:定义、转义字符和字符串下标

字符串是编程中常见的数据类型之一,用于表示文本信息。在绝大多数编程语言中,字符串都是由一系列字符组成的序列,可以包含字母、数字、符号以及空格等。字符串的定义:...

100个Java工具类之70:字符串处理工具类StringUtils

StringUtils是常用的工具类,提供大量处理字符串的静态方法。StringUtils主要特点...

Shell中针对字符串的切片,截取,替换,删除,大小写操作

切片返回字符串变量var的长度...

Sqlite - 常规函数 - RTRIM(sqlite命令行工具)

在SQLite中,RTRIM函数是一个用于处理字符串的函数,其主要作用是移除字符串右侧(尾部)的指定字符。如果不指定要移除的字符,默认会移除字符串右侧的空格字符。以下是对RTRIM函数的详细...

取消回复欢迎 发表评论: