若要实现将Excel文件导入到Python中,也就是在Python中读取Excel文件,这需要借助于
第三方模块
。今天笔者跟大家分享的是
xlrd
和
openpyx
l模块。
在介绍两个模块前,笔者先来问大家一个常识问题:Excel的后缀.xls与.xlsx有什么区别?(此处没有答案,有需要找度娘)在了解了
.xls
与
.xlsx
的区别后,让我们继续往下看吧。
1.xlrd
xlrd
模块下的
open_workbook (filename)
函数可以实现Excel文件的读取,其中Excel文件的版本包括
.xls
和.
xlsx。
在进行文件读取之前,首先需要在Python中安装
xlrd
模块,命令如下:
pip install xlrd
安装完成后,接着在Python中导入
xlrd
模块:
import xlrd
之后我们就可以读取Excel文件了。通过下图我们可以看到这份包含287家医药生物行业上市公司信息的Excel文件的后缀是.xlsx。
现在开始读取这份文件,命令如下:
workbook = xlrd.open_workbook('F:\爬虫俱乐部\爬虫俱乐部微信运营\推文\推文9\SW医药生物.xlsx')
通过控制台界面我们可以看到文件读取正常。我们将文件的后缀名改为
.xls
后文件的读取依然正常。
2. openpyxl
openpyxl
模块的功能较多,可实现Excel文件的读取和编写,但不能处理.xls文件。
openpyxl
模块下的
load_work book(filename)
函数可以实现文件的读取。同样,首先我们需要安装
openpyxl
模块,然后在Python中导入模块,接着读取文件。最后的控制台显示读取文件结果正常。
pip install openpyxl(命令提示符环境下)
import openpyxl
workbook = openpyxl.load_workbook('F:\爬虫俱乐部\爬虫俱乐部微信运营\推文\推文9\SW医药生物.xlsx')