正文
.
DataFrame
([
s1
,
s2
])
|
0
|
1
|
0
|
1
|
2
|
1
|
Boris Yeltsin
|
Mikhail Gorbachev
|
我们也可以通过传递成员为列表的列表来完成同样的事情。 每个内部列表在结果 DataFrame 中被视为一行:
pd.DataFrame(
[
[1,2],
["Boris Yeltsin", "Mikhail Gorbachev"]
]
)
|
0
|
1
|
0
|
1
|
2
|
1
|
Boris Yeltsin
|
Mikhail Gorbachev
|
我们可以在创建 DataFrame 时指定列标签:
pd.DataFrame(
[
[1,2],
["Boris Yeltsin", "Mikhail Gorbachev"]
],
columns=["column1", "column2"]
)
|
column1
|
column2
|
0
|
1
|
2
|
1
|
Boris Yeltsin
|
Mikhail Gorbachev
|
同样可以指定行标签(即索引 index ):
frame = pd.DataFrame(
[
[1, 2],
["Boris Yeltsin", "Mikhail Gorbachev"]
],
index=["row1", "row2"],
columns=["column1", "column2"]
)
frame
|
column1
|
column2
|
row1
|
1
|
2
|
row2
|
Boris Yeltsin
|
Mikhail Gorbachev
|
然后,我们可以使用以下标签对DataFrame建立索引:
frame.loc["row1":"row2", "column1"]
row1 1
row2 Boris Yeltsin
Name: column1, dtype: object
如果我们将字典传递给 DataFrame 的构造函数,那么我们可以跳过指定
column
关键字参数。 这将会自动为列设置名称:
frame = pd.DataFrame(
{
"column1": [1, 2],
"column2": ["Boris Yeltsin", "Mikhail Gorbachev"]
}
)
frame
|
column1
|
column2
|
0
|
1
|
Boris Yeltsin
|
1
|
2
|
Mikhail Gorbachev
|
Pandas DataFrame 方法
正如之前我们提到的,DataFrame 的每一个列都是一个 Series 对象
type(reviews["title"])
pandas.core.series.Series
那些对 DataFrame 适用的方法大多同样也适用于 Series 对象,包括
head
:
reviews["title"].head()
0 LittleBigPlanet PS