OraclePython-数据分析（Pandas二：一维数组Series，Series的创建，Series的属

海哥发表于 2025-3-17 09:24:06

Python----数据分析（Pandas二：一维数组Series，Series的创建，Series的属

一、一维数组Series

   Series：一维数组,与Numpy中的一维array类似。它是一种类似于一维数组的对象，是由一组数据(各种 NumPy 数据范例)以及一组与之相干的数据标签(即索引)组成。
        仅由一组数据也可产生简单的 Series 对象，用值列表生成 Series 时，Pandas 默认主动生成整数索引。
https://i-blog.csdnimg.cn/direct/1d320b359ada4c9cb97591301bac1b65.png
二、Series的创建

  在Pandas中，一维数组的创建离不开Pandas库中的Series类。
pandas.Series(data=None, index=None, dtype=None, name=None, copy=None, fastpath=False) 描述说明data 标量值，如整数或字符串
Python列表或元组
Python字典
1d-Ndarray
index数组或列表，用于定义Series的索引。如果未提供，则默认为从0开始的整数索引。dtype指定Series的数据范例。name给Series一个名字，用于后续的索引和操作。copy布尔值，默认为False。如果为True，则复制数据；如果为False，则尽可能避免复制数据，仅影响Ndarray输入。fastpath布尔值，默认为False，通常不须要用户指定。它是Pandas库内部使用的一个优化标志，当设置为 True时，答应 Series构造函数绕过一些查抄和验证步调，加快Series的创建速度。但由于这个参数跳过了某些安全查抄，因此在正常使用中，如果在创建Series时设置了 fastpath=True，而传入的数据又不符合预期，则大概会导致不可预测的行为或错误。 2.1、使用标量创建

import pandas as pd
data=0
series=pd.Series(data,index=['a','b','c'])
print(series) a 0
b 0
c 0
dtype: int64 2.2、使用列表或元组创建

import pandas as pd
data1=
data2=(1,2,3,4,5)
series1=pd.Series(data1,index=['a','b','c','d','e'])
series2=pd.Series(data2,index=['a','b','c','d','e'])
print(series1,series2) a 1
b 2
c 3
d 4
e 5
dtype: int64 a 1
b 2
c 3
d 4
e 5
dtype: int64 2.3、使用字典

        使用字典创建Series时，字典的键就是索引，字典的值就是该索引对应的值。如果使用字典创建Series，并且指定了与字典的键不同的index参数，那么生成的Series数组中的数据就是以index参数的值为索引，但索引所对应的值是NaN。
        在Pandas中， NaN（Not a Number）是一个特殊的浮点数，用于表现缺失数据或无效数据。NaN 是 IEEE 浮点标准的一部分，Pandas 使用 NaN 来表现数据集中缺失或未定义的值。
import pandas as pd
data={
'a':1,
'b':2,
'c':3
}
series=pd.Series(data)
print(series) a 1
b 2
c 3
dtype: int64 2.4、使用数组

import pandas as pd
import numpy as np
data=np.array(

)
series=pd.Series(data)
print(series) 0 1
1 2
2 3
3 4
4 5
dtype: int64 三、Series的属性

3.1、index

        返回Series中的索引。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.index)
series.index=['e','f','g']
print(series.index) Index(['a', 'b', 'c'], dtype='object')
Index(['e', 'f', 'g'], dtype='object') 3.2、values

        用于返回Series中的数据，返回的数据将以Ndarray数组的形式存在。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.values)
print(type(series.values))
<class 'numpy.ndarray'> 3.3、name

        用于返回Series的名称，如果创建时指定了name参数，那么该属性的返回值就是 name参数，如果没有指定则为None。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.name)
series.name='test'
print(series.name) None
test 3.4、dtype和dtypes

        对于Series来说，dtype和dtypes的作用是一样的，都是用来返回Series对象的数据范例。需
        要留意的是：
                        该属性是只读属性，不可以通过直接赋值的方式去修改数据范例。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.dtype) int64 3.5、shape

        用于描述Series的形状。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.shape) (3,) 3.6、 size

         用于返回Series的元素数量，该返回值是一个整数。
import pandas as pd
series=pd.Series(,index=['a','b','c'])
print(series.size) 3 3.7、empty

        用来表现Series数组是否为空，返回值一个布尔值，如果数组里一个元素都没有就返回True，否则返回False。
import pandas as pd
series=pd.Series()
print(series.empty) True 3.8、hasnans

        用于返回数组中是否包含NaN值，如果数组中存在NaN，那么返回True，否则返回 False。
import pandas as pd
import numpy as np
series=pd.Series(,index=['a','b','c'])
print(series.hasnans) True 3.9、is_unique

        用于返回数组中的元素是否为独一无二的，如果全部的元素都是独一无二的，即数组中没有重复元素，那么就返回True，否则返回False。
import pandas as pd
import numpy as np
series=pd.Series(['a','b','c'])
print(series.is_unique) True 3.10、nbytes

        用于返回该Series对象中全部数据占用的总字节数。
import pandas as pd
series=pd.Series(,dtype='int64')
print(series.nbytes) 8 3.11、axes

        用于返回series对象行轴标签的列表。
import pandas as pd
series = pd.Series(, index=['a', 'b', 'c', 'd', 'e'], dtype='int64')
print(series.axes) , dtype='object')] 3.12、ndim

        返回Series数组的维度，对于Series数组来说，它的维度始终为1。
import pandas as pd
series = pd.Series(, index=['a', 'b', 'c', 'd', 'e'], dtype='int64')
print(series.ndim) 1 3.13、array

        用于返回Series的底层数组，包罗数组的元素、数组的长度及数组元素的数据范例。
import pandas as pd
import numpy as np
data = np.array()
series = pd.Series(data)
print(series.array)
print(type(series.array)) <NumpyExtensionArray>

Length: 5, dtype: int64
<class 'pandas.core.arrays.numpy_.NumpyExtensionArray'> 3.14、attrs

        返回series的自定义属性，可以用来存储额外的说明性数据。
import pandas as pd
import numpy as np
data = np.array()
print(series.attrs)
series.attrs = {'source': 'file1', 'time': '19:27:27'}
print(series)
print('额外属性', series.attrs) {}0 1
1 2
2 3
3 4
4 5
dtype: int64额外属性 {'source': 'file1', 'time': '19:27:27'} 3.15、is_monotonic_decreasing

        返回一个布尔值，表现Series是否按降序排列。
import pandas as pd
series = pd.Series()
print(series.is_monotonic_decreasing) True 3.16、is_monotonic_increasing

        返回一个布尔值，表现Series是否按升序排列。
import pandas as pd
series = pd.Series()
print(series.is_monotonic_increasing) False 四、 Series中元素的索引与访问

4.1、位置索引

        可以使用整数索引来访问Series中的元素，就像访问列表一样。
import pandas as pd
series=pd.Series()

print(series)
print(series) 10
20 4.2、标签索引

        除了使用位置索引之外，还可以使用标签进行索引，与访问字典中的元素类似。
import pandas as pd
series=pd.Series(,index=['a','b','c','d','e'])
print(series['a'])
print(series['c']) 10
30 4.3、切片索引

        Series对象的切片方式有两种，第一种是使用位置切片，其使用方法与列表的切片类似；第二种是使用标签切片，其语法与位置切片类似，都是 start:stop，且开始值与停止值可以省略，但与位置切片不同的是，标签切片的范围是左右都闭合，即既包含start，又包含stop，而位置切片是左闭右开，只包含start，不包含stop。
import pandas as pd
series=pd.Series(,index=['a','b','c','d','e'])
print(series[:])
print(series['b':'d']) a 10
b 20
c 30
d 40
e 50
dtype: int64
b 20
c 30
d 40
dtype: int64 4.4、loc与iloc

        loc与iloc也是Series对象的属性，它们的作用就是用来访问Series中的元素，loc是基于标签的索引，iloc是基于位置的索引。
import pandas as pd
series = pd.Series(, index=['a', 'b', 'c', 'd', 'e'])
print(series.loc['a'])
print(series.iloc)
print(series.iloc) 10
a 10
b 20
dtype: int64
30 4.5、at与iat

        at与iat也是Series对象的属性，可以用来访问元素，at是基于标签的索引，iat是基于位置的索引。
import pandas as pd
series = pd.Series(, index=['a', 'b', 'c', 'd', 'e'])
print(series.at['a'])
print(series.iat)
print(series.iat) 1010
30 4.6、head

        head是Series对象的方法，用于快速检察 Series数据的开头部分内容。
series.head(n=None) 描述说明n是可选参数，用于指定要返回的行数。如果不提供该参数，默认值为5。 import pandas as pd
data =
index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
series = pd.Series(data, index=index)
print(series.head()) a 10
b 20
c 30
d 40
e 50
dtype: int64 4.7、tail

        tail的用法与head类似，但不同的是，它用于快速检察Series数据的末尾部分内容。
series.tail(n=None) 描述说明n是可选参数，用于指定要返回的行数。若不提供该参数，默认值为5。 import pandas as pd
data =
index = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
series = pd.Series(data, index=index)
print(series.tail()) f 60
g 70
h 80
i 90
j 100
dtype: int64 4.8、isin

        该函数用于判断 Series中的每个元素是否在指定的一组值中，它会返回一个与原 Series长度雷同的布尔型Series，此中对应位置为True表现该位置的元素在指定的值集合中，False则表现不在。
series.isin(values) 描述说明values是一个可迭代对象（如列表、元组、集合等），用于指定要进行判断的一组值。 import pandas as pd
data =
series = pd.Series(data)
values_to_check =
result = series.isin(values_to_check)
print(result) 0 False
1 True
2 False
3 True
4 False
dtype: bool 4.9、get

        Series.get 方法用于通过标签来获取Series中的元素。
Series.get(key, default=None) 描述说明key你想要获取的元素的标签。default可选参数，如果 key不在标签中，返回这个默认值。如果没有指定，默认为 None。 import pandas as pd
s = pd.Series(['apple', 'banana', 'cherry'], index=)
print(s.get(2))
print(s.get(4, 'Not Found')) banana
Not Found 五、思维导图

https://i-blog.csdnimg.cn/direct/f60746f2aca340d5926bbd887443afe7.png

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

页: [1]

IT评测·应用市场-qidao123.com技术社区's Archiver

Python----数据分析（Pandas二：一维数组Series，Series的创建，Series的属