IT评测·应用市场-qidao123.com
标题:
【numpy基础】--数组排序
[打印本页]
作者:
农妇山泉一亩田
时间:
2023-7-3 12:23
标题:
【numpy基础】--数组排序
numpy 数组通常是用于数值计算的多维数组,而排序功能可以快速、准确地对数据进行排序,从而得到更加清晰、易于分析的结果。
在数据分析和处理过程中,常常需要对数据进行排序,以便更好地理解和发现其中的规律和趋势。
排序会应用在很多场景中,比如:
数据分类:将数据按照一定的特征进行分类,可以通过 numpy 数组排序来实现。
数据筛选:通过 numpy 数组排序,可以快速地筛选出符合特定条件的数据。
数据合并:多个 numpy 数组可以通过 numpy 数组排序来进行合并,从而得到一个更加完整、准确的数据集。
1. 排序算法
1.1. sort 函数
numpy中常用排序算法都是封装好的,通过 sort函数,可以直接使用常用的排序算法。
import numpy as np
arr = np.random.randint(0, 100, 10)
print(arr)
#运行结果
[44 11 36 0 83 90 54 40 36 34]
arr.sort(kind='quicksort')
print(arr)
#运行结果
[ 0 11 34 36 36 40 44 54 83 90]
arr.sort(kind='mergesort')
print(arr)
#运行结果
[ 0 11 34 36 36 40 44 54 83 90]
arr.sort(kind='heapsort')
print(arr)
#运行结果
[ 0 11 34 36 36 40 44 54 83 90]
arr.sort(kind='stable')
print(arr)
#运行结果
[ 0 11 34 36 36 40 44 54 83 90]
复制代码
四种排序算法分别是:
quicksort:快速排序
mergesort:归并排序
heapsort:堆排序
stable:冒泡排序
上述排序的结果都一样,quicksort 是默认的排序算法,也是效率最高的算法。
1.2. argsort 函数
除了 sort 函数,还有一个比较常用的是 argsort,它返回的是排序之后的索引。
arr = np.random.randint(0, 100, 10)
print(arr)
#运行结果
[71 59 96 30 71 24 22 60 99 94]
print(arr.argsort())
#运行结果
[6 5 3 1 7 0 4 9 2 8]
复制代码
argsort 的结果是排序之后的原数组的下标。
比如第一个值 6 表示的是 arr[6],也就是 22。
2. 行列排序
当数组是多维的时候,可以按照每个维度来排序。
比如二维数组:
arr = np.random.randint(0, 100, (3, 3))
print(arr)
#运行结果
[[14 18 6]
[80 85 14]
[95 24 82]]
arr.sort(axis=0)
print(arr)
#运行结果
[[14 18 6]
[80 24 14]
[95 85 82]]
复制代码
axis=0 是
跨行
的意思,也就是按列对数据进行排序。
arr = np.random.randint(0, 100, (3, 3))
print(arr)
#运行结果
[[ 2 22 17]
[85 6 20]
[98 97 39]]
arr.sort(axis=1)
print(arr)
#运行结果
[[ 2 17 22]
[ 6 20 85]
[39 97 98]]
复制代码
axis=1 是
跨列
的意思,也就是按行对数据进行排序。
注意
:这种排序的方式会破坏原有元素之间的行列关系。
3. 部分排序
nunpy的数组还支持部分排序,也就是只针对数组的特定部分排序,不用对整个数组排序。
arr = np.random.randint(0, 100, 10)
print(arr)
#运行结果
[13 94 71 6 47 81 99 12 49 20]
arr.partition(3)
print(arr)
#运行结果
[ 6 13 12 20 94 81 99 71 49 47]
复制代码
partition(3)表示的把
最小的三个数
字放在数组前三个,后面的元素就是原先剩下的元素,顺序不管。
放在最前面的三个数是所有元素中
最小的三个数
,它们的顺序也是不保证的。
多维数组也可以部分排序:
arr = np.random.randint(0, 100, (5, 5))
print(arr)
#运行结果
[[11 8 84 34 99]
[24 18 69 79 41]
[ 2 25 91 91 64]
[64 8 48 86 49]
[68 62 51 22 85]]
arr.partition(3, axis=0)
print(arr)
#运行结果
[[ 2 8 48 22 49]
[11 8 51 34 64]
[24 18 69 79 41]
[64 25 84 86 85]
[68 62 91 91 99]]
复制代码
partition之后,数组的前三行元素就是每列最小的三个数。
arr = np.random.randint(0, 100, (5, 5))
print(arr)
#运行结果
[[76 79 72 91 98]
[13 58 53 76 63]
[57 98 16 81 39]
[48 43 63 98 77]
[33 71 54 74 68]]
arr.partition(3, axis=1)
print(arr)
#运行结果
[[72 76 79 91 98]
[13 53 58 63 76]
[16 39 57 81 98]
[43 48 63 77 98]
[33 54 68 71 74]]
复制代码
partition之后,数组的前三列元素就是每行最小的三个数。
4. 总结回顾
numpy 数组排序提供了一种快速、灵活、可靠的排序方式,可以满足各种排序需求。
numpy的排序针对数组做了更多的优化,排序效率比python内置的排序算法更高。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
欢迎光临 IT评测·应用市场-qidao123.com (https://dis.qidao123.com/)
Powered by Discuz! X3.4