Python支持DataFrame API是因为DataFrame API是基于Python#Pandas库构建,而Pandas库提供强盛易用的数据分析工具集。因此,Spark提供对Pandas DataFrame对象的支持,使Python利用DataFrame API非常方便。Python的Pandas也提供强类型保证,使Spark可在保持动态特性同时提供类型查抄和类型推断。因此,虽Python不支持Spark的Dataset API,但它支持Spark的DataFrame API,这为Python用户提供一种方便的数据处置惩罚方式。2 案例
作者简介:魔都技能专家兼架构,多家大厂后端一线研发履历,各大技能社区头部专家博主。具有丰富的引领团队履历,深厚业务架构和解决方案的积累。参考:
负责:
现在主攻降低软件复杂性计划、构建高可用体系方向。
- 中央/分销预订体系性能优化
- 运动&优惠券等营销中台建设
- 交易平台及数据中台等架构和开发计划
- 车联网核心平台-物联网连接平台、大数据平台架构计划及优化
本文由博客一文多发平台 OpenWrite 发布!
欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |