论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
ToB企服应用市场:ToB评测及商务社交产业平台
»
论坛
›
大数据
›
数据仓库与分析
›
Apache Spark 与 AWS DynamoDB 的完美结合——Spark-Dyn ...
Apache Spark 与 AWS DynamoDB 的完美结合——Spark-Dynamodb开源项目推荐 ...
南七星之家
金牌会员
|
2024-12-2 07:40:52
|
显示全部楼层
|
阅读模式
楼主
主题
827
|
帖子
827
|
积分
2483
Apache Spark 与 AWS DynamoDB 的完美结合——Spark-Dynamodb开源项目推荐
spark-dynamodb Plug-and-play implementation of an Apache Spark custom data source for AWS DynamoDB.
项目地址: https://gitcode.com/gh_mirrors/sp/spark-dynamodb
Apache Spark 是一款强大的分布式数据处置惩罚工具,而 AWS DynamoDB 则是亚马逊提供的快速、可扩展的 NoSQL 数据库服务。两者的结合为大数据处置惩罚和实时分析带来了无穷可能。本文将为您先容一个开源项目——Spark-Dynamodb,该项目以Scala语言为主,实现了Apache Spark与DynamoDB的无缝对接。
项目基础先容和紧张编程语言
Spark-Dynamodb 是由 AudienceProject 开发的一个开源项目,旨在为 Apache Spark 提供一个定制的数据源,使得用户可以方便地从 AWS DynamoDB 读取和写入数据。该项目紧张使用 Scala 语言举行开发,同时也涉及到了 Java 语言的代码。
项目焦点功能
Spark-Dynamodb 的焦点功能紧张包罗:
分布式并行扫描:通过懒加载评估,实现高效的分布式扫描。
吞吐量控制:通过限定目标表的读写比例,实现对 DynamoDB 表的吞吐量控制。
Schema 发现:支持动态推断和静态分析,满足不同场景下的需求。
列和过滤下推:通过将过滤条件推送到 DynamoDB,减少不必要的数据传输。
全局二级索引支持:支持使用全局二级索引举行数据查询。
写入支持:支持将数据写入到 DynamoDB。
项目最近更新的功能
最近更新的功能紧张包罗:
增加了 inferSchema=false 选项,用于在写入具有大量列的表时关闭主动推断 schema 的功能。
发布了版本 1.1.0,支持 Spark 3.0.0 和 Scala 2.12,未来版本将不再兼容 Scala 2.11 和 Spark 2.x。
增加了对通过自定义 STS 端点假定 AWS 脚色的支持。
增加了删除记录的选项。
修复了一些已知的 issues。
通过这些更新,Spark-Dynamodb 进一步提拔了与 Apache Spark 和 AWS DynamoDB 的兼容性,为用户带来了更加便捷的使用体验。如果您正在探求一个可以或许高效处置惩罚 DynamoDB 数据的 Spark 数据源,那么 Spark-Dynamodb 将是一个不错的选择。
spark-dynamodb Plug-and-play implementation of an Apache Spark custom data source for AWS DynamoDB.
项目地址: https://gitcode.com/gh_mirrors/sp/spark-dynamodb
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
南七星之家
金牌会员
这个人很懒什么都没写!
楼主热帖
详讲Java开发中的六个常用API(Math,S ...
鸿蒙到底是不是安卓?
BOS EDI 项目 Excel 方案开源介绍 ...
【K8S】K8S入门基础知识
MySQL并行复制(MTS)原理(完整版) ...
软件项目管理 3.5.敏捷生存期模型 ...
译:SQLServer 事务复制延迟诊断 ...
保姆级教程!玩转 ChunJun 详细指南 ...
java中Collections.addAll方法具有什么 ...
ArrayList分析2 :Itr、ListIterator以 ...
标签云
挺好的
服务器
快速回复
返回顶部
返回列表