ToB企服应用市场:ToB评测及商务社交产业平台

标题: GreatSQL 开源数据库 & NVIDIA InfiniBand存算分离池化方案:实现高性能分 [打印本页]

作者: 农妇山泉一亩田    时间: 2022-9-16 17:22
标题: GreatSQL 开源数据库 & NVIDIA InfiniBand存算分离池化方案:实现高性能分
NVIDIA InfiniBand是一种被广泛使用的网络互联技术,基于IBTA(InfiniBand Trade Association)而定义的高带宽、低延时、低CPU占用率、大规模易扩展的通信技术,是世界领先的超级计算机的互连首选,为高性能计算、人工智能、云计算、存储等众多数据密集型应用提供了强大的网络性能支撑。通过高速的InfiniBand技术,将业务负载由单机运行转化为基于多机协作的高性能计算集群,并使高性能集群的性能得以进一步释放与优化。
GreatSQL是由万里数据库维护的国内自主MySQL分支版本,专注于提升MGR可靠性及性能,支持InnoDB并行查询特性,适用于金融级应用。
此次通过对比测试基于InfiniBand 的 NVMe SSD池化方案 及本地NVMe SSD的传统方案的性能表现,评估使用基于InfiniBand的存算分离架构对分布式数据库性能的提升程度及扩展性。
经过双方合作,通过大量数据分析,可以看出基于InfiniBand池化方案的存算分离架构的性能更优、稳定性更强,为GreatSQL实现更高性能的分布式部署提供了有力的技术平台支撑。
1、NVIDIA InfiniBand 池化方案介绍

分布式数据库集群由两部分组成:
两部分服务器通过Quantum 平台的InfiniBand网络实现对计算节点和存储节点的无损连接,结合NVMe-oF(NVMe over Fabric)高效的数据存储传输协议,将存储节点的Lun挂载到计算节点,实现结算节点本地高性能的数据存储能力。
为了可以公平对比两种方案的优劣,两次测试均采用同一台计算服务器进行测试,不同的是,本地方案存储由本地的PCIe4.0 NVMe SSD承载,InfiniBand 池化方案由100Gbps速率的HDR100网卡接入,通过相同型号的NVMe SSD组成的全闪服务器借助NVMe-oF提供高性能虚拟Lun完成数据访问。
2.1 存储设备
本次测试主要采取两种存储方案:
  1. $ nvme list
  2. Node                  SN                   Model                                    Namespace Usage                      Format           FW Rev
  3. --------------------- -------------------- ---------------------------------------- --------- -------------------------- ---------------- --------
  4. # InfiniBand + NVMe SSD设备
  5. /dev/nvme0n1          MNC12                Mellanox BlueField NVMe SNAP Controller  1           1.10  TB /   1.10  TB    512   B +  0 B   1.0
  6. # 本机挂载的两个NVMe SSD设备
  7. /dev/nvme2n1          S5L9NE0NA00144       SAMSUNG MZWLJ7T6HALA-0007C               1           7.68  TB /   7.68  TB    512   B +  0 B   EPK99J5Q
  8. /dev/nvme3n1          S5L9NE0NA00091       SAMSUNG MZWLJ7T6HALA-0007C   
复制代码
2.2 CPU&内存
  1. $ lscpu
  2. Architecture:        x86_64
  3. CPU op-mode(s):      32-bit, 64-bit
  4. Byte Order:          Little Endian
  5. CPU(s):              128
  6. On-line CPU(s) list: 0-127
  7. Thread(s) per core:  2
  8. Core(s) per socket:  32
  9. Socket(s):           2
  10. NUMA node(s):        1
  11. Vendor ID:           AuthenticAMD
  12. BIOS Vendor ID:      Advanced Micro Devices, Inc.
  13. CPU family:          23
  14. Model:               49
  15. Model name:          AMD EPYC 7542 32-Core Processor
  16. BIOS Model name:     AMD EPYC 7542 32-Core Processor
  17. Stepping:            0
  18. CPU MHz:             3381.667
  19. CPU max MHz:         2900.0000
  20. CPU min MHz:         1500.0000
  21. BogoMIPS:            5799.52
  22. Virtualization:      AMD-V
  23. L1d cache:           32K
  24. L1i cache:           32K
  25. L2 cache:            512K
  26. L3 cache:            16384K
  27. NUMA node0 CPU(s):   0-127
  28. Flags:               fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm constant_tsc rep_good nopl nonstop_tsc cpuid extd_apicid aperfmperf pni pclmulqdq monitor ssse3 fma cx16 sse4_1 sse4_2 x2apic movbe popcnt aes xsave avx f16c rdrand lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt tce topoext perfctr_core perfctr_nb bpext perfctr_llc mwaitx cpb cat_l3 cdp_l3 hw_pstate sme ssbd mba sev ibrs ibpb stibp vmmcall fsgsbase bmi1 avx2 smep bmi2 cqm rdt_a rdseed adx smap clflushopt clwb sha_ni xsaveopt xsavec xgetbv1 xsaves cqm_llc cqm_occup_llc cqm_mbm_total cqm_mbm_local clzero irperf xsaveerptr wbnoinvd arat npt lbrv svm_lock nrip_save tsc_scale vmcb_clean flushbyasid decodeassists pausefilter pfthreshold avic v_vmsave_vmload vgif umip rdpid overflow_recov succor smca
复制代码
2.3 操作系统
  1. OS:CentOS 8
  2. 内核:Linux g4 5.4.90-1.el8.x86_64 #1 SMP Fri Mar 11 10:11:26 UTC 2022 x86_64 x86_64 x86_64 GNU/Linu
复制代码
文件系统
  1. $ mount | grep xfs
  2. LABEL=/nvme0 /nvme0    xfs     defaults,noatime,nodiratime,inode64 0 0
  3. LABEL=/nvme2 /nvme2    xfs     defaults,noatime,nodiratime,inode64 0 0
  4. LABEL=/nvme3 /nvme3    xfs     defaults,noatime,nodiratime,inode64 0 0
  5. $ df -hT
  6. /dev/nvme0n1   xfs       1.0T  247G  778G  25% /nvme0
  7. /dev/nvme2n1   xfs       7.0T  1.1T  6.0T  15% /nvme2
  8. /dev/nvme3n1   xfs       7.0T  245G  6.8T   4% /nvme3
复制代码
2.4 压测参数&指标
  1. sync_binlog = 1
  2. innodb_flush_log_at_trx_commit = 1
  3. innodb_log_buffer_size = 32M
  4. innodb_log_file_size = 2G
  5. innodb_log_files_in_group = 3
  6. innodb_doublewrite_files = 2
  7. innodb_io_capacity = 400000
  8. innodb_io_capacity_max = 800000
  9. innodb_flush_method = O_DIRECT
  10. innodb_thread_concurrency = 0
复制代码
sysbench测试命令模板:
  1. $ sysbench oltp_read_write.lua \
  2.   --tables=64 \
  3.   --table_size=12500000\
  4.   --report-interval=1 \
  5.   --threads=128 \
  6.   --rand-type=uniform \
  7.   --db-ps-mode=disable \
  8.   --mysql-ignore-errors=all \
  9.   --time=900 run
复制代码
3.性能表现&总结
3.1测试总结
结论先行,整体测试情况如下:
3.2 测试数据对比图表
1)ibp=47G


2)ibp=93G


3)ibp=140G


4)ibp=186G


4.结语
从以上测试数据中,可以明显看到采用了InfiniBand池化方案数据库性能在不同场景中性能都有不同程度的明显提升,尤其在高并发场景下,表现突出。
未来,万里数据库将联合NVIDIA在万里数据库GreatDB集中式及分布式数据库产品中,探索更多基于InfiniBand在数据库中的结合点和创新点,基于NVIDIA InfiniBand打造数据库+网络软硬一体化联合解决方案,为用户创造更多价值。
关于 GreatSQL

GreatSQL是由万里数据库维护的MySQL分支,专注于提升MGR可靠性及性能,支持InnoDB并行查询特性,是适用于金融级应用的MySQL分支版本。
GreatSQL社区        Gitee        GitHub        Bilibili

https://greatsql.cn/
技术交流群:

微信:扫码添加GreatSQL社区助手微信好友,发送验证信息加群。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4