ToB企服应用市场:ToB评测及商务社交产业平台

标题: 详解 Spark 各种运行情况的搭建 [打印本页]

作者: 锦通    时间: 2024-9-27 15:07
标题: 详解 Spark 各种运行情况的搭建
一、Local 情况

   本地模式,即不需要其他任何节点资源就可以在本地实行 Spark 代码的情况;区别于 IDEA 开发时的 local 情况
  1. 搭建


2. 操作


二、Standalone 情况

   独立部署模式,只使用 Spark 自身节点运行的集群模式,分为 master 和 workers
  1. 集群规划

SparkHadoop102Hadoop103Hadoop104master√worker√√√ 2. 搭建


3. 测试

  1. bin/spark-submit \
  2. --class org.apache.spark.examples.SparkPi \
  3. --master spark://hadoop102:7077 \
  4. ./examples/jars/spark-examples_2.12-3.0.0.jar \
  5. 10
复制代码
参数阐明示例–classSpark 程序中包含主函数的类–masterSpark 程序运行的模式(情况)local
  • 、spark://hadoop102:7077、Yarn–executor-memory 1G指定每个 executor 可用内存为 1G符合集群内存配置即可,详细情况详细分析–total-executor-cores 2指定全部 executor 使用的 cpu 核数为 2 个–executor-cores指定每个 executor 使用的 cpu 核数application-jar打包好的应用 jar,包含依赖。这个 URL 在集群中全局可见。 比如 hdfs://共享存储体系,假如是 file://path ,那么全部的节点的 path 都包含同样的 jarapplication-arguments传给 main()方法的参数 4. 配置历史服务


    5. 配置高可用

    5.1 集群规划

    规划Hadoop102Hadoop103Hadoop104master√√worker√√√zookeeper√√√ 5.2 搭建


    三、Yarn 模式

       由于 Spark 重要是计算框架,而不是资源调理框架,所以本身提供的资源调理并不是它的刚强,因此在生产上多集成 Yarn 使用
      1. 搭建


    2. 测试


    3. 配置历史服务


    四、其他模式简介


    六、各模式对比

    模式Spark安装机器数需启动的进程所属者应用场景Local1无Spark测试Standalone3Master及WorkerSpark单独部署Yarn1Yarn及HDFSHadoop混淆部署 七、常用端口号阐明

    服务端口Spark 检察当前 Spark-shell 运行任务情况端口号(计算)4040Spark Master 内部通讯服务7077Standalone 模式下,Spark Master Web 端口号(资源)8080Spark 历史服务器18080Hadoop YARN 任务运行情况检察8088
    免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




    欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4