天天热门:PySpark的交互式命令行如何操作？如何提交任务？

2023-01-20 19:51:07 来源：哔哩哔哩

01 PySpark下载及安装

首先PySpark需要从PyPi上面安装，如下URL：https://pypi.org/project/pyspark/#files

若安装PySpark需要首先具备Python环境，这里使用Anaconda环境，安装过程可直接参考部署文档即可 <<spark部署文档.doc>> 中关于PySpark的安装操作。

up同名公众号内回复【spark部署】获取资料。

(相关资料图)

PySpark视频安装教程

补充-conda命令

conda虚拟环境命令

查看所有环境

conda info --envs

新建虚拟环境

conda create -n myenv python=3.6

删除虚拟环境

conda remove -n myenv --all

激活虚拟环境

conda activate myenv

source activate base

退出虚拟环境

conda deactivate myenv

02 测试PySpark案例-圆周率

Spark框架自带的案例Example中涵盖圆周率PI计算程序，可以使用【$SPARK_HOME/bin/spark-submit】提交应用执行，运行在本地模式。

· 自带案例pi脚本：【/export/server/spark/examples/src/main/python/pi.py】

· 提交运行PI程序

SPARK_HOME=/export/server/spark

${SPARK_HOME}/bin/spark-submit \

--master local[2] \

${SPARK_HOME}/examples/src/main/python/pi.py \

03 参数解释

（1）基本语法

（2）参数说明：

--master 指定Master的地址，默认为Local

--class: 你的应用的启动类 (如 org.apache.spark.examples.SparkPi)

--deploy-mode: 是否发布你的驱动到worker节点(cluster) 或者作为一个本地客户端 (client) (default: client)

--conf: 任意的Spark配置属性，格式key=value. 如果值包含空格，可以加引号“key=value”

application-jar: 打包好的应用jar,包含依赖. 这个URL在集群中全局可见。比如hdfs:// 共享存储系统，如果是 file:// path，那么所有的节点的path都包含同样的jar

application-arguments: 传给main()方法的参数

--executor-memory 1G 指定每个executor可用内存为1G

--total-executor-cores 2 指定每个executor使用的cup核数为2个

关键词： SPARK WORKER 安装教程 ANACONDA python CLient CLASS MAIN MASTER 应用程序 HTTPS

为您推荐

商务部：上周食用农产品价格上涨4.3% 猪肉批发价涨9.7%
资讯2021-10-27
商务部：上周生产资料价格上涨5% 煤炭继续领涨
资讯2021-10-27
美术作品中的党史 | 第61集《1978年11月24日·小岗》
资讯2021-10-27
31省份累计报告接种新冠病毒疫苗224868.8万剂次
资讯2021-10-27
草原都市呼和浩特战疫记：民众做好防控，生活未受冲击
资讯2021-10-27
恭城：做大做强地理标志产品，“农旅融合”助推乡村振兴
资讯2021-10-27
安徽：5年来追回外逃人员183人
资讯2021-10-27
第十三届中国舞蹈“荷花奖”民族民间舞评奖活动开幕
资讯2021-10-27
甘肃兰州统一安排中小学线上教学各学校“停课不停学”
资讯2021-10-27
内蒙古包头发生多车连撞事故已致5死11伤
资讯2021-10-27
商务部：上周猪肉消费明显回升零售价格止跌上扬
资讯2021-10-27
全方位提高供给质量推动食品产业高质量发展
资讯2021-10-27
坚持“六大保障” 构建超大城市食品安全社会共治新格局
资讯2021-10-27
17部门联合发文推进国家文化出口基地提质扩容增效
资讯2021-10-27
俄卡马河畔切尔尼市一住宅楼天然气爆炸 5人伤亡
资讯2021-10-27
国家中小企业发展基金与全国股转公司、北交所签署战略合作协议
资讯2021-10-27
网易云课堂引进亚马逊AWS近百门IT类课程向社会免费开放
资讯2021-10-27
冰雪之约中国之邀｜北京冬奥会倒计时100天，我们准备好了！
粮食2021-10-27
第38届和第39届东盟峰会在文莱开幕
粮食2021-10-27
高德车道级导航正式发布覆盖全国超120个城市高速和快速路
粮食2021-10-27

天天热门:PySpark的交互式命令行如何操作？如何提交任务？

01 PySpark下载及安装

02 测试PySpark案例-圆周率

03 参数解释

为您推荐

商务部：上周食用农产品价格上涨4.3% 猪肉批发价涨9.7%

商务部：上周生产资料价格上涨5% 煤炭继续领涨

美术作品中的党史 | 第61集《1978年11月24日·小岗》

31省份累计报告接种新冠病毒疫苗224868.8万剂次

草原都市呼和浩特战疫记：民众做好防控，生活未受冲击

恭城：做大做强地理标志产品，“农旅融合”助推乡村振兴

安徽：5年来追回外逃人员183人

第十三届中国舞蹈“荷花奖”民族民间舞评奖活动开幕

甘肃兰州统一安排中小学线上教学各学校“停课不停学”

内蒙古包头发生多车连撞事故已致5死11伤

商务部：上周猪肉消费明显回升零售价格止跌上扬

全方位提高供给质量推动食品产业高质量发展

坚持“六大保障” 构建超大城市食品安全社会共治新格局

17部门联合发文推进国家文化出口基地提质扩容增效

俄卡马河畔切尔尼市一住宅楼天然气爆炸 5人伤亡

国家中小企业发展基金与全国股转公司、北交所签署战略合作协议

网易云课堂引进亚马逊AWS近百门IT类课程向社会免费开放

冰雪之约中国之邀｜北京冬奥会倒计时100天，我们准备好了！

第38届和第39届东盟峰会在文莱开幕

高德车道级导航正式发布覆盖全国超120个城市高速和快速路

果品

蔬菜