R语言探索与分析20-北京市气温猜测分析
一、序言近年来,人类大量燃烧煤炭、天然气等含碳燃料导致温室气 体过度排放,大量温室气体剧烈吸取地面辐射中的红外线,造 成温室效应不断累积,使得地球温度上升,造成全球天气变暖。气象温度的猜测不停以来都是天气猜测的重点问题,天气 不但直接影响人们的健康、甚至影响人们的心情;此外,天气变 化还会影响一个国家的经济状况。据美国天气中心陈诉,美国 每年因为气象灾害的损失要到达 1000 亿美元。短临预报是近 年来的热门问题,其根据大气科学原理,运用统计学知识对未来 变化趋势猜测。提高短临猜测的准确率和效率,对国民经济有重要指导意义。....
二、研究近况
略
三、数据和方法说明
数据泉源为全球暖化数据集,在此中本文选取了中国主要城市天气状况表(月)该数据集,此中选择了北京市的数据环境,具体环境如下:
https://img-blog.csdnimg.cn/direct/ee3694315cfa45c0a424b5c16539288b.png
时间序列是按照统计将某一个事物的统计量发生的先后次序的值按照统计时间排列的数列。时间序列分析通过已经发生的序列数值规律,来猜测未来序列的数值环境,通常应用于连续序列的猜测问题。例如:金融领域对下一个交易日大盘点数的猜测;未来天气环境的猜测;下一个时刻某种商品的销量环境的猜测;影戏票房变化环境的猜测。
.....
四、实证分析
数据读取和展示
起首进行数据的读取和相应的展示:
library(openxlsx)
# 文件名+sheet的序号
dataset<- read.xlsx("气温预测.xlsx", sheet = 1)
#View(dataset)
dataset
summary(dataset)#####描述性统计分析 https://img-blog.csdnimg.cn/direct/c91cfbb94bfa400db36790d6189c0f6c.png
随后进行描述性统计分析
https://img-blog.csdnimg.cn/direct/354272f7d51f4de5bd82f9711167dfc9.png
接下来进行数据的可视化展示:
###相对湿度
AverageRelativeHumidity<-dataset$AverageRelativeHumidity
AverageRelativeHumidity
barplot(AverageTemperature,xlab="时间",ylab="湿度",col="blue",main="平均相对湿度",border="blue")
###Precipitation降水量
Precipitation<-dataset$Precipitation
Precipitation
barplot(Precipitation,xlab="时间",ylab="Precipitation",col="blue",main="Precipitation降水量",border="green") https://img-blog.csdnimg.cn/direct/535d79b0cd0a4a978c79fedb637a4b35.png
https://img-blog.csdnimg.cn/direct/da045bd991504ec68357bae5205695ee.png
https://img-blog.csdnimg.cn/direct/c1c89154f40440cd986b889a06907a14.png
从上面四幅图可以看出,特别是最后一图,北京市1996-2019年的气温图,气温图有着极强的周期性、季节性。随后画出北京市1996-2019年的气温时序图。
https://img-blog.csdnimg.cn/direct/88513c63810249f09181a332b8e89bd8.png
时间序列模型的创建
进行模型构建前,要对序列数据纯随机性检验。可以判定数据是否具有建模的条件,如果没有,则没有意义建模。
#白噪声检验
for(i in 1:3) print(Box.test(AT,type = "Ljung-Box",lag=6*i)) 表1 时间序列数据纯随机检验
滞后期数
卡方统计量
P值
滞后6期P值
808.94
0.000
滞后12期P值
滞后18期P值
1216.9
2387.9
0.000
0.000
随后画出自干系图和偏自干系图检察:
https://img-blog.csdnimg.cn/direct/4acf8ebe48db43028327f86985a3789c.png
https://img-blog.csdnimg.cn/direct/c0e2d4712a6d405b8284ffa9338a81a3.png
下面进行ADF检验,检察其安稳性:
https://img-blog.csdnimg.cn/direct/2651a6676eed45e1a220823a11772dd5.png
从ADF检验效果显示,该序列为安稳序列,故不需要差分。随后就进行模型主动定阶:
###自动定阶
auto.arima(AT)
###模型拟合
AT.fit<-auto.arima(AT) https://img-blog.csdnimg.cn/direct/5ef5a1da05bd4e47a9d32d070b516b4a.png
接下来进行模型比较和选择
https://img-blog.csdnimg.cn/direct/8ac77c259a6c4409b9a796b8c42b8e36.png
随后展示序列状态分布的qq图,环境如下:
https://img-blog.csdnimg.cn/direct/4dfdfd1d9f1340938e4923384d9a9c96.png
下面进行残差检验:
####残差检验
Box.test(AT.fit$residuals,type = "Ljung-Box")
#模型预测
per_AT<-forecast(AT.fit,h=12)
per_AT
plot(per_AT) 表2 残差纯随机检验
滞后期数
卡方统计量
P值
滞后1期P值
0.0078
0.9293
随后进行最后一步模型猜测:
https://img-blog.csdnimg.cn/direct/26f6e5626cfb4094a81e326c26c3ce27.png 五、结论
在本文研究中,本文选取了北京市1996-1至2019-12的数据进行研究,起首检察数据的具体环境,随后进行可视化,画出了其他变量的直方图,如气温、降水量、日照量等等,随后针对气温进行建模和分析,在建模前进行了一系列的检验,针对具有极强的季节性和周期性数据,本文终极的模型选择为ARIMA(0,0,1)(1,1,0),终极猜测了12其,即2020年全年的气温变化,直观的看,模型猜测的较好,都较好的抓取了前面数据的特征,猜测的效果也较符合客观规律。
代码加数据
代码加完整陈诉
创作不易,渴望各人多多点赞收藏和评论!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页:
[1]