2021华为杯数学建模B题思路-空气质量预报二次建模(15日更新)
Posted 您好啊数模君
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2021华为杯数学建模B题思路-空气质量预报二次建模(15日更新)相关的知识,希望对你有一定的参考价值。
2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模 2021华为杯数学建模B题思路 2021华为杯B题思路 空气质量预报二次建模
允许售卖,鼓励改进后再售卖,欢迎各位同行私信交流,有公众号或博客的,加群给管理
链接:https://pan.baidu.com/s/15SzJ-HIQiSDmME9J8Zln9g
提取码:6epk
第一问,按照附录的实例计算AQI,第一问要用到的是附件1中“监测点A逐日污染物浓度实测数据”,BPHi、BPLo、IAQIHi、IAQILo这四个参数不用纠结,直接用案例中的就行,这是一Hi和Lo两个元素的参数值做参考计算的,而Cp才是变量,指的是p物质的浓度值,计算的时候注意单位,Cp应当化为μg/m³进行计算,AQI最终的值取所有污染物的AQImax,首要污染物也就是AQImax最大的p物质
做第二问前,先检查下数据,附件1中小表2和小表3,小表3是取小表2同日检测值的均值,小表1中的数据也有些可用数据,很多人都说异常值直接删了,其实不是,实际操作上应当是能补的数据尽量补,补不了的在选用数据做研究的时候直接从最后一个不能补的时间位置开始取数,前面的都不用纳入研究,不知道大家有没有发现,小表2中的风速和风向没有可靠数据进行补充,发现最后一个缺失数据在2020-11-21时间点上,那么在这之前的数据都可以不用纳入研究,仅取这个时间点之后的数据用于分析
先说说指标的异常值,浓度一般为正,对于异常的数据,可以取有效数据通过推荐系统系列方法去重新填写,例如协同过滤推荐算法
接下来说如何对缺失值进行处理,下面只是举例,小表2中这里有部分缺失值
对于浓度数据,补充方式首选用小表3中的数据进行补充,补充方法:对小表2中缺失值用matlab中的fillmissing函数填充,函数得出的补充值还需进一步调整,如果补充后的当天24个数据的平均值与小表3中对应的数据相差小,那么就可以不再做处理,如果相差较大,那么就按等比例变动,使得当天24个数据尽可能的靠近小表3中的数据。对于小表2中缺失的气象数据同样的处理方式,对于小表2中温度、适度、气压可以用小表1中地表温度、湿度、大气压来补充(注意单位,这里取小表1中的数据,一个模型运行日期有三组预报数据,取第一组数据)
这道题还需要注意的就是单位,浓度有的是毫克有的是微克,做完题也一定再检查下
第三问,基本上第二问说了大部分的思想,以附件1中监测点A为例,我们先来看可以用到哪些指标,再来说降维,“监测点A逐小时污染物浓度与气象一次预报数据”这个表,第二列插入一列(看本段后示例图),第一种构建数据集的做法:针对每个运行日期,例如以2020-7-23为例,复制三组当天的周期时间;第二种: 以三天为间隔周期设定时间。接下来按B列的时间将“监测点A逐小时污染物浓度与气象实测数据”中的数据对应过来,接下来将原本所属“监测点A逐小时污染物浓度与气象一次预报数据”中的指标和“监测点A逐小时污染物浓度与气象实测数据”的气象指标作为输入,“监测点A逐小时污染物浓度与气象实测数据”中的污染物浓度作为输出。第二个表的数据匹配过来后,第一个表中未匹配到的就不用考虑了。接下来的做法是将SO2监测浓度、NO2监测浓度、PM10监测浓度、PM2.5监测浓度、O3监测浓度、CO监测浓度视为六个模型,然后可以用一些相关性的方法(灰色关联、皮尔逊、秩相关、肯德尔、余弦、典型相关分析、Elasticsearch相关性...)分别找出相关性Top前k个指标构建指标体系,然后可通过两种方式构建预测模型,第一种预测模型可以是神经网络(深度学习)、决策树系列(Xgboost)、其他机器学习算法等拿不到关系式的算法模型,也可以是回归系列能求出关系式的模型,第一种做法不用多说,算法内置函数本身就是非线性,最后绘制一些误差、性能检验图即可,第二种回归的非线性做法简单讲下,虽然我们看回归算法都是线性拟合的,但是可以添加非线性变量,例如x=[X(:,1:15),X(:,1:15).^2,X(:,1:15).^3,X(:,1:15).^4,X(:,1:15).^5,exp(X(:,1:15))];构建一个非线性自变量集,然后直接带入算法求参数。由此可以得出2021-7-13 8:00到2021-7-15 23:00各污染物浓度数据,“监测点A逐日污染物浓度实测数据”表中的数据其实是当天0:00到23:00数据的平均值,只不过四舍五入了下,得到每天的各污染物浓度后,按第一问计算方式计算得到AQI。最后按污染物浓度及AQI预测结果表样例整理出结果放论文中。
或
第四问,如果说单独对A、A1、A2、A3分析,方法同第三问,但是本问要考虑隔壁监测点的环境,相当于本问的数据集中可选的指标不仅有自家的,还有隔壁老王的。其实也同样可以按第三问做法来做,唯一的区别就是第三问中构建6种污染物浓度指标体系的时候合并其他三个检测点的数据集,同样用相关性方法选取,第四问可能就是4*6个指标体系了。
以上是关于2021华为杯数学建模B题思路-空气质量预报二次建模(15日更新)的主要内容,如果未能解决你的问题,请参考以下文章
2021 数学建模“华为杯”B题:空气质量预报二次建模 2 方案设计附实现代码
2021 数学建模国赛B题:空气质量预报二次建模 1 赛后总结与分析
2021 数学建模国赛B题:空气质量预报二次建模 1 赛后总结与分析