神经网络模型预测美国四州能源结构-2018MCM美国大学生数模竞赛

Posted 笑驰千里

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了神经网络模型预测美国四州能源结构-2018MCM美国大学生数模竞赛相关的知识,希望对你有一定的参考价值。

美国大学生数学建模竞赛介绍

(MCM/ICM)是一项国际级的竞赛项目,为现今各类数学建模竞赛之鼻祖。MCM/ICM 分别为“数学建模竞赛”和“交叉学科建模竞赛”。MCM 始于 1985年,由美国数学及其应用联合会(COMAP)主办。MCM/ICM 着重强调研究问题、解决方案的原创性、团队合作、交流以及结果的合理性。竞赛以三人(本科生)为一组,在四天时间内,就指定的问题完成从建立模型、求解、验证到论文撰写的全部工作。竞赛每年都吸引大量著名高校参赛。在最近几年,MCM/ICM 每年都有超过 2000 个队伍参加,遍及五大洲。竞赛共设置四个奖项。本篇论文曾获二等奖。

数学建模(Mathematical modeling)

是利用数学方法解决实际问题的一种实践。即通过归纳,抽象,简化,假设等处理后,将实际问题用数学语言表达,建立数学模型,最后运用先进的数学方法和计算机技术进行求解的过程。建模的一般步骤如下:

•模型准备

以实际问题的背景为出发点,一切以解决实际问题为终极目的,有条件可以收集必要的实验资料和数据,明确研究对象的数量特征(如离散型或连续性变量),由此初步确定选择某一类模型。

•模型假设

根据研究对象的特征和建模目的,对问题进行必要,合理的简化。假设需要敏锐的科学直觉,即化繁为简,去伪存真的科学能力。

•模型构成

根据研究变量的因果关系和内在联系,利用合适的数学工具,构建各个因子或变量之间的函数关系或其他数学结构。

•模型求解

包括解方程(解析解),画图形(数值解),逻辑推理,包括数学软件在内计算机技术的运用。

•模型分析

对模型解答在数学上的分析。

•模型检验

将数学模型的结果翻译到实际问题,通过仿真模拟或做实验的结果进行比较,以及带入多组初始条件对模型结果的分析,检验模型的合理性,实用性及敏感度。

•模型应用

通过模型来为实践工作做指导,制定切实可行的执行计划。

数学建模与生物学

一个学科只有真正运用到数学时,才能达到成熟的地步。传统生物学中运用数学最成熟的当属生态学,生态学中环境因子或生物因子的广布性、均一性好,故易于量化,例如从人口学借鉴而来的种群逻辑斯蒂增长曲线。从如今生物学进入“后基因组”时代,技术的成熟大大颠覆了传统生物学,面对海量的生物学数据,需要运用数学和计算机工具进行解析。当然一切数学运用到现实中都是不精确的,数学建模的意义就是把精确的抽象的数学理论运用到现实中,因此,吸收借鉴其他学科的知识有利于本学科的发展。例如2016年“深圳杯”数学建模挑战赛 D 题题目为代谢综合长征风险、趋势预测和干预模型的构建,此题完全属于生命科学领域。通过分析给出的临床测试数据,基因组数据,表观基因组数据,转录组蛋白组及代谢组数据,结合 NCBI,DDBJ 等基因通路信息,构建生命量化的动态模型。


Problem C: 能源生产

背景:能源生产和使用是任何经济的重要组成部分。在美国,能源政 策的许多方面都下发到州一级。此外,不同地理区域和不同州的工业 都会影响能源的使用和生产。在1970 年, 美国西部的12 个州建立了 《西部州际能源契约》,旨在促进这些州之间对核能源技术的开发和 管理的合作。州际契约是两个或多个州之间签订的合同,这些州在具 体的政策问题上达成一致,通过一套标准或就某一特定区域或国家事 务进行合作。问题:美国与墨西哥的边境中有4 个州——美国加州,亚利桑那州, 新墨西哥州,和得克萨斯州-他们都希望就越来越多使用的清洁可再 生能源的来源形成一个紧凑的新能源契约。四个州的政府要求你的团 队为州际能源契约一系列目标的发展进行数据分析和建模。附件problemcdataxlsx 在第一个工作表中提供了这四个州在能源 的生产和消费方面的605 个变量的50 年数据,以及一些人口和经 济信息。数据集里面的605 个变量名称在第二工作表msncodes 有 具体定义。第一部分: A. 使用所提供的数据,建立四个州的能源分布模型。B.建立一个模型来描述从1960 年到2009 年四个州中的每一个州的能 源分布的演变规律。分析和解释你的模型的结果,说明四个州使用清 洁、可再生能源,以帮助州政府官员们理解这四个州之间的相似之处 和不同之处。在讨论中包括可能的影响因素(例如地理、工业、人口 和气候)。C.确定四个州中哪一个州在2009 年在使用清洁、可再生能源方面 有“最佳”配置发展趋势。确定你的标准和选择依据。D.根据这些州能源使用的历史演变,以及你对所建立的州概况之间 差异的理解,如你所定义的那样,预测州政府没有任何政策改变的 情况下,每个州在2025 和2050 年的能使用源概况。第二部分: A 根据四个州的比较,你的“最佳”配置标准和你的预测确定的 2025 和2050 的可再生能源使用目标,并将其作为新的四州能源契 约的目标。B.确定并讨论四个州实现其能源紧缩目标可能采取的至少三项行 动。第三部分:准备一份一页的备忘录给州政府官员来总结每个州的概况,时间截 至2009 年,在没有任何政策变化的条件下你对能源使用的预测, 以及你建议的能源契约所采取的措施。您的提交应包括:•一页汇总, •一页备忘录, •您的解决方案不超过20 页,包括汇总和备忘录在内最多22 页。注:参考文献和任何附录不计入22 页的限制,并应在您完成的解 决方案之后出现。

神经网络模型预测美国四州能源结构-2018MCM美国大学生数模竞赛

获奖论文

摘要

能源概况可以反映整个国家的发展水平。优化能源配置,提高可再生能源占比,是被要求要考虑的。问题重点是对数据的分类,预测和提炼。我们运用多元非线性回归模型,将四洲的工业状况,地理特点,交通水平和气候特征对清洁可再生能源的影响进行建模,根据所求得的结果给出加州在使用清洁可再生能源方面有较好的发展趋势。通过对四洲能源生产消费变量的分析,筛选出人口,经济,和若干个个包括在化石能源和清洁能源在内的消费情况的变量(在附录给出)。我们绘制了四洲可再生和不可再生能源的趋势图,描述了各州能源分布演变趋势。建立了四洲能源分布概况模型。通过经我们算法优化后的人工神经网络进行模拟,预测出2025年和2050年四洲的能源使用概况,亚利桑那州核能利用占比突出,且四洲清洁可再生能源比例升高。通过以上分析揭示了四洲能源结构的差异性,合作的必要性,以及采取措施的紧迫性。积极开展洲际合作,将对合理配置能源乃至经济具有重大影响。

关键词:

清洁能源,可再生能源,能源结构,BP 神经网络算法,多元非线性回归

导言

人类在从第一次工业革命以来,化石能源由于其有较大热值且便于储存和运输故导致其滥用。化石燃料所带来的污染使得人与环境矛盾变得尤为突出,以此所导致空气污染(伦敦光化学烟雾事件),温室效应等全球性问题甚至超过了对化肥滥用的影响和破坏生物多样性带来的的影响。环境库尔兹涅曲线使用一个倒“U”型曲线来说明人与环境随经济发展的关系,该曲线描述了当一个国家经济发展水平较低的时候,经济发展所带来的污染程度较轻,但随着人均收入增加,环境污染增长加剧,到底某一水平出现临界点,之后环境会随人们收入的增加而改善。在美国化石能源仍然占总能源消耗的百分比,新能源的研发和产业化仍需要重点支持,科学家在寻求新能源方面已经做了大量积极的探索,可再生能源和清洁能源是当前能源利用结构转型的新趋势。特斯拉电动车已经在美国初步推广逐渐形成网络雏形,且世界上一些城市已经使用清洁能源公共交通网络(天然气能源车,轻轨电车,中国高铁)。由于区位原因限制,现有的能源分配管理需要进行评估和改进,加州由于其经济和科技发展较快。

问题重述

在能源危机的背景下,面对新能源结构转型,为充分发挥各自优势,合理配置能源资源,美国南部四洲需要进行达成紧凑的能源契约,根据已知过去 50 年来各州能源生产消费情况和人口经济数据。第一 部分要求对 605 个变量进行分类,汇总和阐述每个州能源分布的演变规律,以此通过横向比较,确定 2009 年能源发展趋势最佳的州,在此基础上且不加政策干预时预测 2025 年和 2050 年的能源使用概况。第二部分的解答必须建立在第一问的模型基础之上,根据预测情况确定 2025 年和 2050、年的可再生能源生产和消费目标,作为洲际能源契约的目标。为实现目标,考虑可操作性和可执行性,提出至少三项行动。第三部分单独成章,总结每个州的能源概况,以及未来能源使用情况预测,通过备忘录的形式提醒决策者需要重点关注的问题。

数据分类及分类说明

为了对各个州的能源使用量和消费做出一个概况描述,初步将组委下发的赛题数据进行人工分类。分类依据为各种能源来源分为石油产品、煤、天然气、电力、可再生乙醇、地热、核能、太阳能、风能、木材、水电,其中根据依据是否为与环境友好的资源,可分为清洁和可在再生资源和非清洁和可再生资源。清洁和可在再生资源:可再生乙醇、地热、核能、太阳能、风能、木材、水电 非清洁和可在再生资源:石油、产品、煤、天然气。电力是理想的直接能源,可以方便的与其他能源进行相互转换,而被广泛使用,但由于其为二次能源,并不能直接从自然界获取,需要从其他能源进行转换。当通过化石燃料的燃烧获得的时候,此时的产生的电能属于对环境有害;当通过核反应发电等途径获得电能,此时产生的电能对环境无有害作用,故其都不属于以上两者范畴。对石油产品归为一类的说明:石油资源在国家发展中发挥重要作用,石油产品中的每种产品在石油的精馏中随提取温度不同而获得,对石油进行提炼生产时便可同时获得多种产品,各种产品用途广泛,所以将各种石油产品归为一类。在石油产品包含油品和副产品。油品:煤油、汽油、柴油、轻油、重油;在此基础之下,依据用途又可分为石油燃料、喷气燃料、燃料油、炼厂气、副产品:石蜡、凡士林、沥青。依据用途,有石油溶剂及化工原料、润滑油。

清洁可再生模型演变模型

随着经济、科技、人文在社会中的发展,清洁可再生能源受到人们原来越多的重视,当使用每年的清洁可再生资源总消耗热量来总占比的来表征清洁能源的演变规律时,其受到人口数量,gdp,工业发展状况,交通水平,地理特点,气候特征方面主要影响。

神经网络模型

人工神经网络具有人脑的学习记忆功能,主要应用到数据建模、预测、模式识别和函数优化等方向。本文的预测资源模型就是基于 BP神经网络算法,将其引入清洁可再生资源研究领域, 并应用 Matlab 语言及神经网络工具箱, 美国,,,四个州的清洁可再生资源进行预测研究。而传统的网络存在学习收敛速度较慢等问题, 因此我们团队对 BP 算法的 S 函数规范化方法进行了改造。此预测模型在预测精度和算法的收敛速度方面都达到了较好的效果, 为对美国未来清洁可再生资源以及相关问题的研究提供了一种有效方法。

BP 算法

人工神经网络是由大量简单的基本元件——神经元相互连接,通过模拟人的大脑神经处理信息的方式,进行信息并行处理和非线性转换的复杂网络系统。神经网络的优点是多输入多输出实现了数据的并行处理以及自学习能力。神经网络的拓扑结构包括网络层数、各层神经元数量以及各神经元之间相互联系的方式,三者都根据实际情况再具体确定取值。BP网络是一种具有三层或者三层以上神经元的神经网络,包括输入层、中间层和输出层。上下层之间实现全连接,而同一层的神经元之间无连接,输入层神经元与隐含层神经元之间是网络的权值,其意义是两个神经元之间的连接强度。隐含层或输出层任一神经元将前一层所有神经元传来的信息进行整合,通常还会在整合过的信息中添加一个阈值,然后将整合过的信息作为该层神经元输入。当一对学习样本提供给输入神经元后,神经元的激活值从输入层经过各隐含层向输出层传播,在输出层的各神经元获得网络的输入响应,然后按照减小网络输出与实际输出样本之间误差的方向,从输出层反向经过各隐含层回到输入层,从而逐步修正各连接权值,这种算法称为误差反向传播算法,即BP算法。随着这种差逆向传播修正的反复进行,网络对输入模式响应的正确率也不断上升。BP算法的核心是数学中的“负梯度下降”理论,即BP网络的误差调整方向总是沿着误差下降最快的方向进行,网络通过负梯度下降学习规则自行修正权值和阈值使误差平方和E逐步变小并最终达到理想误差。

模型预测分析

前文已经对题目所给的数据进行的分类和选择,简化了所需要处理的数据任务,而且能更清楚地直观的描述出能源使用量的演变状况。能源概况表明上述10个能源产品的消耗量与与该州的人口数量和GDP数据有明显的某种联系。为了明确找到这种关系,应用改造过的S函数建立BP人工神经网络智能算法,搜寻这种关系。方案分为两步:

  1. 构建人口数,GDP预测的神经网络模型一。通过神经网络构建人口数,GDP预测的算法,以得到一种人口数,GDP分别与时间的关系。应用数据中过去50年每个州人口数、GDP数据,将时间作为神经网络的输入,人口数作为神经网络的输出,其他相关参数设置如下:

  2. 构建预测各类能源使用状况的神经网络模型二。利应用数据中过去50年每个州的各类能源使用的数值,借助上一步所得结果,将每一年的人口数量和GDP数值作为该神经网络的输入,将其各类能源使用的数值作为该神经系统的输出,神经元的数目等参数如下:

人口数,GDP预测的神经网络模型一输出的结果可以作为清洁、可再生能源演变模型获取人口数,GDP的辅助参数,另一方面可作为预测各类能源使用状况的神经网络模型二的输入训练参数。预测各类能源使用状况的神经网络模型二可以独立完成对未来各州能源的使用预测,但主要作为主模型-清洁、可再生能源演变模型的误差对比模型,方便其调整参数,提高预测准确率。有关程序通过 MATLAB2016 软件的神经网络工具箱进行编写。选取1976 年后各组样本建立输入矩阵 p 和目标矩阵 t, 并输入神经网络进行训练。,从而能够预测出题目中想要知道的2025年和2050年的能源使用状况。训练完之后, 获得较为符合实际情况的神经网络系统,分别2025,2050的四组测试样本建立输入矩阵 pnew, 进行预测。通过多元线性回归分析与神经网络算法的混合混合算法能够预测以后的能源使用的演变状况,以解决题目所提出的问题。

模型的优点

1.该模型可以很方便地预测出未来的能源使用状况,随着时间的积累训练次数的提高,该模型输出结果越加准确。

模型的缺点

1.该网络的预测与所给的数据和神经元数目的设置有很大的关联程度,因此很有可能会使得预测产生很大的误差,而且我们不可能单纯地通过增加神经元的数量来减小其误差。

建议书

敬爱的州长阁下:你好!通过认真分析近五十年来四洲的能源生产和消费的数据后,通过分类筛查最终得出 12 个衡量清洁能源概况的变量,通过模型预测可得到未来四洲的能源结构都会趋向合理化。清洁能源占比逐步提升。加州未来能源需求仍旧很大,考虑到加州人口密度较大,且具有较多的科技巨头,一可以加大海洋能和生物质能的研发力度。亚利桑那州拥有冶金等重工业使得其不得不寻求新型能源进行发展,光伏产业虽不成熟,但在得天独厚的亚利桑那州,却有着无与伦比的太阳能资源。可以着重发展光伏产业以此带动能源消费和生产走上良性循环。新墨西哥州除了发展风能和核能之外,加强洲际交流合作,改善能源使用分布,可以考虑优化能源利用方式,从提高单位能源的产出率来提高能源利用效率。德州拥有世界最大的风力发电厂,幅员辽阔,资源丰富,且经济发展一直较为强劲,公共交通系统发达说明民众具有强烈的环保意识。在此雄厚的基础之上考虑创新,即开展洲际合作,合理配置能源。改善南部能源问题。

PDF及原文请点击阅读原文获取


以上是关于神经网络模型预测美国四州能源结构-2018MCM美国大学生数模竞赛的主要内容,如果未能解决你的问题,请参考以下文章

2018年美国大学生数学建模竞赛(MCM/ICM) 比赛心得

2018年美国大学生数学建模竞赛(MCM/ICM) D题解题思路

2018年美国大学生数学建模竞赛(MCM/ICM) E题解题思路

2018年美国大学生数学建模竞赛(MCM/ICM) F题解题思路

2018年美国大学生数学建模竞赛(MCM/ICM) B题解题思路

数据可视化分析2020年美赛MCM/ICM成绩