[论文复现]演化博弈方法用于多智能体系统最优资源分配

Posted 找不到服务器zhn

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了[论文复现]演化博弈方法用于多智能体系统最优资源分配相关的知识,希望对你有一定的参考价值。

原文 演化博弈方法用于多智能体系统最优资源分配 -CSDN博客
https://ieeexplore.ieee.org/document/8243778/

问题描述

  有2种资源分配给6个个体,2种资源的总量分别为 y 1 = 545 , y 2 = 467 y_1=545,y_2=467 y1=545,y2=467,不同的个体收到不同的资源会产生不同的收益,分配的资源量均大于等于0。以第3个个体为例,它接受的资源为 x ⃗ 3 = [ x 31 , x 32 ] T \\vecx_3=[x_31,x_32]^\\textT x 3=[x31,x32]T,两种资源的上限分别为 x 31 max = 66 , x 32 max = 120 x_31^\\textmax=66,x_32^\\textmax=120 x31max=66,x32max=120。可行资源组合 R 3 = x ⃗ 3 \\mathcalR_3=\\vecx_3 R3=x 3(这我没看懂 R 3 \\mathcalR_3 R3 有什么用),收到2种资源的收益为
u 3 ( x ⃗ 3 ) = x 31 ( 2 x 31 max − x 31 ) c 31 x 31 max + x 32 ( 2 x 32 max − x 32 ) c 32 x 32 max = x 31 ( 2 ⋅ 66 − x 31 ) 0.4 ⋅ 66 + x 32 ( 2 ⋅ 120 − x 32 ) 0.5 ⋅ 120 \\beginaligned u_3(\\vecx_3) =& \\fracx_31(2x_31^\\textmax-x_31) c_31x_31^\\textmax +\\fracx_32(2x_32^\\textmax-x_32) c_32x_32^\\textmax \\\\ =& \\fracx_31(2\\cdot 66-x_31)0.4\\cdot 66 +\\fracx_32(2\\cdot 120-x_32)0.5\\cdot 120 \\\\ \\endaligned u3(x 3)==c31x31maxx31(2x31maxx31)+c32x32maxx32(2x32maxx32)0.466x31(266x31)+0.5120x32(2120x32)
需要求的是在
x 11 + x 21 + x 31 + x 41 + x 51 + x 61 = 545 x 12 + x 22 + x 32 + x 42 + x 52 + x 62 = 467 x_11+x_21+x_31+x_41+x_51+x_61=545 \\\\ x_12+x_22+x_32+x_42+x_52+x_62=467 x11+x21+x31+x41+x51+x61=545x12+x22+x32+x42+x52+x62=467
的约束条件下,求
u 1 + u 2 + u 3 + u 4 + u 5 + u 6 u_1+u_2+u_3+u_4+u_5+u_6 u1+u2+u3+u4+u5+u6
的最大值。

算法

x ˙ 31 = x 31 ( p 31 x 21 + x 41 y 1 − x 21 p 21 + x 41 p 41 y 1 ) p 31 = ∂ u 3 ∂ x 31 = 2 ( x 31 max − x 31 ) c 31 x 31 max \\beginaligned \\dotx_31 =& x_31\\left(p_31\\fracx_21+x_41y_1 -\\fracx_21p_21+x_41p_41y_1\\right) \\\\ p_31 =& \\frac\\partial u_3\\partial x_31 =\\frac2(x_31^\\textmax-x_31)c_31x_31^\\textmax \\endaligned x˙31=p31=x31(p31y1以上是关于[论文复现]演化博弈方法用于多智能体系统最优资源分配的主要内容,如果未能解决你的问题,请参考以下文章

论文无法复现「真公开处刑」,PapersWithCode上线「论文复现报告」

CDN的智能调度,链路优化的详细解答

MATLAB代码:基于多智能体系统一致性算法的电力系统分布式经济调度策略

面试AI算法岗,你被要求复现顶会论文了嘛?

「AI芯片/GPU/NPU/DSP专用处理器」技术特征比较分析最新2022综述论文

动态规划的Matlab实现和实例分析