计算最终市场分布 - 竞争性编程

Posted

技术标签:

【中文标题】计算最终市场分布 - 竞争性编程【英文标题】:Calculating final market distribution - competitive programming 【发布时间】:2018-09-15 23:58:18 【问题描述】:

我在练习竞争性编程时遇到了以下问题。我手动解决了它,有点设计一种方法,但我的答案是错误的,我无法想象如何扩展我的方法。

问题

N 家咖啡连锁店正在通过激烈的广告战来争夺市场份额。每天都会有一定比例的客户被说服从一个连锁店切换到另一个连锁店。

给出了当前的市场份额和客户转换的每日概率。如果广告永远持续下去,市场份额的最终分配会是什么?

假设:总市场份额为 1.0,客户转换的概率与其他客户和天数无关。

示例:2 家咖啡连锁店:A 和 B 的市场份额 A:0.4 B 的市场份额:0.6。

每天,客户从 A 切换到 B 的概率为 0.2 每天,客户从 B 切换到 A 的概率为 0.1

input: market_share=[0.4,0.6],

switch_prob = [[.8,.2][.1,.9]]

output: [0.3333 0.6667]

直到这里的一切都是问题的一部分,我没有形成示例或假设,它们是随问题给出的。

My_attempt:在我的理解中,切换概率表示从A切换到B的概率。

因此,

market_share_of_A = current_market_share - lost_customers + gained_customers and 
marker_share_of_B = (1 - marker_share_of_A)

iter_1: 
    lost_customers = 0.4 * 0.8 * 0.2 = 0.064
    gained_customers = 0.6 * 0.2 * 0.1 = 0.012
    market_share_of_A = 0.4 - 0.064 + 0.012 = 0.348
    marker_share_of_B = 1 - 0.348 = 0.652

iter_2:
    lost_customers = 0.348 * 0.1 * 0.2 = 0.00696
    gained_customers = 0.652 * 0.9 * 0.1 = 0.05868
    market_share_of_A = 0.348 - 0.00696 + 0.05868 = 0.39972
    marker_share_of_B = 1 - 0.32928 = 0.60028

my answer: [0.39972, 0.60028]

如前所述,预期的答案是[0.3333 0.6667]

    我不明白我哪里错了?如果有问题,那一定是我对问题的理解。请提供您的想法。

    在示例中,他们演示了一个简单的案例,即只有两个竞争对手。如果还有更多呢?让我们说三个 - A, B, C。我认为输入必须以[[0.1, 0.3, 0.6]..] 的形式提供切换概率,因为A 可能会将其客户输给BC,这样的例子很多。现在,我必须计算至少两家公司的市场份额,第三家将是(1-sum_of_all)。在计算 B 的市场份额时,我将不得不计算它失去的客户以及获得的客户,公式为(current - lost + gained)。获得的将是gain_from_A and gain_from_C 的总和。它是否正确?

【问题讨论】:

@meowgoesthedog,可能从问题中并不清楚,但直到示例的所有内容都是问题的一部分,他们谈论概率的语言,除了一开始提到一些客户切换链。我已经相应地更新了问题。 啊,我现在看到我的想法有错误,抱歉。根据我当前的理解,最终状态只是切换概率的函数,而不是初始状态,因为系统将达到一个独特的平衡点。这可以用一些矩阵代数来解决(因为它归结为一组联立线性方程) 这让我想起了en.m.wikipedia.org/wiki/Markov_chain @algrid 是的,这是马尔可夫链的明显例子 【参考方案1】:

根据我的评论,这个问题可以表示为矩阵方程。


“转移”矩阵T(i, j)(维度N x N)的元素定义如下:

i = j(对角线):客户留下i的概率 i != j(非对角线):链j的客户转移到链i的概率

这个矩阵的物理意义是什么?让市场份额状态用大小为N的向量P(i)表示,其i-th值为链i的市场份额。向量P' = T * P 是每天之后的下一个分享状态。

考虑到这一点,平衡方程T * P = P 给出,即最终状态在转换T 下是不变的:

| T(1, 1)  T(1, 2)  T(1, 3) ... T(1, N) |   | P(1) |   | P(1) |
| T(2, 1)  T(2, 2)  ...                 |   | P(2) |   | P(2) |
| T(3, 1)  ...                          |   | P(3) |   | P(3) |
| .        .                            | * | .    | = | .    |
| .                 .                   |   | .    |   | .    |
| .                         .           |   | .    |   | .    |
| T(N, 1)                       T(N, N) |   | P(N) |   | P(N) |

然而,这本身是无法解决的——P 只能通过其元素之间的多个比率来确定(这种情况的技术名称让我无法理解——因为MBo 暗示这是由于退化造成的)。还有一个额外的限制,即份额加起来为 1:

P(1) + P(2) + ... P(N) = 1

我们可以选择一个任意的共享值(例如,Nth)并用这个表达式替换它。相乘,等式的第一行是:

T(1, 1) P(1) + T(1, 2) P(2) + ... T(1, N) (1 - [P(1) + P(2) + ... P(N - 1)]) = P(1)

--> [T(1, 1) - T(1, N) - 1] P(1) + [T(1, 2) - T(1, N)] P(2) + ... "P(N - 1)" = -T(1, N)

第二行的等效方程为:

[T(2, 1) - T(2, N)] P(1) + [T(2, 2) - T(2, N) - 1] P(2) + ... = -T(2, N)

为了总结一般模式,我们定义:

矩阵S(i, j)(维度[N - 1] x [N - 1]):

- S(i, i) = T(i, i) - T(i, N) - 1
- S(i, j) = T(i, j) - T(i, N)         (i != j)

大小为N - 1 的向量Q(i),包含P(i) 的第一个N - 1 元素

大小为N - 1 的向量R(i),使得R(i) = -T(i, N)

然后等式变成S * Q = R

| S(1, 1)   S(1, 2)  S(1, 3) ... S(1, N-1)   |   | Q(1)   |   | R(1)   |
| S(2, 1)   S(2, 2)  ...                     |   | Q(2)   |   | R(2)   |
| S(3, 1)   ...                              |   | Q(3)   |   | R(3)   |
| .         .                                | * | .      | = | .      |
| .                  .                       |   | .      |   | .      |
| .                          .               |   | .      |   | .      |
| S(N-1, 1)                      S(N-1, N-1) |   | Q(N-1) |   | R(N-1) |

求解上述方程得到Q,它给出了第一个N - 1 共享值(当然最后一个也来自约束)。这样做的方法包括高斯消除LU分解,这两种方法都比直接计算Q = inv(S) * R的朴素路线更有效。

请注意,您可以将SR 中的标志翻转过来,以便更方便地评估。


上面给出的玩具示例非常简单:

| 0.8   0.1 |   | P1 |   | P1 |
|           | * |    | = |    |
| 0.2   0.9 |   | P2 |   | P2 |

--> S = | -0.3 |, R = | -0.1 |

--> Q1 = P1 = -1.0 / -0.3 = 0.3333
    P2 = 1 - P1 = 0.6667

N = 3 的示例:

    | 0.1  0.2  0.3 |           | -1.2   -0.1 |        | -0.3 |
T = | 0.4  0.7  0.3 |  -->  S = |             | ,  R = |      |
    | 0.5  0.1  0.4 |           |  0.1   -0.6 |        | -0.3 |

         | 0.205479 |
-->  Q = |          | , P3 = 0.260274
         | 0.534247 |

请原谅 Robinson Crusoe 风格的格式 - 为了便于阅读,我稍后会尝试用 LaTeX 编写这些格式。

【讨论】:

技术名称是matrix rank - 这里是n-1,因为方程具有线性相关性(退化性) @MBo 是的,退化可能是我正在寻找的词 - 我指的是 P 不能仅用 T 方程唯一确定,而不使用求和约束。谢谢 如果 T 是 [0 1; 1 0] 怎么办? @yola 好点;我还不确定如何概括对诸如此类的非收敛情况的检测。欢迎任何见解 @yola 我想一种方法可能是遍历所有N 构造S 的方法,并检查没有一个行列式为零(因为它们都是等价的选择),在成为O(N^3)的成本

以上是关于计算最终市场分布 - 竞争性编程的主要内容,如果未能解决你的问题,请参考以下文章

恒星分布式存储更具市场竞争力

云计算竞争进入深水区 专有云市场成新赛道

云计算市场竞争加剧:数据显示北京高居第一,领先次名8倍之多

云计算行业的另外一种竞争

云计算2.0时代,云巨头如何提升用户体验赢得竞争优势

云计算市场持续高速增长,亚马逊微软IBM阿里云腾讯云等巨头企业竞争愈演愈烈