鞅与停时定理

news/2024/10/18 22:13:01

鞅与停时定理

会随着呆猫做题更新一些,但是非题解部分的改动应该不大

呆猫不会数学,要证明也是直接抄别人的,不如直接放一篇(

详细证明及介绍

主要写点,对鞅与停时定理的理解

定理与势能函数

对于一个随机过程\(\{X_0,X_1,...,X_t\}\),其中\(X_t\)是终止状态,对于构造出的函数,设为\(\varphi(X_i)\),有以下要求:

  • \(E(\varphi(X_{i+1})-\varphi(X_i)|X_0,X_1,...,X_i)=-1\),即随着时间,势能减少
  • 要求末状态\(\varphi(X_t)\)唯一对应一个值,即\(\varphi(X_i)=\varphi(X_t)\)当且仅当\(i=t\)

构造序列\(Y_i=\varphi(X_i)+i\),则\(E(Y_{n+1}|X_0,X_1,...,X_n)=Y_n\),所以\(Y\)\(X\)的鞅,那么就有

\[\begin{aligned} E(Y_t)&=E(Y_0)\\ E(\varphi(X_t))+E(t)&=E(\varphi(X_0)) \end{aligned} \]

所以\(E(\varphi(X_0))-E(\varphi(X_t))\)就可得到答案

然后\(E(\varphi(X_{i+1})-\varphi(X_i)|X_0,X_1,...,X_i)=-1\)这里不一定是\(1\),只要是常数就行,如果是其他的数的话只要改一下\(Y_i\)的定义即可

大体方向

大致就是,构造一个势能函数\(F(a_1,a_2,...,a_n)\),其中\(a_i\)表示每个局面,要使得\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}=E(F(a_1,a_2,...,a_n))-1\),其中\(\{b_i\}\)\(\{a_i\}\)的后继状态,\(p_{\{b_i\}}\)是后继为\(\{b_i\}\)的概率,在题目中是等概率的,这里这样写是为了直观

鞅与停时定理,可知答案为\(E(S)-E(T)\)

这里\(E(F(a_1,a_2,...,a_n))\)就是\(E(\varphi(X_n))\)\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}\)就是\(E[\varphi(X_{n+1})]\)

其实反过来也行,就\(\sum_{\{b_i\}}\frac{E(F(b_1,b_2,...,b_n))}{p_{\{b_i\}}}=E(F(a_1,a_2,...,a_n))+1\),答案为\(E(T)-E(S)\)

一般都是设\(F(a_1,a_2,...,a_n)=\sum_{i=1}^nf(a_i)\),然后构造出\(f(x)\)

例题

CF1025G

显然我们现在的\(a_i\)可以表示为挂在第\(i\)个点下面的节点个数

按理来说,应该列式有\(\sum_{\{b_i\}} f(\{b_i\})-f(\{a_i\})=-1\)\(luogu\)上好像有这么分析的,但是更多数都是直接去找了两个\(a_i\)\(a_j\),设为\(a\)\(b\),然后直接列式:

\[\begin{aligned} f(a)+f(b)-1&=\frac{f(a+1)+bf(0)}2+\frac{f(b+1)+af(0)}2\\ &=\frac{f(a+1)+f(b+1)+(a+b)f(0)}2 \end{aligned} \]

发现这样实际是要求了任意一组\(a\)\(b\)的后继差是\(1\),比原本的要求更严格,是可能没有解的

然后因为势能函数是能我们自己设定的,设\(f(0)=0\),则得到:

\[f(a)+f(b)-1=\frac{f(a+1)+f(b+1)}2 \]

因为\(f(a)\)\(f(b)\)是对称的,所以得到\(f(a)-\frac12=\frac{f(a+1)}2\),化一下式子得到\(f(a)-1=\frac{f(a+1)-1}2\)

那么可知\(f(n)=1-2^n\)

CF850F

按照套路,设出\(f(a_i)\),那么初始就是\(\sum_i f(a_i)\)

\(sum=\sum_if(a_i)\)\(s=\sum_ia_i\),列式:

\[\begin{aligned} -1+sum&=\frac1{s(s-1)}(\sum_{i\neq j}a_ia_j(sum-f(a_i)-f(a_j)+f(a_i+1)+f(a_j-1))+\sum_ia_i(a_i-1)sum)\\ -1&=\frac1{s(s-1)}\sum_{i\neq j}a_ia_j(-f(a_i)-f(a_j)+f(a_i+1)+f(a_j-1))\\ -1&=\frac1{s(s-1)}\sum_ia_i(f(a_i+1)+f(a_i-1)-2f(a_i)) \end{aligned} \]

\(g(x)=f(x+1)+f(x-1)-2f(x)\),因为\(g(x)\)都对称,所以有:

\[\begin{aligned} -1&=\frac1{s(s-1)}\sum_ia_ig(a_i)\\ &\Rightarrow g(x)=\frac{1-s}{s-x} \end{aligned} \]

那么也就有

\[f(x+1)+f(x-1)-2f(x)=\frac{1-s}{s-x} \]

\(h(x)=f(x)-f(x-1)\),则有

\[h(x+1)-h(x)=\frac{1-s}{s-x} \]

想要得到\(f(x)\),只需对右边那个两次前缀和即可

然后因为\(s\)可能会很大,所以要手推一个式子来算,\(f(a_i)\)倒是都可以递推出来

关于赋初值,看到有几种:

  • \(f(0)=f(1)=0\)
  • \(f(0)=0\)\(h(0)=m-1\) \(\Rightarrow\) \(f(s)=0\)
  • \(f(0)=0\)\(h(1)=-\frac{m-1}m\)

容易发现,几乎可以给\(h(1)/h(0)\)代入任何值,只要满足我们上面说的两点限制即可,具体代什么值看怎么方便,可以保留\(f(0)\)\(h(0)/h(1)\)到式子中,最后看代什么值好算即可

学长的文章里的这道题就用的这种方式 https://www.cnblogs.com/Illusory-dimes/p/15832042.html#

参考资料(鸣谢)

https://www.cnblogs.com/houzhiyuan/p/17991053

https://www.cnblogs.com/Illusory-dimes/p/15832042.html#

https://www.cnblogs.com/C202044zxy/p/16340757.html

https://www.luogu.com.cn/article/0d1a9nbm

https://www.cnblogs.com/zltzlt-blog/p/18035649

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/73238.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

20241018每日一题洛谷P2386

普及 每日一题 信息学竞赛 1206:放苹果 把M个同样的苹果放在N个同样的盘子里,允许有的盘子空着不放,问共有多少种不同的分法?(用K表示)5,1,1和1,5,1 是同一种分法。 第一行是测试数据的数目t(0<=t<=20)。以下每行均包含二个整数M和N,以空格分开。1<=M,N…

图片与向量的关系

如何从向量角度描述表示图片黑白图片黑白图片(灰度图)通过 2 维向量(矩阵)来表达。2个维度的长度分别代表了图片的高度和宽度(以像素为单位),向量元素记录着每一个像素的灰度(数值越大,颜色越浅) 例如下面右图矩阵标注了左图像素点的灰度分布:彩色图片彩色图片通过 …

数据采集与融合技术第二次作业

学号姓名 102202132 郑冰智这个作业要求在哪里 https://edu.cnblogs.com/campus/fzu/2024DataCollectionandFusiontechnology/homework/13285这个作业的目标 爬取天气网、股票相关信息、中国大学2021主榜所有院校信息,并存储在数据库中实验二仓库地址 https://gitee.com/zheng…

【LGR-203-Div.4】洛谷入门赛 #28

【LGR-203-Div.4】洛谷入门赛 #28\(A\) luogu B4042 [语言月赛 202410] 顺序结构 \(AC\)顺序结构。点击查看代码 int main() { ll a;cin>>a;cout<<3*(5+a)<<" "<<3*a+5<<endl;return 0; }\(B\) luogu B4043 [语言月赛 202410] 刻度尺…

uni-app小程序(快手、抖音)getCurrentPages使用坑位记录2

前情 uni-app是我比较喜欢的跨平台框架,它能开发小程序/H5/APP(安卓/iOS),重要的是对前端开发友好,自带的IDE让开发体验也挺棒的,现公司项目就是主推uni-app,我主要负责抖音和快手端小程序。 坑位 公司历史原因项目有APP端小程序端,但并不使用uni-app的一端发布所有平台,…

二叉查找树和笛卡尔树

二叉查找树~和笛卡尔树目录二叉查找树定义作用操作查找插入删除缺点笛卡尔树定义操作构造 二叉查找树 定义 ​ 二叉查找树(Binary Search Tree,BST),又名二叉搜索树或二叉排序树。 ​ 它是一类特殊规定的二叉树,它应当满足以下条件:每个节点有唯一确定的权值 非叶子节点的…

浅谈 tarjan

就是记录两个数组:dfn[]和low[] 其中dfn[]表示访问的顺序,low[u]用来存储 \(u\) 不经过其父亲能到达的最小时间戳。。。 搬一下 wiki 的图。。。我们发现 \(low[v]\ge dfn[u]\) 可以表示不能回到祖先,则 \(u\) 点位割点。。。 直接上代码P3388------> #include <bits/…

正点原子新起点V2开发板FPGA关于SDRAM代码解读

正点原子新起点V2开发板FPGA关于SDRAM代码解读 1. SDRAM 概述 SDRAM(Synchronous Dynamic Random Access Memory)是一种同步动态随机存储器,广泛用于FPGA项目中。通过SDRAM控制模块,可以实现数据读写、刷新等操作。本文对SDRAM的控制模块进行详细解读,分析代码中的命令控制…