马尔可夫链

马尔可夫链（英语：Markov chain），又称离散时间马可夫链（discrete-time Markov chain，缩写为DTMC^[1]），因俄国数学家安德烈·马尔可夫得名，为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质：下一状态的概率分布只能由当前状态决定，在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作马可夫性质。马尔科夫链作为实际过程的统计模型具有许多应用。

在马尔可夫链的每一步，系统根据概率分布，可以从一个状态变到另一个状态，也可以保持当前状态。状态的改变叫做转移，与不同的状态改变相关的概率叫做转移概率。随机漫步就是马尔可夫链的例子。随机漫步中每一步的状态是在图形中的点，每一步可以移动到任何一个相邻的点，在这里移动到每一个点的概率都是相同的（无论之前漫步路径是如何的）。

介绍

马尔可夫链是离散状态、离散时间的马尔可夫过程。

形式化定义

马尔可夫链是满足马尔可夫性质的随机变量序列X₁, X₂, X₃, ...，即给出当前状态，将来状态和过去状态是相互独立的。从形式上看，

如果两边的条件分布有定义（即如果

\Pr(X_{1}=x_{1},...,X_{n}=x_{n})>0

），则

\Pr(X_{n+1}=x\mid X_{1}=x_{1},X_{2}=x_{2},\ldots ,X_{n}=x_{n})=\Pr(X_{n+1}=x\mid X_{n}=x_{n})

。

X_i的可能值构成的可数集S叫做该链的“状态空间”。

通常用一系列有向图来描述马尔可夫链，其中图n的边用从时刻n的状态到时刻n+1的状态的概率 $\Pr(X_{n+1}=x\mid X_{n}=x_{n})$ 来标记。也可以用从时刻n到时刻n+1的转移矩阵表示同样的信息。但是，马氏链常常被假定为时齐的（见下文的变种），在这种情况下，图和矩阵与n无关，因此也不表现为序列。

这些描述强调了马尔可夫链与初始分布 $\Pr(X_{1}=x_{1})$ 无关这一结构。当时齐的时候，可以认为马氏链是分配从一个顶点或状态跳变到相邻一个的概率的状态机。可以把机器状态的概率 $\Pr(X_{n}=x|X_{1}=x_{1})$ 作为仅有元素 $x_{1}$ 的状态空间为输入的机器的统计行为分析，或作为初始分布为 $\Pr(X_{1}=y)=[x_{1}=y]$ 状态为输入的机器行为，其中 $[P]$ 是艾佛森括号。

一些状态序列可能会有零概率的事件，对应多连通分量的图，而我们禁止转移概率为0的边。例如，若a到b的概率非零，但a到x位于图的不同连通分量，那么 $\Pr(X_{n+1}=b|X_{n}=a)$ 有意义，而 $\Pr(X_{n+1}=b|X_{1}=x,...,X_{n}=a)$ 无意义。

变种

连续时间马尔可夫过程（英语：Continuous-time Markov process）具有连续索引。
时齐马尔可夫链（或静态马尔可夫链）是对于所有n

\Pr(X_{n+1}=x\mid X_{n}=y)=\Pr(X_{n}=x\mid X_{n-1}=y)\,

的过程。转移概率与n无关。

m阶马尔可夫链（或记忆为m的马尔可夫链），其中m有限，为满足

{\begin{aligned}{}&\Pr(X_{n}=x_{n}\mid X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},\dots ,X_{1}=x_{1})\\=&\Pr(X_{n}=x_{n}\mid X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},\dots ,X_{n-m}=x_{n-m}){\text{ for }}n>m\end{aligned}}

的过程。换句话说，未来状态取决于其前m个状态。It is possible to construct a chain（Y_n）from (X_n) which has the 'classical' Markov property by taking as state space the ordered m-tuples of X values, ie. Y_n =(X_n, X_n−1, ..., X_n−m+1)。

瞬态演变

用n步从状态i到状态j的概率为

p_{ij}^{(n)}=\Pr(X_{n}=j\mid X_{0}=i)\,

而单步转移是

p_{ij}=\Pr(X_{1}=j\mid X_{0}=i).\,

对于一个时齐马尔可夫链来说：

p_{ij}^{(n)}=\Pr(X_{k+n}=j\mid X_{k}=i)\,

而

p_{ij}=\Pr(X_{k+1}=j\mid X_{k}=i).\,

n步转移概率满足查普曼-科尔莫戈罗夫等式，对任意k使得0 < k < n，

p_{ij}^{(n)}=\sum _{r\in S}p_{ir}^{(k)}p_{rj}^{(n-k)}

其中S为此马尔可夫链的状态空间。

边缘分布Pr(X_n = x)为第n次状态的分布。初始分布为Pr(X₀ = x)。用一步转移把过程演变描述为

\Pr(X_{n}=j)=\sum _{r\in S}p_{rj}\Pr(X_{n-1}=r)=\sum _{r\in S}p_{rj}^{(n)}\Pr(X_{0}=r)

。

注意：上标（n）是索引而非指数。

性质

可还原性

马尔可夫链是由一个条件分布来表示的

P(X_{n+1}|X_{n})\,

这被称为是随机过程中的“转移概率”。这有时也被称作是“一步转移概率”。二、三，以及更多步的转移概率可以导自一步转移概率和马尔可夫性质：

P(X_{n+2}|X_{n})=\int P(X_{n+2},X_{n+1}|X_{n})\,dX_{n+1}=\int P(X_{n+2}|X_{n+1})\,P(X_{n+1}|X_{n})\,dX_{n+1}

同样，

P(X_{n+3}|X_{n})=\int P(X_{n+3}|X_{n+2})\int P(X_{n+2}|X_{n+1})\,P(X_{n+1}|X_{n})\,dX_{n+1}\,dX_{n+2}

这些式子可以通过乘以转移概率并求 $k-1$ 次积分来一般化到任意的将来时间 $n+k$ 。

周期性

边缘分布 $P(X_{n})$ 是在时间为 $n$ 时的状态的分布。初始分布为 $P(X_{0})$ 。该过程的变化可以用以下的一个时间步幅来描述：

P(X_{n+1})=\int P(X_{n+1}|X_{n})\,P(X_{n})\,dX_{n}

这是Frobenius-Perron equation的一个版本。这时可能存在一个或多个状态分布 $\pi$ 满足

\pi (X)=\int P(X|Y)\,\pi (Y)\,dY

其中 $Y$ 只是为了便于对变量积分的一个名义。这样的分布 $\pi$ 被称作是“平稳分布”（Stationary Distribution）或者“稳态分布”（Steady-state Distribution）。一个平稳分布是一个对应于特征值为 $1$ 的条件分布函数的特征方程。

平稳分布是否存在，以及如果存在是否唯一，这是由过程的特定性质决定的。“不可约”是指每一个状态都可来自任意的其它状态。当存在至少一个状态经过一个固定的时间段后连续返回，则这个过程被称为是“周期的”。

重现性

各态历遍性

具有重现性而不具有周期性叫做遍历的。重现性包括局部重现性。

律动性

平稳状态分析和极限分布

平稳状态分析和时齐马尔可夫链

有限状态空间

若状态空间是有限的，则转移概率分布可以矩阵表示，该矩阵称为转移矩阵，记为P。其中处于 $(i,j)$ 的元素等于

p_{ij}=\Pr(X_{n+1}=j\mid X_{n}=i).\,

由于P的每一行各元素之和为1，且P中所有的元素都是非负的，因此P是一个右随机矩阵。

稳定分布与特征向量和单纯形的关系

稳定分布π是一个（行）向量，它的元素都非负且和为1，不随施加P操作而改变，定义为

\pi \mathbf {P} =\pi .\,

通过将这个定义与特征向量进行比较，我们看到，这两个概念是相关的，并且

\pi ={\frac {e}{\sum _{i}{e_{i}}}}

是由（ $\textstyle \sum _{i}\pi _{i}=1$ ）归一化的转移矩阵P的左特征向量 e的倍数，其特征值为1。如果有多个单位特征向量那么相应稳态的加权和也是稳态。但对于马尔可夫链来说，我们更关心的是作为一些对初始分布的序列分布的极限的稳态。

稳定分布 $\textstyle \pi _{i}$ 的值与状态空间P有关，它的特征向量保留各自的相对比例。因为π的成分为正且满足约束条件 $\textstyle \sum _{i}1\cdot \pi _{i}=1$ ，我们发现π与一个成分全为1的向量的点积是统一的，、π位于一个单纯形上。

有限状态空间内的时齐马尔可夫链

对于一个离散状态空间， $k$ 步转移概率的积分即为求和，可以对转移矩阵求 $k$ 次幂来求得。就是说，如果 $\mathbf {P}$ 是一步转移矩阵， $\mathbf {P} ^{k}$ 就是 $k$ 步转移后的转移矩阵。

如果转移矩阵 $\mathbf {P}$ 不可约，并且是非周期的，则 $\mathbf {P} ^{k}$ 收敛到一个每一列都是不同的平稳分布 $\pi ^{*}$ ，并且，

\lim _{k\rightarrow \infty }\mathbf {P} ^{k}=\pi ^{*}

,

独立于初始分布 $\pi$ 。这是由Perron-Frobenius theorem所指出的。

正的转移矩阵（即矩阵的每一个元素都是正的）是不可约和非周期的。矩阵被称为是一个随机矩阵，当且仅当这是某个马尔可夫链中转移概率的矩阵。

注意：在上面的定式化中，元素 $(i,j)$ 是由j转移到i的概率。有时候一个由元素 $(i,j)$ 给出的等价的定式化等于由i转移到j的概率。在此情况下，转移矩阵仅是这里所给出的转移矩阵的转置。另外，一个系统的平稳分布是由该转移矩阵（每列的和为1）的右特征向量给出的，而不是左特征向量。

转移概率独立于过去的特殊况为熟知的Bernoulli scheme。仅有两个可能状态的Bernoulli scheme被熟知为伯努利过程

趋向稳定分布的收敛速度

可反转马尔可夫链

可反转马尔可夫链类似于应用贝叶斯定理来反转一个条件概率：

{\begin{aligned}\Pr(X_{n}=i\mid X_{n+1}=j)&={\frac {\Pr(X_{n}=i,X_{n+1}=j)}{\Pr(X_{n+1}=j)}}\\&={\frac {\Pr(X_{n}=i)\Pr(X_{n+1}=j\mid X_{n}=i)}{\Pr(X_{n+1}=j)}}.\end{aligned}}

以上就是反转的马尔可夫链。因而，如果存在一个π，使得：

\pi _{i}p_{ij}=\pi _{j}p_{ji}.\,

那么这个马尔可夫链就是可反转的。

这个条件也被称为细致平衡（detailed balance）条件。

对于所有的i求和：

\sum _{i}\pi _{i}p_{ij}=\pi _{j}\,

所以，对于可反转马尔可夫链，π总是一个平稳分布。

伯努利方案

伯努利方案是马尔可夫链的一种特殊情形，其转移概率矩阵有相同的行，即下一状态均匀独立于当前状态（除了独立于过往状态以外）。仅有两个可能状态的伯努利方案是伯努利过程。

一般的状态空间

对于一般状态空间上的马尔可夫链的概述，详见文章状态空间可测的马尔可夫链。

Harris链

局部交互的马尔可夫链

应用

物理

马尔可夫系统广泛出现在热力学和统计力学中，

化学

测试

语音识别

隐马尔科夫模型是大多数现代自动语音识别系统的基础。

资讯科学

排队理论

互联网应用

谷歌所使用的网页排序算法（PageRank）就是由马尔可夫链定义的。如果 $N$ 是已知的网页数量，一个页面 $i$ 有 $k_{i}$ 个链接到这个页面，那么它到链接页面的转换概率为 ${\frac {\alpha }{k_{i}}}+{\frac {1-\alpha }{N}}$ ，到未链接页面的概率为 ${\frac {1-\alpha }{N}}$ ，参数 $\alpha$ 的取值大约为0.85。

马尔可夫模型也被应用于分析用户浏览网页的行为。一阶或者二阶的马尔可夫模型可以用于对一个用户从某一网络链接转移到另一链接的行为进行建模，然后这些模型可以用于对用户之后的浏览行为进行预测。

统计

经济和金融

马尔科夫链可以应用于金融与经济中一系列现象的建模，包括资产价值与市场冲击。1974年Prasad等人第一次应用马尔科夫链于金融模型^[2]，另一个是James D. Hamilton 1989年应用的机制转换模型^[3]，其中马尔科夫链用来对高GDP增长速度时期与低GDP增长速度时期（换言之，经济扩张与紧缩）的转换进行建模^[3]。

社会科学

生物数学

马尔可夫链也有众多的生物学应用，特别是增殖过程，可以帮助模拟生物增殖过程的建模。隐蔽马尔可夫模型还被用于生物信息学，用以编码区域或基因预测（见哈代-温伯格定律。）

遗传学

游戏

音乐

马尔可夫链也被用于算法作曲，例如在Csound 、 Max和SuperCollider等软件中。在一阶链中，该系统的状态是音符或音高，再构建每个音符的转移概率，完成转移矩阵。算法根据转移矩阵生成音符的输出，该值可以是MIDI音符值、音高或其他量。

棒球

马尔可夫文本生成器

马尔可夫过程，能为给定样品文本，生成粗略，但看似真实的文本：他们被用于众多供消遣的“模仿生成器”软件。马尔可夫链还被用于谱曲。

信息论

用于计算马尔可夫信源的极限熵

历史

俄国数学家安德雷·安德耶维齐·马尔可夫.

马尔可夫在1906年首先做出了这类过程。而将此一般化到可数无限状态空间是由俄国数学家柯尔莫果洛夫（俄语：Андре́й Никола́евич Колмого́ров）在1936年给出的。马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的，但马尔可夫寻求的似乎不仅于数学动机，名义上是对于纵属事件大数法则的扩张。

隐马可夫模型

语音辨识

参看

参考文献

引用

^ Norris, James R. Markov chains. Cambridge University Press. 1998 [2015-03-19]. （原始内容存档于2021-05-06）.
^ Prasad, NR; RC Ender; ST Reilly; G Nesgos. Allocation of resources on a minimized cost basis. 1974 IEEE Conference on Decision and Control including the 13th Symposium on Adaptive Processes. 1974, 13: 402–3. doi:10.1109/CDC.1974.270470. （原始内容存档于2015-02-12）.
^ ^3.0 ^3.1 Hamilton, James . A new approach to the economic analysis of nonstationary time series and the business cycle. Econometrica (Econometrica, Vol. 57, No. 2). 1989, 57 (2): 357–84. JSTOR 1912559. doi:10.2307/1912559.

来源

A.A. Markov. "Rasprostranenie zakona bol'shih chisel na velichiny, zavisyaschie drug ot druga". Izvestiya Fiziko-matematicheskogo obschestva pri Kazanskom universitete, 2-ya seriya, tom 15, pp 135-156, 1906.
A.A. Markov. "Extension of the limit theorems of probability theory to a sum of variables connected in a chain". reprinted in Appendix B of: R. Howard. Dynamic Probabilistic Systems, volume 1: Markov Chains. John Wiley and Sons, 1971.
Leo Breiman. Probability. Original edition published by Addison-Wesley, 1968; reprinted by Society for Industrial and Applied Mathematics, 1992. ISBN 978-0-89871-296-4. （See Chapter 7.）
J.L. Doob. Stochastic Processes. New York: John Wiley and Sons, 1953. ISBN 978-0-471-52369-7.

外部链接

免费的《概率论入门》书中有关马尔可夫链的章节（页面存档备份，存于互联网档案馆）
世界上最大的矩阵计算（Google's PageRank as the stationary distribution of a random walk through the Web.） （页面存档备份，存于互联网档案馆）
Disassociated Press in Emacs approximates a Markov process
[1] Markov chains used to produce semi-coherent English.
有关马尔可夫链的资源列表（页面存档备份，存于互联网档案馆）

[1] Norris, James R. Markov chains. Cambridge University Press. 1998 [2015-03-19]. （原始内容存档于2021-05-06）.

[2] Prasad, NR; RC Ender; ST Reilly; G Nesgos. Allocation of resources on a minimized cost basis. 1974 IEEE Conference on Decision and Control including the 13th Symposium on Adaptive Processes. 1974, 13: 402–3. doi:10.1109/CDC.1974.270470. （原始内容存档于2015-02-12）.

[#1-3] 3.0 ^3.1 Hamilton, James . A new approach to the economic analysis of nonstationary time series and the business cycle. Econometrica (Econometrica, Vol. 57, No. 2). 1989, 57 (2): 357–84. JSTOR 1912559. doi:10.2307/1912559.

[1]

[2]

[3]