MMX

MMX是由英特尔开发的一种SIMD多媒体指令集，共有57条指令。它于1996年集成在英特尔奔腾（Pentium）MMX处理器上，以提高其多媒体数据的处理能力。

其优点是增加了处理器关于多媒体方面的处理能力，缺点是占用浮点数寄存器进行运算（64位MMX寄存器实际上就是浮点数寄存器的别名）以至于MMX指令和浮点数操作不能同时工作。为了减少在MMX和浮点数模式切换之间所消耗的时间，程序员们尽可能减少模式切换的次数，也就是说，这两种操作在应用上是互斥的。AMD在此基础上发展出3D Now!指令集。

3D Now!发布一年后，Intel在MMX基础上发展出SSE（Streaming SIMD Extensions）指令集，用来取代MMX。现在，新开发的程序不再仅使用MMX来优化软件执行性能，而是改使用如SSE、3DNOW!等更容易优化性能的新一代多媒体指令集，不过目前的处理器大多仍可以执行针对MMX优化的较早期软件。

MMX的字面涵义

1997年，Intel公司起诉AMD公司与Cyrix公司非法使用（misuse）了商标MMX。随后这起诉讼庭外和解，AMD公司承认MMX为Intel的商标，Intel允许AMD公司使用MMX作为一项技术的名称。在这起诉讼中，AMD披露MMX是Intel命名的矩阵数学扩展（Matrix Math eXtensions）的字母缩写。

技术细节

MMX寄存器，称作MM0到MM7，实际上就是处理器内部80比特字长的浮点寄存器栈st（0）到st (7)的尾数部分（64比特长）的复用。由于浮点栈寄存器的高16位未被MMX技术使用，因此这16位都置为1，因此从栈寄存器的角度看，其浮点值为NaN或Infinities，这可用于区分寄存器是处于浮点栈状态还是MMX状态。作为MMX寄存器都是直接访问。利用了装配数据类型（packed data type）的概念，每个MMX寄存器的64比特字长可以看作是2个32位整数、或者4个16位整数、或者8个8位整数，从而可以执行整数SIMD运算。这对于1990年代中期的2D、3D计算的加速还是很有意义的，因为当时的计算机的图形处理器（GPU）还很不发达。但现在MMX整数SIMD运算对于图形运算来说是多余的技术了。不过MMX的饱和算术运算（saturation arithmetic operations）对于一些数字信号处理应用还是有用的。

SIMD技术的发展

继MMX技术之后，Intel又于1999年在Pentium-III处理器上推出SSE技术，引入了新的128位宽的寄存器集（register file），称作XMM0到XMM7。这些XMM寄存器用于4个单精度浮点数运算的SIMD执行，并可以与MMX整数运算或x87浮点运算混合执行。2001年在Pentium 4上引入了SSE2技术，进一步扩展了指令集，使得XMM寄存器上可以执行8/16/32位宽的整数SIMD运算或双精度浮点数的SIMD运算。这使得SIMD技术基本完善。

外部链接

Intel® Pentium® Processors with MMX™ Technology for Embedded Computing - Technical Documents （页面存档备份，存于互联网档案馆）
The MMX Instruction Set from The Art of Assembly Language
IA Software Developer's Manual, Vol 1 (PDF)，see chapter 8 for MMX programming