Marshalling (计算机科学)

marshalling可译作集结、结集、编码、编组、编集、安整、数据打包、列集等,是计算机科学中把一个对象的内存表示变换为适合存储或发送的数据格式的过程。典型用于数据必须在一个程序的两个部分之间移动,或者必须从一个程序移动到另一个程序。Marshalling类似于序列化,可用于一个对象与一个远程对象通信。逆过程被称作unmarshalling

用途

Marshalling被用于实现不同的远程过程调用(RPC)机制,这必须用到进程间的数据传输。stub必须把程序内存空间的本地格式的数据转换为网络数据表示英语Network Data Representation格式(NDR,常称为数据的线上格式),这种转换被称为marshaling数据。当客户端或服务器接受数据,必须从NDR格式把数据转换为程序的本地格式,这称为unmarshaling数据。[1]

Microsoft的组件对象模型(COM)中,当跨COM的套间(apartment)传递接口指针时,接口指针必须被marshalled。[2][3].NET Framework下,在非受管(unmanaged)类型与CLR类型间,例如P/Invoke过程,必须做marshalling。[4]例如,C#程序调用C语言写的DLL,其中函数参数使用字符串,就需要做marshalling。

使用Mozilla应用程序框架XPCOM的脚本或应用程序,广泛使用marshalling。

例子

Microsoft Windows系列操作系统,Direct3D设备驱动程序是内核态驱动程序。DirectX运行时处理用户态API。用户态执行系统调用来执行内核态操作,需要CPU切换为内核态,这将耗费微秒级的时间来完成。[5]在此期间,CPU不能执行任何操作。为优化性能,必须极小化CPU这种模式切换。 Linux OpenGL驱动程序分为两部分:内核驱动与用户空间驱动。用户空间驱动把所有OpenGL命令翻译为机器码提交给GPU。为减少系统调用,用户空间驱动实现marshalling。当GPU的命令缓冲区(command buffer)装满了绘图数据,API简单地把请求绘制的调用存放在一个临时缓冲区;当命令缓冲区接近为空,执行内核模式切换一次性增加被存储的命令。

与序列化的比较

序列化一个对象意味着把它的状态转化为字节流,使这个字节流能反向转化为该对象的一个副本。

术语“marshal”被Python标准库认为与“序列化”同义。[6] 但与Java相关的RFC 2713不认为二者是同义:

"marshal"一个对象意味着记录下它的状态与codebase(s)[note 1]在这种方式,以便当这个marshal对象在被"unmarshalled"时,可以获得最初代码的一个副本,可能会自动装入这个对象的类定义。可以marshal任何能被序列化或远程(即实现java.rmi.Remote接口)。Marshalling类似序列化,除了marshalling也记录codebases。Marshalling不同于序列化是marshalling特别处理远程对象。

——Schema for Representing Java(tm) Objects in an LDAP Directory (RFC 2713)[7]

参见

注释

  • ^note 1 此处使用的“Codebase”在Java相关的涵义下,指可装入对象代码的URL的列表。不是一般意义上存放源代码的codebase英语codebase

参考文献

  1. ^ MSDN:"Aliasing and Marshaling Attributes". [2018-12-05]. (原始内容存档于2019-03-28). 
  2. ^ Apartments and COM Threading Models. [2018-01-20]. (原始内容存档于2015-09-23). 
  3. ^ CoInitializeEx function (COM). Windows Desktop App Development. [2013-02-22]. (原始内容存档于2017-07-12). 
  4. ^ Interop Marshaling Overview. [2018-01-20]. (原始内容存档于2016-11-29). 
  5. ^ Code Quality: The Open Source Perspective. [2018-01-20]. (原始内容存档于2020-12-19). 
  6. ^ marshal — Internal Python object serialization. Python Software Foundation. [4 November 2016]. (原始内容存档于2012-10-14). 
  7. ^ Schema for Representing Java(tm) Objects in an LDAP Directory. IETF. October 1999 [4 November 2016]. (原始内容存档于2020-01-20).