高斯消去法

線性代數中求各種解的一個算法

高斯消去法(英语:Gaussian Elimination)是线性代数中的一个算法,可以把矩阵转化为行阶梯形矩阵[1]高斯消去法可用来为线性方程组求解,求出矩阵的秩,以及求出可逆方阵逆矩阵

历史

该方法以数学家卡尔·高斯命名,但最早出现于中国古籍《九章算术》,成书于约公元前150年。[2]

例子

高斯消去法可用来找出下列方程组的解或其解的限制:  

这个算法的原理是:

首先,要将 以下的等式中的 消除,然后再将 以下的等式中的 消除。这样可使整个方程组变成一个三角形似的格式。之后再将已得出的答案一个个地代入已被简化的等式中的未知数中,就可求出其馀的答案了。

在刚才的例子中,我们将  相加,就可以将 中的 消除了。然后再将  相加,就可以将 中的 消除。

我们可以这样写:

 
 

结果就是:

 
 
 

现在将  相加,就可将 中的 消除:

 

其结果是:

 
 
 

这样就完成了整个算法的初步,一个三角形的格式(指:变数的格式而言,上例中的变数各为3,2,1个)出现了。

第二步,就是由尾至头地将已知的答案代入其他等式中的未知数。第一个答案就是:

 

然后就可以将 代入 中,立即就可得出第二个答案:

 

之后,将  代入 之中,最后一个答案就出来了:

 

就是这样,这个方程组就被高斯消去法解决了。

这种算法可以用来解决所有线性方程组。即使一个方程组不能被化为一个三角形的格式,高斯消去法仍可找出它的解。例如,如果在第一步化简后,  中没有出现任何 ,没有三角形的格式,照著高斯消去法而产生的格式仍是一个行阶梯形矩阵。这情况之下,这个方程组会有超过一个解,当中会有至少一个变数作为答案。每当变数被锁定,就会出现一个解。

通常人或电脑在应用高斯消去法的时候,不会直接写出方程组的等式来消去未知数,反而会使用矩阵来计算。以下就是使用矩阵来计算的例子:

 

跟著以上的方法来运算,这个矩阵可以转变为以下的样子:

 

这矩阵叫做“行阶梯形矩阵”。

最后,可以利用同样的算法产生以下的矩阵,便可把所得出的解或其限制简明地表示出来:

 

最后这矩阵叫做“简化行阶梯形矩阵”,亦是高斯-若尔当消元法指定的步骤。[3]

其他应用

找出逆矩阵

高斯消去法可以用来找出一个可逆矩阵逆矩阵。设 为一个 的矩阵,其逆矩阵可被两个分块矩阵表示出来。将一个  单位矩阵放在 的右手边,形成一个 的分块矩阵 。经过高斯消去法的计算程序后,矩阵 的左手边会变成一个单位矩阵 ,而逆矩阵 会出现在 的右手边。

假如高斯消去法不能将 化为三角形的格式,那就代表 是一个不可逆的矩阵。

应用上,高斯消去法极少被用来求出逆矩阵。高斯消去法通常只为线性方程组求解[4]

计出秩和基底的基本算法

高斯消去法可应用在任何 矩阵 。在不可减去某数的情况下,我们都只有跳到下一行。以一个 的矩阵作例,它可能可以变化为一个行阶梯形矩阵:

 

而矩阵中的*是一些数字。这个行阶梯形矩阵 会有一些关于 的资讯:

  •  是5,因为 有5行非0的行;
  •  列空间Col(A),将以 的第1、3、4、7和9行为基底,就是那些在矩阵 之中拥有主元的行;
  • 矩阵中的*表示了 的该行如何写为上述基底的线性组合

分析

高斯消去法的算法复杂度O(n3);这就是说,如果系数矩阵的是n × n,那么高斯消去法所需要的计算量大约与n3成比例

高斯消去法可以用在电脑中来解决数千条等式及未知数。不过,如果有过百万条等式时,这个算法会十分费时。一些极大的方程组通常会用迭代法来解决。亦有一些方法特地用来解决一些有特别排列的系数的方程组。

高斯消去法可用在任何中。

高斯消去法对于一些矩阵来说是稳定的。对于普遍的矩阵来说,高斯消去法在应用上通常也是稳定的,不过亦有例外。[5]

伪代码

高斯消去法的其中一种伪代码

 i = 1
 j = 1
 while (i  m and j  n) do
   Find pivot in column j, starting in row i    // 从第i行(row)开始,找出第j列(column )中的最大值(i、j值应保持不变)  #台湾与大陆的列、行定义相反。台湾列为row行为column,大陆列为column行为row。
   maxi = i
   for k = i+1 to m do
     if abs(A[k,j]) > abs(A[maxi,j]) then
       maxi = k   // 使用交换法找出最大值(绝对值最大)
     end if
   end for
   if A[maxi,j]  0 then  // 判定找到的绝对值最大值是否为零:若不为零就进行以下操作;若为零则说明该列第(i+1)列以下(包括第(i+1)列)均为零,不需要再处理,直接跳转至第(j+1)行第(i+1)列
     swap rows i and maxi, but do not change the value of i   // 将第i行与找到的最大值所在行做交换,保持i值不变(i值记录了本次操作的起始行)
     Now A[i,j] will contain the old value of A[maxi,j].
     divide each entry in row i by A[i,j]    // 将交换后的第i列归一化(第i列所有元素分别除以A[i,j])
     Now A[i,j] will have the value 1.
     for u = i+1 to m do    // 第j行中,第(i+1)列以下(包括第(i+1)列)所有元素都减去A[i,j],直到第j行的i+1列以後元素均為零
       subtract A[u,j] * row i from row u
       Now A[u,j] will be 0, since A[u,j] - A[i,j] * A[u,j] = A[u,j] - 1 * A[u,j] = 0.
     end for
     i = i + 1   
   end if
   j = j + 1  // 第j行中,第(i+1)列以下(包括第(i+1)列)所有元素均为零。移至第(j+1)行,从第(i+1)列开始重复上述步骤。
 end while

这个算法和之前谈到的有点不同,它由绝对值最大的部分开始做起,这样可以改善算法的稳定性。本算法由左至右地计算,每作出以下三个步骤,才跳到下一行和下一列:

  1. 定出每行的绝对值最大的一个非0的数,将第一列的值与该列交换,使得第一列拥有这一行的最大值;
  2. 将第一行的数字除以该数,使得该列的第一个数成为1;
  3. 对每一列减去第一列乘以每一列的第一个数,使得每一列的第一个数变为0。

所有步骤完成后,这个矩阵会变成一个行阶梯形矩阵,再用代入法就可以求解该方程组。


随着多核处理器的日益普及,现在的程序员可以利用线程级并行高斯消元算法来提高计算的速度。内存共享模式(而不是消息交换模式)的伪代码如下所示:

void parallel(int num_threads,int matrix_dimension)
{
	int i;
	for(i=0; i<num_threads; i++)
		create_thread(&threads[i],i);
	pthread_attr_destroy(&attr); // Free attribute and wait for the other threads
	for(i=0; i<p; i++)
		pthread_join(threads[i],NULL);
}
void *gauss(int thread_id)
{
	int i,k,j;
	for(k=0; k<matrix_dimension-1; k++)
	{
		if(thread_id==(k%num_thread))  //interleaved-row work distribution
		{
			for(j=k+1; j<matrix_dimension; j++)
				M[k][j]=M[k][j]/M[k][k];
			M[k][k]=1;
		}
		barrier(num_thread,&mybarrier);      //wait for other thread finishing this round
		for(i=k+1; i<matrix_dimension; i=i+1)
			if(i%p==thread_id)
			{
				for(j=k+1; j<matrix_dimension; j++)
					M[i][j]=M[i][j]-M[i][j]*M[k][j];
				M[i][k]=0;
			}
		barrier(num_thread,&mybarrier);
	}
	return NULL;
}
void barrier(int num_thread, barrier_t * mybarrier)
{
	pthread_mutex_lock(&(mybarrier->barrier_mutex));
	mybarrier->cur_count++;
	if(mybarrier->cur_count!=num_thread)
		pthread_cond_wait(&(mybarrier->barrier_cond),&(mybarrier->barrier_mutex));
	else
	{
		mybarrier->cur_count=0;
		pthread_cond_broadcast(&(mybarrier->barrier_cond));
	}
	pthread_mutex_unlock(&(mybarrier->barrier_mutex));
}

参考文献

  1. ^ Steven J. Leon. Linear Algebra With Applications. 培生教育. 2014: 第13页. ISBN 9781292025148. 
  2. ^ 第八章 方程. 《九章算术》. 150bc [2007年12月25日]. (原始内容存档于2009年4月19日). 
  3. ^ Steven J. Leon. Linear Algebra With Applications. 培生教育. 2014: 第17页. ISBN 9781292025148. 
  4. ^ Atkinson, 1989年,第514页
  5. ^ Golub and Van Loan, §3.4.6
  • Atkinson, Kendall A. An Introduction to Numerical Analysis, 第二版, John Wiley & Sons, New York, 1989年 ISBN 978-0-471-50023-0
  • Golub, Gene H., and Van Loan, Charles F. Matrix computations, 第三版, Johns Hopkins, Baltimore, 1996年 ISBN 978-0-8018-5414-9
  • Lipschutz, Seymour, and Lipson, Mark. Schaum's Outlines: Linear Algebra, Tata McGraw-hill edition.Delhi 2001年, 第69-80页

参见

外部链接