矩阵乘法为什么定义为行乘以列?

  • 矩阵
  • 矩阵乘法
万子德·中国科学院大学
2016-02-11
阅读数24402



标题




学线性代数的时候,听着懵懵的,一上来老师就开始讲逆序数、行列式,周围的小伙伴们都在记定理,背公式。后来经常逛博客,逐渐了解了线性代数中的一些定理的意义,上中科院李老师矩阵论时,李老师又深刻讲了一遍,下面是李老师的总结,分享给大家。



对于矩阵,我们今天简单说一下矩阵的乘法。设两个矩阵\({{\bf{A}}_{m \times p}} = [{a_{ij}}]\)\({{\bf{B}}_{p \times n}} = [{b_{ij}}]\),定义矩阵\({\bf{C}} = {\bf{AB}}\)为矩阵\({\bf{A}}\)\({\bf{B}}\)的乘积,其中



\({{\bf{C}}_{m \times n}} = \left[ {{c_{ij}} = \sum\limits_{k = 1}^p {{a_{ik}}{b_{kj}}} } \right]\).



也就是说,矩阵\({\bf{C}}\)中每一个元素\({c_{ij}}\)为矩阵\({\bf{A}}\)的第i行与矩阵\({\bf{B}}\)的第j列相乘得到。这就是矩阵乘法的定义,在学习线性代数的时候,老师就是这么教的,而且大家也就这么习以为常,估计至今为止也没有人对这个定义有一点点的疑问。我的问题很简单,为什么矩阵乘法的定义是这样,而不是类似矩阵加法(对应元素相加)一样,矩阵的乘法定义为两个矩阵对应元素相乘?



相信每一个人被问到这个问题,都会说:“是啊,为什么?”那么下面我们就来说明一下为什么这样定义矩阵的乘法。



1855年,英国数学家Arthur Cayley (1821-1895) 把矩阵从行列式理论剥离出来,讨论了矩阵的相关运算,创立了矩阵理论。Cayley最早讨论矩阵相关运算是从线性函数开始的(矩阵和线性函数在某种意义上,可以一一对应的),比如下面两个线性函数:



\(f(x) = f\left( {\matrix{ {{x_1}} \cr {{x_2}} \cr } } \right) = \left( {\matrix{ {a{x_1} + b{x_2}} \cr {c{x_1} + d{x_2}} \cr } } \right)\),



\(g(x) = g\left( {\matrix{ {{x_1}} \cr {{x_2}} \cr } } \right) = \left( {\matrix{ {A{x_1} + B{x_2}} \cr {C{x_1} + D{x_2}} \cr } } \right)\).



复合这两个函数会得到



\(h(x) = f\left( {g\left( x \right)} \right) = f\left( {\matrix{ {A{x_1} + B{x_2}} \cr {C{x_1} + D{x_2}} \cr } } \right) = \left( {\matrix{ {(aA + bC){x_1} + (aB + bD){x_2}} \cr {(cA + dC){x_1} + (cB + dD){x_2}} \cr } } \right)\).



Cayley最早的想法是用矩阵表示这样的线性函数,即函数\(f,g,h\)可以分别表示为如下的矩阵形式:



\({\bf{F}} = \left( {\matrix{ a & b \cr c & d \cr } } \right),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\bf{G}} = \left( {\matrix{ A & B \cr C & D \cr } } \right),{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\bf{H}} = \left( {\matrix{ {aA + bC} & {aB + bD} \cr {cA + dC} & {cB + dD} \cr } } \right)\).



当然了,矩阵\({\bf{H}}\)也被成为矩阵\({\bf{F}}\)和矩阵\({\bf{G}}\)的复合(或乘积),即:



\(\left( {\matrix{ a & b \cr c & d \cr } } \right)\left( {\matrix{ A & B \cr C & D \cr } } \right) = \left( {\matrix{ {aA + bC} & {aB + bD} \cr {cA + dC} & {cB + dD} \cr } } \right)\)



这也正是我们现在熟知的矩阵乘积的定义。并且由于和线性函数的对应关系,使得这种定义更加实用。



相信,如果我们每一个人生活在19世纪——矩阵出现的时代,让你定义矩阵的乘法,你很自然地会想到用两个矩阵对应元素相乘来定义矩阵的乘法,毕竟这个是最自然、最直接的想法。但是它并不是最实用的。



大学的课程是不是很有意思呢?

别默默的看了,快来和大家聊聊吧,登录后回答问题~ 登录 立即注册
赛氪APP全新升级 反馈 下载
关注 微信公众号 关注赛氪订阅号 微信服务号 关注赛氪服务号
购物车
顶部
温馨提示

非常抱歉!本站不支持旧版本IE浏览器~~建议使用IE10/IE11/Chrome/Firefox/Safari等高级浏览器浏览。

温馨提示
温馨提示
帮助与反馈

热门问题