[整流与稳压] 如何理解矩阵特征值!

[复制链接]
1906|11
 楼主| xukun977 发表于 2017-4-12 14:52 来自手机 | 显示全部楼层 |阅读模式

学电路理论需要线性代数基础,而线性代数中,很多概念,如同迷浑阵一样,你什么推导都能看懂,但就是不知道它是什么意思!

本帖主题就是一例!大家非常熟悉Ax=λx,这都是什么意思?

 楼主| xukun977 发表于 2017-4-12 14:55 来自手机 | 显示全部楼层

关于这个理解,大家可以参考知乎上一篇专门**,这个人把**末尾那两本参考书上很多内容,都搞上来了,说的有点太多了!


https://www.zhihu.com/question/21874816

 楼主| xukun977 发表于 2017-4-13 08:46 来自手机 | 显示全部楼层
博士真能侃,一个2都能侃几天。。。

一,引子:二哲学与不二哲学

道家哲学谓三生万物,西洋哲人莱布尼兹

(Gottfried Leibniz,

ex nihil ducendis sufficit unum(自无导出万

物,一足矣),皆属谬误之论,前者失于过繁,

后者失于过简。以笔者所观数理哲诸般书籍而

论,二即一切,or two is involved in

everything of interest,才是正论。其实,老子

和莱布尼兹应该也是明了“二才是一切”的道理

的。老子在“三生万物”之后紧接着的一句是“万

物负阴而抱阳,冲气以为和”,而莱布尼兹说出

sufficit unum 是在他自易经悟出二进制数字

(binary number)对着0 (nihil)和1 (unus)的有感

而发,而不管是阴阳还是binary number,关键

词都是“二”。

二的影子散见于物理、数学各处,触手可及。

以英文而论,就有以two,binary,double,

second-order,rank-2,dual,以及字面是4

而实际在说2 的squared,

等词修饰的各种概念,此外还有interaction,

coupling,correlation这种暗含2 的概念。

有趣的是,人们似乎对2 都有嫌多的情绪。东

方有所谓的不二哲学,西方有强调整体的一元

论(monism)。一旦遭遇两种面目或者选择,人

们就会变得含糊、游移不定,中文谓之“有点二

乎”,西文的动词怀疑( 英语的doubt,

的zweifeln) ,形容词令人起疑的(dubious),其

字面上都是二。与二相关的各种概念,构成了

物理天地之大部分。
 楼主| xukun977 发表于 2017-4-13 08:49 来自手机 | 显示全部楼层
二,带平方的定律

拉丁语的4 是quattuor,这在法语的quatre (第

四,quatrième),意大利语的quattro ( 第四,

quartto),西班牙语的cuatro (第四,cuarto)

还都能看出来。方块有四角,所以谈论方形会

和4 联系起来是自然而然的事情。一个边长为x

面积为x 2 ,



的正四边形,

德语的说法是

英文就说是x squared。Square,



x quadrat,



其前缀为ex- (不同语言中有写成s-,es-,或者

é-的),意思为out;词干是动词quadrare,与

数词quattor 同源。x 2 就是x 的二次幂,中文读

成x 的平方,而平方按照字面理解就是平的方

块。

数的平方在数学和物理上足以带来充分多和充

分复杂的内容。在数学上,quadrature 因为历

史的原因就是求面积的意思。一个为人熟知的

squaring 问题就是squaring the circle ( 化圆为

方), 也称为quadrature of the circle,是古时

候一段时间里非常挑战智力的几何问题。有兴

趣的读者可以翻翻数学史关于这个问题的论

述。以y=kx 2 形式出现的物理定律有很多,比如

焦耳定律,电阻的功率和电流平方成正比;

自由(或者无摩擦沿着斜面)下落,下落高度(路

程)与时间平方成正比,下落高度与获得的速度

平方成正比,等等。其实,当年焦耳、伽利略

和Willem's Gravesande 分别得到这些定律时的

数据都是很粗糙的。但是,真实的科学就是这

样做的:当把两个数据的关联(correlation)画到

一张纸上时,人们首先看是否成线性关系;如

果不是,就会想到平方关系。这种数据之间的

线性或者平方关系只要大致有个差不多就

行了,才不需要在意有多大误差呢。由下落高

度与获得的速度平方成正比,Émilie du

Châtelet 女士引入了vis viva (活力),mv 2 ,这

个量,其后贝努里(Johann Bernoulli)引入了

因子1/2,这才有了1/2 mv 2 这种形式的动能概

念。

整数之于平方似乎情有独钟,方程x 2 + y 2 = z 2

有整数解,但换成x 3 + y 3 = z 3 或者更高次幂的

形式就没有整数解了,这就是所谓的费马大

定理。在近代数学家几百页的证明和费马所说

的书边角写不下的证明之间,我选择后者。即

便费马当时吹牛了,我也相信存在费马大定理

的简单证明。

人们初学物理时就会学到两个平方反比律

(inverse square law),一个是物体之质量造成

的牛顿万有引力f =Gm 1 m 2 /r 2 ,

电荷造成的库仑力f = 1/4πε 0 q 1 q 2 /r 2 。初

学时,觉得这两个力的表达可高深了。后来知

道,这只不过是强调了我们是生活在3D 空间这

个事实而已。在3D空间中,一个半径为r 的球

其表面积为S= 4πr 2 。任何一个物质流自一点各

向同性地向外辐射,其流是守恒的,则其流密

度总是和4πr 2 成反比(图1)。至于流的源对应的

物理量, 比如一颗桂花树上桂花的数目,同造

成的场之强度,比如在远处闻到的花香浓度,

可以引入一个比例因子(它的功能是平衡方程两

边的量纲,它的数值比较起来就不那么重要)从

而将它们写成一个方程的形式。把牛顿引力写

成f 1→2 = 4πG m 1 /4πr 2 m 2 的形式,库仑力写

成f 1→2 = 1/ε 0 q 1 /4πr 2 q 2 的形式,场的概念就

跃然纸上了,且由系数的选择能看出来后者要

比前者晚。后者理解了那4π 的来由,一个比例

因子1/ε 0 简洁轻便,而万有引力常数不得不经

常和4π 结伴而行,比如爱因斯坦引力方程R μv -

1/2 Rg μv = -8πGT μv 就有它的身影。

图1 平方反比律。图中公式的表达形式反映的

是笔者自己的理解

在一些文献中有库仑用挂在马槽上的铝球壳实

验得到库仑力表达式的说法。想想Charles-

Augustin de Coulomb 生活的年代(1736

—1806。为啥不译成“ 德·库仑”呢),马槽上的

铝球壳能得到什么精密的结果?更有甚者,验

证牛顿万有引力是否是严格的平方反比形式f

=Gm 1 m 2 /r 2 在某些地方堂而皇之地成为了实

验研究的课题。倘若依据所谓的精密的实验

数据,得到的牛顿引力形式为f

=Gm 1 m 2 /r 1.999****64 ±(18) ,库仑力形式为f

=1/4πε 0 q 1 q 2 /r 2.000000072 ±(23) ,这样的物理

学你愿意学?类似地,在动能定义1/2 mv 2

2 是整数,不是实数。对于

1/2 是分数,



中,



如今追求所谓的精确测量然后用计算机拟合曲

线的贋物理学家来说,他们的世界里动能的形

式说不定是这样的,E k =

0.499****72(±32)mv 2.0000000013(±27) 。这种丑

陋的公式如今随处可见,让人无语。

掀开了量子时代的面纱的是一个和自然数平方

有关的规律。氢原子在可见光范围内的光谱,

从右向左可见间距渐小的四条分立的谱线(眼尖

的读者可以看出第五条,等有了理论的帮助有

些人能看见第六条。见图2)。这分立的四条谱

线的波长分别为6562.10 Å ( 红色),4860.74

Å(绿色),4340.10 Å(蓝色)和4101.2 Å (紫色)。

1885 年,瑞士人巴尔莫发现这四个波长近似地

是常数值b=3645.6 Å的9/5,4/3,

8倍。进一步地,可将这四个分数写成3 2 /(3 2 -

4 2 /(4 2 - 2 2 ) ,5 2 /(5 2 - 2 2 ) ,和6 2 /(6 2 -



2 2 ) ,



2 2 ) ,这是公式n 2 /(n 2 - 2 2 ) 的n=3,

四项,由此可见光谱线是有规律的[1]。有了这

个公式,可以计算n=7 对应的波长为b∗7 2 /(7 2

- 2 2 ) =3969.6 Å,回头去看光谱图,这第5 条

谱线赫然就在那个地方。现在换个角度看,会

发现波数,就是波长的倒数,

R(1/2 2 -1/n 2 ),n=3,4,5…,其中的R ≈

10973****31 m -1 被称为里德堡常数。这个公式

后来被进一步扩展成更一般的形式v= R(1/m 2 -

1/n 2 ) ,其中m,n (>m) 都是正整数。1913

年, 玻尔看出了巴尔莫公式或者说里兹公式中

的奥秘,两项相减的光频率公式可以诠释为发

光是电子从一个能级到一个较低能级的跳跃过

程的伴随现象,光的能量量子为原子中两电子

能级之差。在经典角动量量子化的假设下,可

以得到氢原子中电子的能级确实是正比于1/

n 2 的。玻尔的原子理论完美地解释了氢原子谱

线(的位置)。量子力学的时代真正开始了。

图2 现代光谱学获得的氢原子在可见光范围的

光谱,可以清晰地看到五条谱线

四次方或四次方倒数形式的公式也有。前者有

Stefan—Boltzmann公式,谓黑体辐射积分能量

之体积密度正比于温度的四次方,后者是说两

平行板之间的Casmir 力与板间距的四次方成反

比。同样是公式,前者是扎实的物理,后者是

来自量子场论的比较率意的推导。后者被诠释

为来自真空零点能的神奇效应。当有个实验者

用扫描力学显微镜探针的振荡信号往这上凑,

说有一段是满足这个关系从而可能是来自

Casmir 效应时,这个不靠谱的结果反过来被一

些对实验不熟悉的人当成了救命稻草,被说成

了这个推导成立的实验证据。

 楼主| xukun977 发表于 2017-4-13 08:52 来自手机 | 显示全部楼层
3

二元数、两体势与相互作用

形容词binary,来自bis,放在名词前面表示该

事物made up of two parts or things,

twofold, double(由两部分组成的,或者是双

重的)。任何由两个单元组成的体系都是binary

system, 比如binary star system,即由绕重

心转动的两颗恒星组成的体系。两个通过万有

引力相互作用的物体的运行轨迹是经典力学的

标准问题。只考虑两个单元相互作用的碰撞是

binary collision。

只有两个数字0 和1 的数系是二进制数,英文为

binary numbers。在数学中一个拥有two-

component 的数是复数。复数定义为z = x + iy

,其中i 是单位虚数(imaginary number),ii=-

1,x 和y 都是实数,分别是复数的实部和虚

部。其实,没有理由认为这其中有什么古怪的

虚数,将复数z 看作是具有两个部分(part,

component) 的数,记为(x,y) ,



segment,



则只要满足算法(x 1 ,y 1 ) +(x 2 ,y 2 ) = (x 1 + x 2 ,

y 1 + y 2 ) ,(x 1 ,y 1 ) ×(x 2 ,y 2 ) = (x 1 x 2 - y 1 y 2 ,

x 1 y 2 + x 2 y 1 ) ,那就再现了复数的算法。可见,

所谓的复数,尤其是那个单位虚数i,带入数学

的是一种新的代数。这样的二元数,就是

binarions[2]。复数有两个单元,还暗含全新的

代数,这样我们就容易理解了,为什么一个扩

散型的方程∂ t C =D∂ x ∂ x C ,扩展成了i ∂ψ/∂t=

[ 2 /2m ∂ 2 /∂x 2 + V(x)]ψ 形式的复函数方程,现

在它被称为(1D)薛定谔方程,就演绎出了那么

多的幺蛾子。

物理上两粒子间的势能被选为如下形式的粒子

间距离的函数,即



而一个多粒子体系的总势能是两体势能之和,





这样的势能形式被称为binary potential,我

们的物理学中采用的都是binary potential。对

于三粒子体系, V = V 12 +V 23 + V 31 ;

存在三体势

的世界,物理是什么样儿的。

Binary potential 反映的是interaction的思想。

牛顿第三定律云:Actioni contrariam semper

et æqualem esse reactionem: sive corporum

duorum actiones in se mutuo semper

esse æquales et in partes contrarias dirigi(反

作用“总是相反”且等于作用,或者说两物体相

互间的作用总是相等且作用到相反的参与方)。

既然action 和reaction 是mutual 的,那就是在

谈论inter-action。相互作用不是粒子间影响对

方运动的游戏,而是其自身存在的方式。

认识到interaction 在物理学中的地位是物理学

上的一大革命。重力(gravity)问题,早期关切

的是物体的weight or lightness,此前被认为是

物体自身的性质。不知是否是航海贸易发现货

物重量莫名其妙的增减让人们认识到了物体的

重量是物体和地球两者的事情。

Interaction,在牛顿和库仑的力表示中,都落

实为物质(粒子)某个指标的乘法,后来引入的

关于基本粒子的强、弱相互作用也是换汤不换

药。这似乎能解释群论在物理学中的地位——

群论是只保留了乘法部分的代数。



4



二次型

前面已经说过,quadrature 与四边形和面积有

关。振子相位差为90°,即2π/4 ,从方位上讲

是从指向正方形的一边转到邻边,则被说成是

in quadrature。形容词quadratic

和quadrature,quadrate 同源,也被理解为平

方的意思。Univariate quadratic equation,

ax 2 + bx + c = 0 ,就是一元二次方程。如果一

个多项式的每一项都是二次幂的,

homogeneous polynomials of order two (二阶

齐次多项式),比如x 2 + axy + by 2 + cyz + dxz

+ z 2 ,这就是quadratic form (二次型)。二次型

对物理学具有特别的意义。

一个n-变量的二次型有标准形式q(x 1 ,x 2 …

x n ) = x T Ax ,其中A 是实的对称矩阵。矩阵A

总可以被对角化, 也就是说二次型总可以化成

只包含各个变量平方的形式,

λ 1 x 1 2 + λ 2 x 2 2 + + λ n x n 2 。如果再引入坐标尺

度变换,则总可以使得系数λ i 是1,

0。此三个值在一个给定二次型中各自的个数,

是这个二次型的标签(signature)。一个重要的

定律是Sylvester's law of inertia,它说的是一

个二次型的标签是变换的不变量[3],即将二次

型q(x 1 ,x 2 x n ) 变换成q( y 1 ,y 2 y n ) =γ 1 y 1 2 +

γ 2 y 2 2 + + γ n y n 2 形式, 系数λ i 和γ i 中总有相同

数目的1,-1,和0。

对于一个n-变量的空间,点到原点距离的平方

为λ 1 x 1 2 + λ 2 x 2 2 + +λ n x n 2 ,其中p个系数是

1,q个是-1,这样空间就可以标记为R p,q 。

对于具体的物理问题, 比如转动惯量矩阵,也

即将绕某方向的转动惯量表示成方向余弦的二

次型中的系数组成的矩阵,对角化后的本征

值,都是正的。当然,这是因为我们生活的空

间是欧几里得空间R 3,0 的原因。狭义相对论的

时空是R 3,1 ,点到原点距离的平方为-c 2 t 2 +

x 2 + y 2 + z 2 。不同空间其几何性质的不同,研

究一下距离平方为x 2 + y 2 和x 2 - y 2 两个2D世界

就能找到一点感觉,比如试着写出这两个空间

中表示矢量转动的矩阵。

只有两个变量的二次型是binary quadratic

form。谐振子的哈密顿量可写成H= q 2 + p 2 的

形式,是两变量的标准二次型。由麦克斯韦方

程组得到的电磁场的哈密顿量也是这样的标准

二次型,这是理解黑体辐射模型中引入谐振子

模型的关键。H= q 2 + p 2 形式的二次型和数学

意义上的x 2 + y 2 不同,物理的坐标q 和动量p

在量子力学中存在对易(共轭)关系[q,p] = i 。

由谐振子的哈密顿量形式可引入产生算符和湮

灭算符,这为谐振子的描述提供了一套别样的

语言,这套语言被肆意滥用到各种物理问题。

有人甚至断言说理论物理75%的天下不过就是

谐振子模型,那么理解H= q 2 + p 2 形式的二次

型之重要性就不言而喻了,只是这看似简单

的二次型所包含的数学还真不是一般人能掌握

的。即便是整数域上的binary quadratic form

x 2 + y 2 ,那也是数论的专门研究对象,是高斯

都要花点功夫的学问。

空间是有度规的连续统。没有连续就没有几

何,而度规(距离函数)则意味着二次型的计

算。空间的概念中,其实不是距离,而是某个

平方定义了距离,所以必涉及秩为2的度规张

量,其实就是上文中二次型表示中的对称矩

阵。狭义相对论中,距离微分的平方ds 2 = -

c 2 dt 2 + dx 2 +dy 2 + dz 2 又可以写为ds 2 =

g μv dx μ dx v 。这些是微分二次型,其变换不变

性研究想必更复杂[3]。广义相对论涉及关于一

般二次型度规空间的二次微分方程,不能够原

谅自己不理解的人那就要多花点功夫了!二

次型,微分二次型,以及它们的变换不变性,

都有系统的数学工具,这些系统的工具我们都

没掌握,想学到相关物理的精髓自然无从说

起。



5



二阶微分方程

牛顿发明了微积分。牛顿对物理学的贡献之

一,是确立了用second-order 微分方程描述物

理世界的基调。牛顿关于运动的第二定律

说Mutationem motus proportionalem esse vi

motrici impressae, et fieri secundum lineam

rectam qua vis illa imprimatur(运动的改变正

比于所受驱动力,且在驱动力所在的直线方

向上)。把运动的改变表示为坐标对时间的二阶

微分,而力被限制为是时空和速度的函数,则

牛顿第二定律可形式地表示为d 2 x/dt 2 = f (t,

x;dx/dt) ,这为此后的物理学定下了基调:

物理学的动力学定律采二阶微分方程(second-

order differential equation)的形式。为什么要

采取二阶微分方程的形式呢?因为一阶微分方

程太简单,而三阶微分方程太复杂。

麦克斯韦方程组关于电场和磁场的微分方程形

式看似一阶微分方程,因为那里只出现了电、

磁场关于时空的一阶微分

(differentiated once)。引入了标量的二阶微分

(differentiated twice)。这个二阶微分方程,注

定了观察者位置与观察者速度的被超越,因

此就有了相对论的两层意思——无去来处,动静

等观。量子力学的动力学方程为薛定谔方程

i ∂ t ψ =Hψ ,这是一个关于复函数的二阶微分方

程。因为H=p 2 /2m+ V(r) , 且根据量子化条

件p x = ih∂ x ,薛定谔方程是关于空间二阶关于

时间一阶的微分方程(扩散方程)。动能项的本

征值问题,即d 2 ψ/dx 2 + n 2 ψ = 0 ,为我们提供

了傅里叶分析出现的另一场景。有趣的是,我

们所谓的数学物理方程课,讨论的大多都是这

个本征值问题在不同维度、不同对称下的变

种,提供了可与三角函数类比的其它可作为正

交归一基的L 2 -范数的各种函数。笔者一直困惑

的是,为什么复函数的方程,其解的径向函数

似乎总是实函数,复数的性质只由角变量部分

来表现,太诡异了。

物理学的动力学方程为我们描绘了一个二阶微

分方程统治的世界。自然真的是由二阶微分方

程描述的吗?关于这一点,笔者有些含糊。自

然是否可以未经某些物理学家的同意就遵循更

高阶的微分方程或者干脆别的形式的方程呢?



6



二象性与对偶

Duality, 词根dualis 是2 的意思,汉译根据不

同的语境译为对偶性和二象性,有点拔高的意

味,其实就是“二乎”。比如,量子力学关于粒

子的本性就有波—粒子二象性(wave-particle

duality)的说法,一般教科书会诠释为既是粒子

又是波,因此还有wavicle (wave + particle)

的说法。笔者以为这种说法未说到点子上——我

们构造的波与粒子的形象是电磁波在频率标上

的两个极端。波长过百米的无线电波,怎么着

也难以想象它是粒子,而能量为MeV的γ 光

子,很难想象它会表现出什么波动性。居于两

个极端之中间地带的,比如可见光和X-射线,

就会同时表现出我们以为的那种波和粒子的特

性。特征X射线就同时有将其当做波的WDX

(wavelength dispersive X-ray analysis)分析模

式和将其当成粒子的EDX (energy dispersive

X-ray analysis) 分析模式;而可见光部分的所

谓量子力学实验中,有些实验者可能无意中在

实验路途的不同地带上不停地变换着关于电磁

波的认识。出现连续—分立二象性的地方是关

于量子力学的测量问题,一方面我们要求因为

测量诱导了一个量子事件,某个测量的结果以

恰当的几率突然出现;另一方面,对于一个孤

立的、未置于测量之下的体系,我们又要求体

系按照薛定谔方程连续地、决定性地演化着。

这种翻手为云、覆手为雨的手法对应一种

duality in dynamics(动力学二象性)。存在这

些有点儿“二乎”的观念,反映出量子力学是一

个四面透风的理论。

Duality 是数学中常遇到的概念,投影几何中把

点与线的角色对调,欧拉多面体公式中顶点与

面的对调,都是一种duality。数学中的矢量空

有一个对应的dual space (对偶空间)。以



间,



简单的代数对偶空间为例,对于定义在域F 上

的空间V,存在对偶空间V*,对偶空间V*中泛

函φ 和空间V 中的元素x定义一个非简并(退化)

的双线性(bilinear)映射φ(x) =<φ,x> :V* × V → F

。对于V 为有限维空间的情形,基为{e i },

空间V*有相同的维度,且可以构造相应的基

{e j }, 使得e i ⋅ ej = δ i j 。在固体物理学中,晶体

中原子占据的空间是离散的空
 楼主| xukun977 发表于 2017-4-13 09:09 来自手机 | 显示全部楼层

中科院曹则贤的科普**<物理学咬文>,挺不错的!纸质书太贵了,上网看看零星分散的免费**吧!

maychang 发表于 2017-4-13 09:40 | 显示全部楼层
中科院曹则贤的科普**<物理学咬文>,挺不错的!

还“挺不错的!”
库仑见过金属铝么?更不用说“铝球壳”了。

再过一阵子,这位曹则贤说不定还能说出库仑也研究了电流的磁效应呢!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

×
 楼主| xukun977 发表于 2017-4-13 10:38 来自手机 | 显示全部楼层
maychang 发表于 2017-4-13 09:40
中科院曹则贤的科普**,挺不错的!

还“挺不错的!”

俺是先看了这篇**,看后断定作者应该是博士级人物,!一搜作者,是中科院教授!

**侧重中英文差异,这一点是读文献较少的本科生要注意的。许多术语,看中文是一头雾水,看英文后恍然大悟!
当然了,**几个翻译不大好,比如 signature,他用的是词典中的本意了!


总之,这些**是动脑思考的结晶,只要动脑了,而非一味地背书,这种读书习惯就值得肯定!

batiafu 发表于 2017-4-13 15:59 | 显示全部楼层
 楼主| xukun977 发表于 2017-4-14 09:14 来自手机 | 显示全部楼层
转载篇考研得144分的的同学笔记:

---
先有特征值,还是先有特征向量

和很多大学生朋友一样,我也一直被线性代

数中的矩阵的特征值和特征向量的意义所困。

它似乎是先有公式,而后才有定义。就像有人

告诉你女人就是那个样子,抽象的你无法探究

为什么是这个样子。自己思索了一段时间,又

在网上查了哈相关的博客**,特征值与特征

向量的意义渐渐清晰起来。不揣冒昧,权且对

特征值和特征向量内涵探索的小打小闹。

也许我需要先提出几个问题。

特征值和特征向量是矩阵专有的特征?

特征值与特征向量究竟代表着矩阵的什么具

体特征?

矩阵本身代表着什么意义呢?

特征值与特征向量是**生蛋的关系,还是蛋

生**的关系?

矩阵的本质是什么

这是几个大问题,还有一些小问题是在搞懂这

些大问题之后产生并需要搞懂的。我们从公式

A·x = cx 入手。A是个矩阵,x也是个矩阵

(我们需要把x看作向量更有助于理解,写成

矩阵是为了 矩阵乘法运算规则的需要),c是

常数系数。我们寻找他们的意义,不可回避的

问题是从什么角度上找它的意义。物理,化

学,哲学,都可以有意义,但是那是在其他学

科中运用后的意义。其实,我们还是应该用数

学角度的意义去解释他们,才能更好的运用到

其他学科。那么,什么是数学角度呢?我的理

解是空间,一个n维空间,一维时已经可以解

释所有实数了,二维时可以解释所有复数了,

或者一个平面图形了。以此类推,数学就是放

在n维空间的基础上去解释问题。那好,先说n

维空间本身又具有什么特征呢?必须是n个相

互正交的维度。每个维度可以想像成一个坐标

轴,有正方向和负方向。向量是什么意义呢?

容易想象n维向量就是n维空间中的特定的方

向。一个向量就是一个方向。把A乘到x上,得

到一个方向未变但在长度上有伸缩改变的向量

(方向未变不准确,有可能变反向)。这是让

A乘以他的特征向量表现出来的性质。如果让

A乘以一个非特征向量y,显然会得到一个跟y

方向不同的向量(也许长度也会有伸缩)。这

是将矩阵乘到向量上向量所发生的改变。那

么,乘以一个矩阵似乎就对应一种变换。我们

暂时理解矩阵本质上就是n维空间上的一种变

换。显然还不够过瘾,你也许想矩阵怎么不对

应空间上一个实物,像向量那样?对,一定对

应,只是我们还需要将他找寻。我们喜欢用已

知探索未知,也许我可以假设你具备将某种未

知先当作一个特殊的已知的思维方式。我们把

矩阵先当作一种特殊的向量。我又要提问了,

向量a点乘向量b是个什么东西呢?是a在b上的

投影(为了方便理解,我们把投影约束为大

小,而不具备方向)。我们还需要约束一个重

要的概念,我们把方向在其所在维度上归一,

也就是一个单位向量。那好,方向就是单位向

量。 A·x = cx,左式即可理解为大小等于A

在方向x上的投影并且方向与x相同的向量。c

此时就是投影。重复一边,特征值就是投影。

矩阵有n个特征值(先假定各不相同),那么

就对应n的正交的特征向量,矩阵在各特征向

量上都有投影,大小等于特征值。现在可以回

答矩阵的实物意义了,那就是它的各特征向量

在n维空间上的组合,组合系数就是对应各线

性值。细心的朋友可能发现这个定义是在各特

征向量皆归一化的基础上的,也发现特征值一

定唯一,但特征向量因为标准定义规定的原因

可以不唯一,即可在归一化特征向量前面添加

任意不为零的系数。我苟且给出一「松式」:

n个不同的特征向量的方向 + 特征值大小的投

影 = 矩阵。到目前为止,我都假设的是矩阵A

有n个不同的特征值。上面的问题,前三个问

题基本有了答案,还差第4个问题。

那些特殊的特征值

暂没法解答,接着提出几个问题了:

矩阵的一定有n个特征值(算上重根),那么

对应的特征向量之间是什么关系了?

为什么会有重根,重根到底对应几个线性无

关的特征向量呢?

如果某特征值为0,那么说明对应的特征向量

上投影为0,那还有什么方向可言,可为什

么 A·x = 0 居然还有解了,即特征向量?

我们都发现这个现象,不关是什么样的矩阵,

不同的特征值对应的都是互相线性无关的特征

向量。而重根有可能对应线性无关的特征向

量,也可能都对应一个方向。这只是对上面问

题的解释。现在我们再来审视矩阵的几何意

义。特征值只是代表某特征方向上的投影(大

小),这样想来他们相不相等没有任何直接关

系,完全可以各自对应不同的特征方向,这只

是矩阵在他的某几个特征方向上的投影大小相

等而已。而重根对应同一个特征方向,又该如

何解释了?这个问题,暂时保留探讨。

关于特征值为0时,为什么有特征方向?我们

能说(0,y,z)就是(y,z)吗?显然不能,前者

说明在三个方向上定义某物,尽管其中一个方

向上没有作用,后者却只探讨某物在两个方向

的作用。定义的基础都不一样,自然不能完全

一样。矩阵的定义也是如此,可以看出方向较

之投影是先行特征,方向是与投影无关的一种

特性。

理解「特征」,轻松解题

到这里了,大部分问题已经解决了。也许,聪

慧的朋友们可以用上面的理解来解释问题或者

做题了。或者跟着我继续看看这些理解能怎么

做题。

前提:Ci是A的特征值,Xi是对应的特征向

量。

可逆A^(A逆)的特征呢?由 (A^)·A = E .A

逆只需要在原有的矩阵基础上将各特征方向

上的特征值取倒,同方向相乘,即可归一化

为投影为1.那就是说对A逆,1/Ci 对应 Xi。

转置A的转置的特质呢? 由A的转置的定义,

可以想象A转置是将A围绕原点做一个正交角

度的的旋转。那就是特征值没变,那特征向

量呢?可千万别秒杀说:必须也不变啊,因

为是旋转的是正交角度嘛。估计看到这篇文

章的都是学弟学妹,我苟且告诫你们,思考

问题一定不要想当然(我的这篇**也存在

一些想当然,因为量有点大,考验期间,时

间有限,无法考证,非常抱歉)。开始想象

在二维坐标空间里,两个垂直的向量a,b,

绕原点逆时针90度,那么最后新的向量a’肯

定与b方向相同,b'肯定与a方向相反(记

得,相反也约定为方向相同哦)。那么,对

矩阵A而言,如果其n个特征方向是正交的,

那么对A转置,就有Ci 对应 Xi。此时也说明A

转置就等于A(因为他们连几何意义即本质都

相等了)。这时候不难理解书上实对称矩

阵的那些性质了。而非对称矩阵的特征方向

组是一组线性无关但不互相正交的向来组。

在二维空间上,a,b线性无关却不垂直时,

旋转90度,显然得到仅仅是两个新的线性无

关的a',b'. 那么,对于矩阵A而言,如果其n个

特征方向仅仅是线性无关的,那么对A转置,

就有Ci 对应 一个新的Yi .

相似B~A, B的特征呢?B相似A等价于两者特

征值相同。刚才上面讨论过,特征值相同跟

特征方向没有任何直接关系,完全可以对应

不同的特征方向。所以,B的Ci并不对应Xi.

但是注意了,特征值相等是A和B相似的必要

条件,而非充分条件。那么就说矩阵相似,

除了特征值相等,特征向量之间应该还有某

种联系,只不过不一定相等罢了。那么是什

么关系呢?就是相似<=>特征值相等,以及A

的特征向量组和B的特征向量组等价。比如,

在n维坐标中,A和B特征值相等,但是A的特

征向量组可以与其中确定的n-1个维度的等

价,B的特征向量组等价于另n-1个维度。这

样A与B就不相似。

还有类似 (A + A^ - E) = 3E,为什么可

以带入Ci直接运算了?等等问题,都可以很

容易解释了,留给大家自己思考吧

伪文艺总结

最后,我来总结一下。简单点: 线性无关的方

向 + 相应的投影 = 矩阵 = 变换

如果将人生各阶段当作不同的维度 : n个不同

人生阶段 + 相应的能量 = 人生

------

 楼主| xukun977 发表于 2017-4-14 09:26 来自手机 | 显示全部楼层
这位同学理解的绝大多数概念,都是不靠谱的(不要盲信,切记!)!不过非数学专业本科生能理解这么多,已经不错了!

下面检个主要的说:
为何会有重根?重根的几何意义是什么?

 楼主| xukun977 发表于 2017-4-14 09:42 来自手机 | 显示全部楼层
特征根的几何意义是,线性变换前后,相应点长度之比!如此,变量之间就相互独立了,不用解相关的线性方程组了!所对应的矩阵作用是隔离!可见矩阵本身就是个数组而已,独立看这个矩阵是没有意义的,矩阵本质是变换更是无从谈起!
重根几何意义是退化!特征根的意义也是如此,但稍有区别!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

1897

主题

22577

帖子

295

粉丝
快速回复 在线客服 返回列表 返回顶部