Hung-yi Lee's Lectures(台大李宏毅老師系列課程)

link |

這邊我們要講Diagonalization,本來這邊有一些複習的投影片,我們就把它跳過,我們直接進入這一章的主軸。

link |

這一章要講什麼呢?這一章要講的就是,每一個matrix,不是每一個matrix,有一些matrix它可以做Diagonalization這件事,什麼叫做Diagonalization呢?

link |

Diagonalization的意思是說,你有一個diagonal的matrix,diagonal的matrix就是只有對角線有值的matrix,你有一個matrix D,它只有對角線有值,那你有一個matrix P,它是一個invertible的matrix。

link |

00:42.880

那有一些matrix A,你可以把它拆解成P乘上D乘上P-inverse,那這樣的matrix就叫做可對角化的,叫做Diagonalizable。

link |

00:58.120

那接下來呢,我們講完什麼是Diagonalizable以後,就會告訴大家說,我們怎麼確定一個matrix它是不是Diagonalizable的,然後進一步我們可以把D跟P找出來。

link |

01:10.320

這個對應到我們課本的5.3,那究竟對角化Diagonalizable這件事情到底有什麼樣的重要性呢?它的重要性是這樣子,我們說如果有兩個matrix是相似的,代表說它們是在不同的coordinate system下看待的同一個linear operator。

link |

01:31.920

那你會發現說,今天如果某一個matrix跟它是可對角化的,那意味著這個matrix A,它跟一個matrix D,一個diagonal matrix是similar。

link |

01:45.520

也就是說,今天這個matrix A如果它可對角化的話,意味著說在某一個空間,在某另外一個coordinate system下,在另外一個世界裡面,它看起來就是一個比較簡單的matrix,是一個diagonal matrix。

link |

02:00.880

那diagonal matrix很簡單嘛,就只有對角線的地方有值,其他地方都沒有值,所以diagonal matrix你是非常容易分析的。

link |

02:08.080

如果某一個matrix A它是可對角化的,那意味著說你可以找得到一個coordinate system,把它變成一個diagonal的matrix。

link |

02:16.320

所以這就是這個可對角化它的妙用所在,可以讓你輕易地把一個matrix轉成比較容易分析的樣子,也就是對角化的樣子。

link |

02:26.400

好,那首先第一件要告訴大家的事情就是,不是所有的matrix都可以被對角化的,那怎麼說呢?你只要舉一個例子,找一個matrix它不能夠被對角化就可以了。

link |

02:42.560

舉例來說,A等於零零零這個matrix,它是不能夠被對角化的,那怎麼證明它不能夠被對角化呢?當然你要證明它可以被對角化很容易,你就把它對角化就好了,找出一個例子就結束了。

link |

02:58.640

一個matrix其實可以有很多種不同的對角化的方式,它其實可以有很多種不同的對角化方式,不是只有單一的對角化的方式。

link |

03:07.480

反正找出一個對角化的方式,找出一個把A寫成P D乘以P inverse就結束了。但是如果要證明它不能夠被對角化就有點難,所以我們這邊需要用反證法,就是先假設這個matrix A它是可以被對角化的,然後再說這麼做會造成一些矛盾。

link |

03:29.720

那我們先假設matrix A它是可以被對角化的,所以matrix A你可以寫成P乘以D乘以P inverse,那A可以寫成P乘以D乘以P inverse,那A平方呢?A平方就可以寫成P乘以D平方乘以P inverse,對不對?

link |

03:46.240

這個應該沒有問題吧?就是A平方就是P乘以D乘以P inverse,我這個P都寫得很像D,希望你看得懂,然後把它乘兩次,把它再乘上P,再乘上D,再乘上P inverse,再乘上P inverse。

link |

04:07.200

那中間的P inverse跟P就可以消掉,D就變成乘兩次,所以把A乘兩次就等於P乘上D乘以兩次,再乘上P inverse。

link |

04:20.080

那但是其實我們是可以算出A平方的值的,A平方的值應該是0,為什麼A平方的值應該是0呢?因為A我們是知道的啊,A是0100嘛,你把0100乘兩次,你把0100再乘0100,你就手算一下,會發現說你算出來的結果是0,然後我們要用這個方法來製造矛盾,這個方法來製造矛盾。

link |

04:44.000

所以我們知道說A平方等於P乘上D平方乘以P inverse,我們又知道說A平方等於0,所以P乘以D平方乘以P inverse等於0。

link |

04:55.400

那接下來,因為P乘以D平方乘以P inverse等於0,所以你就可以左右兩邊分別乘上P inverse跟P,左右兩邊分別乘上P inverse跟P,0的左右兩邊也乘上P inverse跟P。

link |

05:11.080

那因為任何matrix乘以0都還是0,所以右勢等於0,左勢的話你就把P inverse跟P消掉,P inverse跟P消掉,剩下D平方,剩下D平方,所以你就知道說D平方等於0。

link |

05:28.680

那目前還沒有製造矛盾,我們就說D平方等於0。D平方等於0意味著什麼呢?D平方等於0意味著D等於0。為什麼D平方等於0意味著D等於0呢?因為你想想看,假設D只有對角線有值嘛,那假設它是一個3乘以3的matrix好了。

link |

05:52.040

那它對角線的值就是D1、D2,但這個要推廣到N乘以N是很容易的,它對角線的值就是D1、D2、D3。

link |

06:06.240

那我們現在來算一下D的平方,不是對角線的地方就是0,不是對角線的地方就是0。我們來算一下D的平方,把D乘以D。D乘以D的話會發生什麼事呢?因為今天只有對角線有值,所以D乘以D就等於對角線的值的平方。

link |

06:24.240

D乘以D的話會發生什麼事呢?因為今天只有對角線有值,所以D乘以D就會發生什麼事呢?因為今天只有對角線有值,所以D乘以D就會發生什麼事呢?

link |

06:36.740

好,那我們又說這個式子要等於0,這個D平方要等於0,那要怎麼讓D平方等於0呢?唯一的可能就是D1等於0,D2等於0,D3等於0,對不對?一定要對角線這個D1等於0,D2等於0,D3等於0,那D平方才有可能等於0。

link |

06:56.040

所以我們知道說D1、D2、D3既然等於0,對角線的地方都等於0,那意味著D是等於0的。那D等於0這件事情就會造成矛盾,為什麼D等於0這件事情會造成矛盾呢?

link |

07:07.740

因為我們說A等於P乘以D乘以P-1,如果這個D等於0,那A就會等於0了,所以就造成矛盾,但其實我們知道A不等於0,所以這就是一個矛盾的狀況。

link |

07:21.740

所以說我們今天舉一個反例告訴你說,有一些matrix它其實是不能夠被對角化的,有一些matrix是不能夠被對角化的。

link |

07:31.740

好,那我們接下來就是要看說,如果A是可以被對角化的話,那到底P、D、P-1裡面到底放了些什麼東西?那從這個地方開始,這個diagonalizable和對角化這件事情就跟eigenvalue、eigenvector扯上關係了。

link |

07:55.240

好,怎麼說呢?假設我們已經確定A可以被寫成P乘以D乘以P-1,接下來我們要問的事情就是,在P裡面應該放什麼值?在D裡面應該放什麼值?P的column還有D的對角線的值到底有什麼樣的特性?

link |

08:11.240

好,我們知道P的n個column就是P-1到P-n,D的對角線的值我們就寫作D-1到D-n。那我們現在可以把左右兩邊都乘上P,把左右兩邊都乘上P,把左右兩邊都乘上P,我們就可以寫出AP等於P乘上D。

link |

08:33.240

那AP等於什麼呢?AP就是把P的每一個column P-1到P-n前面都乘上A,這個就是AP,這個就是矩陣乘法,講矩陣乘法的時候講過了。

link |

08:47.240

那PD是什麼呢?PD就是我們可以把D寫成它的第一個column,就是D-1這個scalar,這邊D-1到D-n是scalar,它們不是matrix,D-1或者是vector,D-1到D-n是scalar,是一個數值。

link |

09:03.240

那E-1到E-n是vector,是standard vector,standard vector就做一維式E-7-R-4-0。所以今天這個D這個matrix,它的第一個column你就可以寫成D-1乘上E-1,到最後一個column你就可以寫成D-n乘上E-n,然後前面再乘P。

link |

09:22.240

把P乘上進去,所以PD等於P乘上D-1乘上E-1,到P乘上D-n乘上E-n。然後接下來,因為D-1到D-n它們是數值,所以我們把它拿到最左邊去,所以P乘上D可以看成D-1P-E-1,可以看成D-nP-E-n。

link |

09:43.240

好,那接下來呢,如果我們把P乘上E-1,那我們說每一個matrix乘上standard vector就變成那一個matrix的column,所以P乘上第一個standard vector就等於它的第一個column。

link |

10:00.240

P乘上最後一個vector,D-n的vector,它就得到它的第N個column。那現在每一個columnP-1到P-n前面都會乘三個數值,D-1到D-n。

link |

10:14.240

那我們知道說,現在AP是等於PD的,所以A乘上P-1會等於D-1乘上P-1,到A乘上P-n會等於D-n乘上P-n。那這告訴我們什麼?這告訴我們說,其實P就是eigenvector,而D就是eigenvalue。

link |

10:38.240

因為我們現在知道說,A乘上P-I會等於D-I倍的P-I。那這個是什麼?回憶一下我們前一節課講過的eigenvalue跟eigenvector,我們說eigenvector就是A乘上V等於λV,那現在V就是eigenvector,λ就是eigenvalue。

link |

10:58.240

而現在根據diagonalization的式子,我們知道說今天P跟D中間有這樣子的一個關係,所以P就是eigenvalue,P就是eigenvector,D就是eigenvalue。

link |

11:14.240

所以當你把一個matrix A做對角化的時候,當你把一個matrix A做對角化的時候,所有放在P裡面的column,P的這些column就是eigenvector,而放在對角線的,放在D這個matrix,對角線的這些數值就是eigenvalue。

link |

11:36.240

所以這個就是對角化跟eigenvalue和eigenvector之間的關係。講到這邊,大家有沒有問題要問的呢?如果沒有的話,也許我們講到這邊是正好告一個段落,所以我們今天就講到這邊,我們就下課吧。

link |

11:57.240

我們來上課吧,然後這個diagonalization這部分的投影片有更新過,你可以重新去課程網頁上載一下新的投影片。

link |

12:19.240

複習一下上週講的東西,上週我們講了eigenvector跟eigenvalue,然後我們就給了eigenvector跟eigenvalue的定義,然後注意zero vector它不是一個eigenvector,然後我們講了這個eigenspace是什麼東西。

link |

12:39.240

然後我們告訴大家說,假設給你一個eigenvalue lambda,那對應這個lambda的所有的,對應這個eigenvalue lambda的所有的eigenvector,就是a減lambda i n乘上b等於0,這個homogeneous equation的nonzero solution,那注意是nonzero solution,因為zero vector它並不是一個eigenvector。

link |

13:07.240

所以你今天給你一個lambda,給你一個eigenvalue lambda,你要找出它對應的eigenvector怎麼做呢,你就找出a減lambda i n這個matrix的null space,然後減掉zero vector。

link |

13:23.240

或者是我們這邊有一個新的定義告訴你說,lambda的eigenspace是什麼呢,lambda的eigenspace,lambda的eigenspace就是a減lambda i n這個matrix的null space。

link |

13:38.240

然後告訴大家怎麼找給你一個matrix,怎麼找出它所有的eigenvalue,這個是上週講過的東西,然後我告訴大家說有一個東西叫characteristic polynomial,那characteristic polynomial它的根就是這個matrix的eigenvalue。

link |

14:02.240

那characteristic polynomial是什麼呢,它就是a減t i n的determinant,這個多項式的根就是這個matrix a的eigenvalue。

link |

14:15.240

那假設你把這個多項式做因式分解,它可以寫成t減lambda 1的n1次方,t減lambda 2的n2次方,到t減lambda k的nk次方,那可能有一些項你是解不開的,它是沒有辦法被分解,它對應到的是虛根,它沒有辦法被分解。

link |

14:37.240

好,那如果你可以把這個characteristic polynomial拆解成下面的樣子,那你就可以看出說這個matrix a呢,它有lambda 1到lambda k這k個不同的eigenvalue。

link |

14:51.240

那我們說每一個eigenvalue呢,它對應到一個eigenspace,那你可以計算這個eigenspace的dimension,你會知道說每一個eigenvalue它對應的eigenspace有多大。

link |

15:06.240

那這邊每一個eigenvalue,lambda 1到lambda k的eigenspace呢,我們就把它寫作d1到dk。

link |

15:15.240

好,這邊有一個東西呢,我們沒有證明的是這個eigenspace的dimension一定會小於等於characteristic polynomial分解以後,對應到這個eigenvalue的那一項的指數項。

link |

15:36.240

這個指數項叫做multiplicity,也就是說,t減lambda 1的指數項是n1次方,那lambda 1的eigenspace的dimension就小於等於n1。

link |

15:48.240

那t減lambda 2,它是乘上n2次方,那d2就會小於等於n2,以此類推。

link |

15:56.240

那這個我們今天先不證明,這個以後我們有空再證明,我們先把需要講的內容都講完,再來證這些東西。

link |

16:07.240

那這個聽起來還蠻神妙的,你就先把它記起來就好,我覺得這個是從直觀上非常難想像出來的一個定理,你就先把它背起來。

link |

16:22.240

好,接下來我們講了一個東西叫做對角化,那對角化的意思是什麼呢?

link |

16:30.240

對角化的意思是說,我們可以把一個matrix A拆解成三個矩陣相乘,中間的這個矩陣是一個diagonal的矩陣,它只有對角線有值,其他地方都是0。

link |

16:44.240

那前面乘上一個matrix P,這個matrix P不是一個隨隨便便的matrix P,它是一個invertible的matrix P。

link |

16:54.240

你把左邊乘上一個P,右邊乘上一個P inverse,那這個會等於A,那如果A可以拆解成P乘以D乘以P inverse的話,我們說A是可以被對角化的。

link |

17:09.240

好,那這個部分對應到課本的5.3,那我們上週也講過說,不是所有的矩陣都可以被對角化,那這邊就舉了一個例子告訴你說,這個矩陣是某一個,找一個矩陣出來告訴你說,它是不能被對角化的。

link |

17:26.240

好,那假設A可以被對角化以後,A可以拆解成P乘以D乘以P inverse以後,我們上週也講了說,那P的column有什麼樣的特質,那這個D的對角線的那些value有什麼樣的特質。

link |

17:44.240

那我們上週經過一番證明以後,我們說什麼呢?我們說這個P的column跟D的對角線上的值,其實跟eigenvector eigenvalue是非常有關係的,這就是為什麼我們在講完eigenvector eigenvalue以後,接下來要講對角化。

link |

18:02.240

好,那如果我們之後,我們等一下還會講一下這個對角化有什麼樣的含義,那我們現在先告訴你說,A可以拆解成P,D乘以P inverse,那你可能會有一個問題是說,為什麼閒著沒事要把A拆解成P乘以D乘以P inverse呢?那這個等一下會講這個東西的應用。

link |

18:20.640

好,那這邊想要告訴大家的是,假設我們可以把A拆解成P乘以D乘以P inverse,那這個P啊,這個P啊,它的每一個column,這個P的每一個column都是eigenvalue,不是說錯了,P的每一個column都是eigenvector,說錯了,不是eigenvalue,都是eigenvector。

link |

18:44.640

然後D的對角線的這些值,就是P的每一個column這些eigenvector所對應的eigenvalue,然後注意一下,因為P是invertible的,所以這意味著說,這些eigenvector通通都是independent的。

link |

19:08.160

就如果P的column不是independent的話,它就沒有辦法被invertible,它就沒有它的inverse,P既然有它的inverse,意味著它每一個column都是independent的,那意味著說,今天我們找到了n個eigenvector,這eigenvector是independent。

link |

19:26.800

要注意一下,就是我們隨便拿一個matrix的兩個eigenvector出來,並不代表說它一定會是independent的,對不對?因為我們之前講過說,假設有一個vector v,它是一個eigenvector,那這個vector兩倍2v,它其實也會是一個eigenvector。

link |

19:48.840

因為假設我們把a乘上v,會等於lambda v的話,那我們把a乘上2v,也會等於lambda v的2v,這告訴我們說,並不是所有的eigenvector通通都是independent的,很多的eigenvector是dependent的。

link |

20:13.640

但是,我們今天如果要把一個matrix做對角化的話,我們必須找出n個independent的eigenvector,我們在這邊註明一下,它是independent的eigenvector和independent的eigenvector。

link |

20:28.840

好,那這個就是我們剛才說過的,今天我們可以把一個matrix對角化,意味著什麼呢?意味著說,我們找得到n個eigenvector,這n個eigenvector它們形成了一個invertible的matrix,這意味著說,我們找得到n個它是independent的eigenvector。

link |

20:58.160

找得到n個independent的eigenvector意味著什麼呢?我們現在就只是換句話說,我們說有n個independent的vector,它就可以span整個Rn,就是你找到n個independent的vector,你在n維的空間中找到n個independent的vector,

link |

21:21.280

這n個independent的vector就是我們所在的整個空間Rn的basis,就是Rn的basis,你找到n個independent的vector,它就是Rn的basis,所以A的eigenvector它可以形成Rn的basis,如果A是可以被對角化的話。

link |

21:41.720

好,那所以今天假設給你一個matrix A,你要把它對角化的話,你會怎麼做呢?你的做法就是,我們先找出n個independent的,Li這邊是independent的縮寫,Li就是linear independent,先找出n個independent的eigenvector,如果有可能的話,當然有可能找不到n個independent的eigenvector,

link |

22:11.680

所以找不到n個independent的eigenvector的話,代表這個matrix它是沒有辦法被對角化的,如果它可以被對角化的話,你必須可以找得到n個independent的eigenvector,假設我們找到n個independent的eigenvector,我們就找到了P,

link |

22:29.840

好,那這n個independent的eigenvector,它們每一個人都對應到一個eigenvalue,那所以你把這些eigenvalue拿出來,你就找到了diagonal的matrix D,對角化的過程就這麼簡單,找出n個independent的eigenvector,你就找到了P,然後接下來找出每一個eigenvector對應的eigenvalue,你就找到了D。

link |

22:53.000

好,那接下來要告訴大家一件很重要的事,那要怎麼去找n個independent的eigenvector呢?

link |

23:06.000

這邊有個很重要的事情就是,如果今天那eigenvector對應到不同的eigenvalue,那它們就會是independent的,對應到不同的eigenvalue的eigenvector,它們是independent的。

link |

23:26.000

也就是說,假設我們現在把一個matrix A的characteristic polynomial做這個因式分解,然後寫成這個樣子,然後我們知道說它有k個eigenvalue,浪達萬到浪達k,那我們說這k個eigenvalue,每一個eigenvalue都有一個eigenspace,每一個eigenvalue它背後都有一大堆的eigenvector,那這些eigenvector彼此之間都是independent的。

link |

23:55.000

也就是你從浪達萬的eigenspace取出一個eigenvector,從浪達q的eigenspace取出一個eigenvector,從浪達k的eigenspace取出一個eigenvector,那它一定會是independent。

link |

24:15.000

對應到不同的eigenvalue的eigenvector,它一定會是independent。所以一個矩陣能不能夠被對角化,假設你今天發現有一個matrix,這個我們等一下會再細講,假設你今天發現有一個matrix,它正好有k個不同的eigenvalue,那你一定其實就找得到k個independent的eigenvector,對不對?

link |

24:44.000

因為不同的eigenvalue,它的eigenvector都是independent的。如果你今天要把一個矩陣做對角化,你需要找出n個independent的eigenvector,只要這個matrix有n個不同的eigenvalue,你就一定可以找出n個independent的eigenvector。

link |

25:06.000

但並不代表說你今天的eigenvalue的數目小於n,你就一定找不到n個eigenvector,因為其實也有可能你今天從同一個eigenspace裡面取兩個vector出來,它們仍然是independent的。

link |

25:31.000

這件事情是有可能的。它們可能是dependent,也有可能是independent,所以我這邊打一個問號。它們可以是dependent的,也可以是independent的,就是你從同一個eigenspace裡面取兩個vector出來,它們可以是dependent的,也可以是independent的。

link |

25:53.000

假設今天你知道這個eigenspace的dimension是d1,那你其實最多只能找到d1個independent的vector。但是如果你今天你的vector是從不同的eigenspace取出來的,那你就可以非常放心地說它們一定會是independent的,就是這樣。

link |

26:18.000

接下來就是稍微做一下證明。其實這個證明跟課本的證明是一模一樣的,也許你可以想一個更好的證明,說不定這個證明好像我覺得沒有特別特別好。

link |

26:34.500

這個證明是這個樣子,這個證明是說要用反證法,就是假設所有的,我們現在假設對每一個eigenvalue,λ1到λn,我們都有一個eigenvector,v1到vn,那方才我們有說過,照理說v1到vn都會是independent的。

link |

26:57.400

我們現在是先在證明的過程,就是先假設它是dependent,然後說這件事情會製造矛盾。

link |

27:05.700

好,那如果v1到vn是dependent的話,那意味著什麼?那意味著說,如果v1到vn是dependent的話,那意味著說你可以找得到某一個vector vk,vk是v1到vn裡面的其中一個vector。

link |

27:26.000

這個vk它會是v1、v2到vk-1的linear combination,那這個就是linear dependent的性質,dependent的性質就是這個樣子。

link |

27:45.000

那這邊呢,我們假設v1到vk-1它其實是independent的,v1到vk-1它是independent,那你可能會問說,我們做這個假設合理嗎?做這個假設是合理的。

link |

28:06.180

因為今天呢,如果v1到vk裡面有人是dependent的,就它是別的vector的combination,那我們就可以把那個vector拿掉,然後可以組出那個vector的其他vector的係數改變。

link |

28:26.640

所以這邊你可以找到一組,就假設v1到vn是dependent的,那你可以找到一組vector v1到vk-1,它們是independent的,那它們做linear combination以後,會變成這個set裡面的某一個vector vk。

link |

28:46.800

那今天既然它們是eigenvector,我們就要用到一下eigenvector的性質,所以我們把左右式兩邊通通都乘上matrix A,然後依照eigenvector的性質,A乘上vk就等於λk vk,A乘上v1就等於λ1 v1,A乘上v2就等於λ2 v2,A乘上vk-1就等於λk-1 vk-1,以此類推。

link |

29:15.860

那接下來我們把上面這個式子,左右兩邊都乘λk,等於什麼事都沒有做,左右兩邊都乘λk。

link |

29:28.980

接下來把這個式子減掉這個式子,把這個式子減掉這個式子,看看我們會得到什麼。所以左邊的式子等於0,左邊的式子等於0。

link |

29:46.820

右式就是C1乘上λ1-λk乘v1加上C2乘上λ2-λk乘v2加到Ck-1乘到λk-1-λk乘上vk-1。

link |

29:59.320

那我們剛才有講說這個v1到vk是independent的,但是今天因為這個vector set它是dependent的,所以C1到Ck-1不全為0。

link |

30:25.640

這邊還有位置寫嗎?C1到Ck它們不是全為0的。

link |

30:38.640

所以今天這兩個條件,這兩件事情會導致矛盾,v1到vk-1它們是independent,然後C1到Ck-1不全為0。

link |

30:54.580

那意味著什麼呢?意味著說今天λ1-λk到λ2-λk到λk-1-λk裡面,其中一項必須是0。

link |

31:18.360

因為現在v1、v2到vk-1它們前面乘的這些係數,前面乘的這些係數,前面乘的這些係數,前面乘的這些係數,必須全部都是0。

link |

31:31.600

為什麼前面乘的這些係數必須全部都是0呢?這是來自於這個v1到vk-1是independent這件事情,然後我們又知道說C1到Ck-1不全為0。

link |

31:42.760

那意味著說,括號裡面的λ1-λk、λ2-λk到某一項λk-1-λk裡面,其中一項必須是0。

link |

31:50.860

這就跟我們一開始的假設矛盾,因為我們應該是,這n個eigenvalue應該是不一樣的,所以造成矛盾。

link |

32:01.100

那如果這個地方你沒有辦法跟上的話就算了,你就記得說,反正不同的eigenvalue,它們的eigenvector一定是independent的。

link |

32:15.100

好,那今天我們知道這件事以後,我們就可以根據我們剛才講的不同的eigenvalue,它的eigenvector是independent的這件事情,來知道說一個matrix有沒有可能被對角化。

link |

32:32.860

所以今天假設你要知道一個matrix能不能夠被對角化,你就先把它的characteristic polynomial寫出來,然後你就可以把它的eigenvalue通通都找出來,然後你就可以把它的eigenspace通通都找出來。

link |

32:48.540

接下來你就把每一個eigenspace裡面的basis找出來,也就是你從每一個eigenspace裡面找出最多的independent的vector。

link |

33:07.220

就我們說,你從這個space裡面找出來的vector,它們還是有可能是independent的嘛,就算是同一個eigenspace裡面的vector,還是有可能是independent的,所以從每一個eigenspace裡面找出最多的independent的vector。

link |

33:22.740

那你最多可以找出多少呢?你就是找出basis那麼多個,就假設這個eigenspace的dimension是3,那你就最多找到三個independent的vector。

link |

33:33.380

那這三個independent的vector會是這個eigenspace的什麼東西呢?就是這個eigenspace的basis。

link |

33:42.340

所以我們把每一個eigenspace的basis通通都找出來,把這些所有的basis放在一起,它們一定都會是independent,因為basis裡面的vector它都是independent的。

link |

33:59.460

那basis和basis間的vector,當然我們任意拿兩個basis出來,它們裡面的vector不一定是independent的啊。

link |

34:05.860

但是現在我們剛才有講過說,eigenvalue、eigenspace特別的地方就是,不同的eigenvalue對應的eigenvector一定是independent的,所以把所有的basis拿出來拼成一個set,這裡面所有的vector都會是independent。

link |

34:19.780

接下來,如果這個set裡面的vector的數目,假設A是一個nxn的矩陣,假設A是一個nxn的矩陣,如果這個independent的vector set裡面有n個vector,那它就可以被對角化。

link |

34:38.980

那如果少於n個vector,那就沒有辦法被對角化了,就這樣。那可能問說,那有沒有可能大於n個vector呢?假設A是一個nxn的矩陣,有沒有可能大於n個vector呢?

link |

34:59.300

你覺得有可能大於n個vector的同學舉手一下。有可能大於n個vector,而你覺得不可能大於n個vector的同學舉手一下。很多同學覺得不可能大於n個。

link |

35:14.140

為什麼不可能大於n個呢?你仔細想想看,A是一個nxn的矩陣,所以這些P,你從一個角度來看,這些P的長度都是n,它是n微空間中的矩陣。

link |

35:32.260

在n微空間中,你其實不可能找出超過n個independent的vector,不是嗎?所以今天這個set最大也就是n而已,不可能再更大。

link |

35:46.100

然後再來,你從另外一個角度來看,我們之前有說characteristic polynomial,這個characteristic polynomial,它的order,最高次,它的order就是n。

link |

36:07.860

它order是n意味著什麼?代表n1加n2加nk,這個加號我不好寫,大家知道我要講加號,叫做n1、n2加到nk,它一定是小於等於n的。

link |

36:22.900

為什麼是小於等於n呢?因為你會有一些部分是無法做因式分解,無法拆解開來的,所以n1加n2加nk是小於等於n的。那我們又說,eigenspace的dimension,d1一定小於n1,

link |

36:41.580

黃色這個區域的dimension,d2一定是小於等於n2,dk一定是小於等於nk。

link |

36:52.780

所以你把d1加上d2,再把d2加到dk,全部加起來,它也一定是小於等於k的,n的。因為n1到nk它就已經小於等於n了,所以d1加到dk它更是小於等於n。

link |

37:09.820

所以,既然d1到dk小於等於n,我們這邊就不可能找出超過n個independent的eigenvector。

link |

37:23.060

好,那接下來就是實際舉一個例子告訴大家說,做對角化的話長什麼樣子。

link |

37:29.540

我們現在有一個matrix A,如果你要把它做對角化的話,那怎麼做呢?你先把它的characteristic polynomial劃出來,先把它的characteristic polynomial列出來。

link |

37:42.260

那怎麼列它的characteristic polynomial呢?你就把對角線的值都減t,減t,減t,然後減t。

link |

37:52.300

好,都減完t以後呢,你就把它的determinant算出來,把determinant算出來,套一下3乘以3的matrix的公式,把determinant算出來。

link |

38:01.260

算出來以後呢,發現說它長的是這個樣子,負t加1平方乘以t減3,所以它有兩個eigenvalue,就是3和負1。

link |

38:11.500

它雖然只有兩個eigenvalue,如果它有三個eigenvalue,你就可以一秒鐘說它可以被對角化。

link |

38:18.700

因為有三個eigenvalue,你一定就找到三個independent eigenvector,所以就一定可以把A對角化。

link |

38:23.740

那現在問題是,它只有兩個eigenvalue,它一定不能被對角化嗎?倒不一定,因為有些eigenvalue,你搞不好找得到不只一個independent eigenvector。

link |

38:33.180

所以現在你看到它有兩個eigenvalue,那你就要實際去找一下,每一個eigenvalue對應的eigenspace裡面有幾個independent eigenvector。

link |

38:43.900

所以我們先看eigenvalue3,然後接下來你就去找eigenvalue3的eigenspace。

link |

38:51.740

那怎麼找eigenspace呢?這個我們就不要重複算這個比較冗長又無聊的東西。

link |

38:57.260

這個eigenspace就是A減3in的null space,對不對,A減3in的null space。

link |

39:11.340

那怎麼找null space呢?之前我們都已經講過了,這個是null space,我寫一個null代表null space,這個null space就是eigenvalue3的eigenspace。

link |

39:32.300

那你就做一做以後發現說這個null space,這個eigenspace它的basis就是011,其實它的basis一定只有1,它的basis的dimension一定是1,因為它這邊的次數是1次。

link |

39:50.860

所以dimension一定要小於這個次數,所以它的dimension一定是1。

link |

39:55.500

那如果是eigenvalue-1的話,因為這邊的次數是2,所以eigenvalue-1對應到的eigenspace它有可能是有dimension等於1,有可能dimension等於2,我們不知道,你要實際解一下它的eigenspace。

link |

40:12.620

那我們知道它的eigenspace就是null,我這邊想要寫一個null,然後那個A減掉-1倍的in,也就是A加上in。

link |

40:32.860

那你就實際的計算一下發現說,它的dimension等於2,然後它有兩個,它的basis長這個樣子,它basis裡面有兩個vector。

link |

40:44.620

接下來你就把這三個vector,011,100,01-1,011,100,01-1,拿來排成一個metric,排成P。那011,100,01-1這三個vector,它們對應的eigenvalue分別就是3-1-1,就結束了。

link |

41:09.900

那有可能會問說,這個順序一定要先011,100,01-1嗎?我能不能把順序改成100,011,01-1,我能不能把這個順序顛倒一下?

link |

41:26.620

可以,順序顛倒一下,這個P不就不一樣了嗎?變成P',這個P變得不一樣了,那A怎麼還會是一樣的呢?但是你想想看,首先P不一樣了,那你的P'的inverse其實也不一樣了,對不對?

link |

41:50.140

如果你把這三個metric的順序改變,那你的P變成P',你它的inverse其實也不一樣了,那你的D其實也不一樣了,D其實也不一樣了,變成D',但是這個P'乘D'乘上P'的inverse,它還是會等於A就是了,它還是會等於A就是了。

link |

42:08.540

好,那這邊來講一個diagonalization的應用,就假設我們這邊有一個metric A,我們發現說它可以被對角化,變成P乘上D乘以P inverse,那我們其實就可以秒算把A連成N次的結果,就可以秒算把A連成N次的結果,為什麼呢?

link |

42:35.820

因為如果我們今天把A乘上A,會等於什麼呢?如果我們把A乘上A,會等於P乘以D乘以P的inverse,那A乘上A等於P乘以D乘以P的inverse,再乘上P乘以D乘以P的inverse,P乘以D乘以P的inverse。

link |

42:59.300

然後中間的P就可以把它消掉,中間的P跟P inverse就可以把它消掉,所以變成D就連成兩次,所以你把A連成兩次就變成P,D連成兩次P inverse,所以A連成N次就變成P,D連成N次P乘上inverse。

link |

43:20.740

那D連成N次它是非常容易被計算的,D連成N次是非常容易被計算的,我們把手機關掉,我們把它轉成靜音,就不會吵到我們了。

link |

43:42.820

那我們把這個D,A連成N次,就是D連成N次。

link |

43:52.180

接下來我們要問的問題是什麼呢?接下來我們就是舉一個例子說,我們什麼時候會需要把一個matrix連成N次,那這邊我們就舉一個例子,那這個例子其實就是在描述你的人生這樣子。

link |

44:10.260

那你知道說你每天活在世界上,你就是做各種不同的事情,你就處於各種不同的狀態,有時候你是處於一個念書的狀態,然後有時候你是會處於一個使用FB的狀態。

link |

44:27.540

那假設說你的人生就是在念書和使用FB之間的做遊走,你就是只有這兩個狀態,這就是state,你的人生就是兩個state,一個是念書的state,一個是使用FB的state。

link |

44:45.820

然後你從念書的state跳到FB的state以後,你就會一直在那個loop裡面,你就沒有辦法出來,你就會一直在FB上面,就被黏住了,你就沒有辦法出來。

link |

44:55.900

但是你其實還是有小小的機率可以從FB的state跳到念書的state,你有可能會一直持續在念書的state,直到你接下來跳到FB的state。

link |

45:07.100

那從一個state跳到另外一個state中間,它是有一個機率的,你說怎麼可能在前一秒鐘念書,下一秒鐘念書的機率是85%,然後從念書再跳到FB的機率是15%。

link |

45:19.740

那其實你在前一秒鐘看FB,下一秒鐘再看FB的機率可能非常高,比如說97%這樣,你只有3%的機率從FB跳回念書。

link |

45:29.760

那這個就是描述大家人生的狀態,講究你的人生其實就是這個樣子。

link |

45:35.240

那我們知道上面這個定理以後有什麼用呢?它可以幫你計算說,假設現在到地球毀滅為止,你最後會在看FB的機率有多少,你最後會在念書的機率有多少。

link |

45:56.420

那假設你一出生的時候,你是處於一個念書的狀態,接下來你出生後的下一秒,你就會有85%的機率仍然在念書,你就會有15%的機率去看FB。

link |

46:11.900

然後在你出生後的第二秒,你就會有…所以在你出生的第一秒,就假設有人觀察你出生的第一秒,會發現說你有85%的機率可能在念書,你有15%的機率正在使用FB。

link |

46:24.360

然後在你出生後的第二秒,這個時候你就有0.85乘以0.85加上0.15乘以0.3的機率是念書,就是你在念書你有可能繼續念書,但是你也有可能跳去用FB。

link |

46:39.340

你在FB你有可能跳去念書,但機率很低,你在FB你可能就會繼續一直看FB。

link |

46:46.320

接下來我們要預測的就是,在無窮遠的時間以後,到你人生終止的那一刻,你正在念書的機率有多少,你正在使用FB的機率有多少。

link |

46:59.540

那你要怎麼解這個問題呢?你要解這個問題,你就要把某一個matrix連成n次。但某一個matrix連成n次非常麻煩,所以你就需要有上面這個定理,你才能夠輕易地計算把某一個matrix連成n次以後的結果。

link |

47:19.120

那我們就來看一下我們怎麼計算這個問題。這個問題是這樣的,我們把這個state和state間的transition寫成一個矩陣。

link |

47:31.480

從念書到念書的機率是85%,從FB到念書的機率是3%,從念書到FB的機率是15%,從FB到FB的機率是97%。

link |

47:49.180

這個是一個transition的matrix告訴我們說,你的人生如何在不同的state間做轉換。假設你一出生的時候,你就是在念書,一出生你就知道要念書。

link |

48:04.620

所以這個10代表說,你在念書這個state機率是100%,然後你在看FB的機率是0%,然後接下來你就把10這個vector乘上上面這個transition的matrix,那你得到一個新的vector,這個vector是0.85 0.15,代表說你有85%的機率在念書,15%的機率在看FB。

link |

48:31.280

那再把這個vector再乘上一個matrix,再乘上同一個transition的matrix,那你會得到0.727跟0.273,代表說你有0.727的機率在念書,你有0.273的機率在看FB。

link |

48:47.680

那這個怎麼來?你就把0.85乘0.85加上0.15乘0.3得到這個東西,你把0.85乘0.15、0.15乘0.97得到這個東西。

link |

48:57.280

那你把上面這個matrix,假設這個matrix叫做matrix A,你把這個matrix A連成無窮多次,連成N次以後,你就可以知道說,到你人生結束的時候,你會正在做什麼樣的事情。

link |

49:12.320

那我們就計算一下,怎麼計算呢?因為要把A連成N次很麻煩,所以你要把A先做對角化,那怎麼把A先做對角化呢?

link |

49:31.320

你就要先列出A的characteristic polynomial,那A的characteristic polynomial就長成這個樣子,這個式子不是特別好看啦,不過沒有關係,你就接受一下。

link |

49:42.520

我們把A的對角線都減掉t,然後算出它的determinant,它的characteristic polynomial的式子就長成這個樣子。

link |

49:52.320

接下來你就要看說,這個matrix A到底能不能夠被對角化呢?那你就要看說,今天你的浪打,不過其實我們也不用做這件事啦,你就是有兩個eigenvalue嘛,所以你一定找得到兩個independent eigenvector,所以matrix A一定可以被對角化,這件事情沒有問題。

link |

50:18.000

但是你如果要真的把它對角化的話,你要找出每一個eigenvalue對應的eigenvector,那怎麼找出每一個eigenvalue對應的eigenvector呢?

link |

50:26.760

那你就把這個null space,把eigenspace把它列出來,所以A-0.82I2的null space就是浪打eigenvalue等於0.82的eigenspace,就解出來說,第一個eigenvector對應到0.82的eigenvector是-1 1,然後對應到1的eigenvector是1 5這樣。

link |

50:54.120

對應到0.82的eigenvector是-1 1,對應到1的eigenvector是1 5,然後接下來你就可以把A做對角化,A做對角化,A做對角化以後,它的P就是-1 1跟1 5,-1 1跟1 5,那它是invertible的,因為這兩個vector一定是independent。

link |

51:14.120

那D呢?D的第一個值就是0.82,它的第二個值就是1。好,所以我們現在知道怎麼把A進行對角化,接下來我們就可以把A連成n次,把A連成n次。

link |

51:31.880

那把A連成n次,你唯一要做的事情就是把中間的D連成n次,把D連成n次你得到的結果是什麼呢?把D連成n次就是把對角線的數值取n次方,把對角線的數值取n次方,那1的n次方會等於1。

link |

51:52.360

那你發現說,這一個matrix它最大的eigenvalue是1,對不對?然後它的第二個eigenvalue是0.82。這件事情並不是巧合,其實有一系列,這個我們之後再講,就是有某一些matrix,一個matrix滿足某些特性的時候,它最大的eigenvalue就會是1。

link |

52:14.440

然後剛才討論的這個matrix A,它滿足這個特性,所以它最大的eigenvalue是1,所以它解出來最大的eigenvalue是1,這件事情並不是一個巧合。

link |

52:24.680

好,那我們現在計算出A的n次方等於這個樣子,然後我們把這個matrix乘一乘以後,你得到的結果就是這樣,所以A的n次方是長這個樣子。

link |

52:38.680

那假設在你人生的終結,也就是n呢,是趨近於無窮大的時候,n趨近於無窮大,0.82的n次方會趨近於0,所以0.82的n次方就可以整個消掉,就可以整個消掉,所以你知道A的n次方就是6分之1、6分之5、6分之1、6分之5。

link |

52:56.680

接下來,你就可以計算說,在你人生終結的時候,你正在做什麼。假設你一出生的時候,你是在念書的,是E0,假設你正在念書是E0,那你得到的結果是什麼呢?

link |

53:11.400

在你人生終結的時候,你會發現說,你有6分之1的機率是在念書的,你有6分之5的機率是正在看FB的,那假設你一出生的時候就在看FB,

link |

53:33.960

你會發現說,就算你一出生就在看FB,在你人生終結的時候其實是沒有差別的,就是你一出生的時候就在念書,還是你一出生就在看FB,最終你的結局都是一樣的。

link |

53:48.340

因為你發現說,把這個matrix乘上0、1這個vector,最後得到的結果一樣是6分之1、6分之5、一樣是6分之1、6分之5,代表說你一出生就在念書,還是一出生就在看FB,最後你到人生結束的時候,都是有6分之1的機率在念書,有6分之5的機率在看FB。

link |

54:09.520

所以今天對角化的第一個應用是,我們可以把一個matrix連成n次。接下來剩下的時間我們就講一下5.4的開頭,那這個部分非常的簡單,會告訴你說到底對角化這件事情有什麼樣的妙用,把這個部分對應到課本的5.4。

link |

54:33.480

之前在講第四章的時候,我們講了coordinate system,我們說假設有一個linear的transform,有一個linear的function T,它可以把V變到T of V,那你可以在不同的coordinate system下去看這個變換。

link |

54:50.940

假設你在B這個coordinate system下去看這個變換,也就是你把V換成從B這個系統下去看的V,那你只要把V乘上B inverse,就會進入這個系統。

link |

55:06.900

那你把T of V從B這個系統下去乘上B,就可以變回T of V,那這個T你可以在B這個系統下看,那它就會變成不同的樣子。

link |

55:25.500

那在過去,我們都是要好好的挑B應該要長什麼樣子,但是今天有了這個對角化的概念以後,我們就是要告訴你說,我們其實有一個系統化的方法來選擇B,讓你中間得到的這個metric看起來是會比較簡單的,看起來是會比較好。

Linear Algebra Lecture 26: Diagonalization