講座題目:建立量化網絡中直接關聯性的部分互信息新方法
講座人:陳洛南 教授
講座時間:15:00
講座日期:2017-6-12
地點:數學與信息科學學院學術報告廳
主辦單位:數學與信息科學學院
講座內容:在數據分析中,定量的標識變量的直接依賴性是一件非常重要的事情,特別是對于科學和工程中各種類型的網絡重構和因果推斷問題,都需要高精度的理論和方法。應用的最廣泛的方法之一是偏相關性系數(partialcorrelation),但是偏相關性系數只能量化線性之間相關性和關聯性,從而忽略非線性的關聯性。然而,基于“條件獨立性”(conditionalindependency)的“條件互信息”(CMI: conditionalmutual information)可以從觀察數據中量化變量之間非線性的直接關聯性,優(yōu)于線性的方法。但是,條件互信息存在著過低估計的問題,因而嚴重限制它的應用,特別是在網絡節(jié)點有強相關的網絡中,這個問題就更加嚴重。基于這個問題,我們提出了全新的概念,即“偏獨立性”(partialindependency)以及新的度量方法,又稱作“部分互信息”(PMI: part mutualinformation),不僅能夠克服條件互信息的缺點,同時還能保持互信息和條件互信息的性質。特別是,陳洛南研究組首先定義了部分互信息用于量化變量之間的直接關聯性,然后從理論上給出部分互信息和互信息以及條件互信息之間的內在聯系。通過數值實驗,證明了部分互信息的性質和優(yōu)點,接著通過用Escherichia coli和Yeast的基因表達數據重構其基因調控網絡,進一步驗證了部分互信息在量化網絡中非線性的直接關聯性的優(yōu)越性。該工作對大數據網絡研究提供了全新的概念和理論,不僅可用于生物分子網絡的高精度構建,而且可以應用于其他網絡(領域)中各種復雜因素的因果關系推斷。