講座題目:建立量化網(wǎng)絡(luò)中直接關(guān)聯(lián)性的部分互信息新方法
講座人:陳洛南 教授
講座時間:15:00
講座日期:2017-6-12
地點:數(shù)學(xué)與信息科學(xué)學(xué)院學(xué)術(shù)報告廳
主辦單位:數(shù)學(xué)與信息科學(xué)學(xué)院
講座內(nèi)容:在數(shù)據(jù)分析中,定量的標(biāo)識變量的直接依賴性是一件非常重要的事情,特別是對于科學(xué)和工程中各種類型的網(wǎng)絡(luò)重構(gòu)和因果推斷問題,都需要高精度的理論和方法。應(yīng)用的最廣泛的方法之一是偏相關(guān)性系數(shù)(partialcorrelation),但是偏相關(guān)性系數(shù)只能量化線性之間相關(guān)性和關(guān)聯(lián)性,從而忽略非線性的關(guān)聯(lián)性。然而,基于“條件獨立性”(conditionalindependency)的“條件互信息”(CMI: conditionalmutual information)可以從觀察數(shù)據(jù)中量化變量之間非線性的直接關(guān)聯(lián)性,優(yōu)于線性的方法。但是,條件互信息存在著過低估計的問題,因而嚴(yán)重限制它的應(yīng)用,特別是在網(wǎng)絡(luò)節(jié)點有強(qiáng)相關(guān)的網(wǎng)絡(luò)中,這個問題就更加嚴(yán)重?;谶@個問題,我們提出了全新的概念,即“偏獨立性”(partialindependency)以及新的度量方法,又稱作“部分互信息”(PMI: part mutualinformation),不僅能夠克服條件互信息的缺點,同時還能保持互信息和條件互信息的性質(zhì)。特別是,陳洛南研究組首先定義了部分互信息用于量化變量之間的直接關(guān)聯(lián)性,然后從理論上給出部分互信息和互信息以及條件互信息之間的內(nèi)在聯(lián)系。通過數(shù)值實驗,證明了部分互信息的性質(zhì)和優(yōu)點,接著通過用Escherichia coli和Yeast的基因表達(dá)數(shù)據(jù)重構(gòu)其基因調(diào)控網(wǎng)絡(luò),進(jìn)一步驗證了部分互信息在量化網(wǎng)絡(luò)中非線性的直接關(guān)聯(lián)性的優(yōu)越性。該工作對大數(shù)據(jù)網(wǎng)絡(luò)研究提供了全新的概念和理論,不僅可用于生物分子網(wǎng)絡(luò)的高精度構(gòu)建,而且可以應(yīng)用于其他網(wǎng)絡(luò)(領(lǐng)域)中各種復(fù)雜因素的因果關(guān)系推斷。