久久久久亚洲AV成人无码电影,天天色综合网址,夜夜爽天天干,99九九久久精品视频

學(xué)校概況

學(xué)校簡(jiǎn)介

學(xué)校章程

現(xiàn)任領(lǐng)導(dǎo)

歷任領(lǐng)導(dǎo)

機(jī)構(gòu)設(shè)置

師大標(biāo)識(shí)

校訓(xùn)校風(fēng)學(xué)風(fēng)

師大校歌

校園風(fēng)景
招生就業(yè)

本科生

碩士生博士生

遠(yuǎn)程教育

留學(xué)生教育

港澳臺(tái)招生

教師干部培訓(xùn)

學(xué)生就業(yè)指導(dǎo)
教育教學(xué)

本科生教育

研究生教育

遠(yuǎn)程教育

留學(xué)生教育

教師教育

教師干部培訓(xùn)

教師專業(yè)能力發(fā)展

學(xué)位授權(quán)點(diǎn)

本科專業(yè)

思政隊(duì)伍培訓(xùn)研修
學(xué)術(shù)研究

學(xué)術(shù)委員會(huì)

學(xué)術(shù)期刊

重點(diǎn)科技創(chuàng)新平臺(tái)

大型設(shè)備儀器平臺(tái)

協(xié)同創(chuàng)新中心

一流學(xué)科建設(shè)
人事人才

人才招聘

教師個(gè)人主頁(yè)

人才工作

人事工作
國(guó)際交流

國(guó)際交流與合作處

“一帶一路”教育人文交流網(wǎng)

留學(xué)陜師大

留學(xué)培訓(xùn)與研究中心
社會(huì)服務(wù)

服務(wù)基礎(chǔ)教育

鄉(xiāng)村振興與對(duì)口支援

成果轉(zhuǎn)化

合作辦學(xué)

專家學(xué)者走基層

大學(xué)志愿者服務(wù)

教育出版
校友·捐贈(zèng)

校友總會(huì)

教育基金會(huì)

我要捐贈(zèng)
圖書·檔案·博物

圖書館

檔案館

博物館
校園生活

師大微博

師大微信

通勤車班次

校歷

辦公電話

心理健康

啟夏青年

素質(zhì)教育網(wǎng)

醫(yī)療服務(wù)

后勤服務(wù)

網(wǎng)絡(luò)服務(wù)

校園一卡通

校園認(rèn)同卡

校園云盤

運(yùn)動(dòng)與健康
師大要聞
綜合新聞
媒體師大
影像師大

當(dāng)前位置: > 學(xué)術(shù)報(bào)告 > 理科 > 正文

理科

恒元物理學(xué)講座（第120期）：The emergence of cooperation in AI game systems

發(fā)布時(shí)間：2018-05-30 瀏覽：次

報(bào)告日期：2018年5月31日

報(bào)告時(shí)間：11:00

報(bào) 告人：張繼強(qiáng) 博士（北京航空航天大學(xué)）

報(bào)告地點(diǎn)：長(zhǎng)安校區(qū) 物理學(xué)與信息技術(shù)學(xué)院六層學(xué)術(shù)報(bào)告廳（致知樓3623）

主辦單位：物理學(xué)與信息技術(shù)學(xué)院

報(bào)告摘要：

在復(fù)雜系統(tǒng)中通過自組織實(shí)現(xiàn)集群行為的涌現(xiàn)一直是眾多領(lǐng)域研究者關(guān)注的焦點(diǎn)。社會(huì)系統(tǒng)和生態(tài)系統(tǒng)中以個(gè)體間博弈的微觀作用方式自組織形成的宏觀現(xiàn)象廣泛存在，合作的涌現(xiàn)、資源的配置等等。強(qiáng)化學(xué)習(xí)（Reinforce Learning）是個(gè)體基于所觀測(cè)到的環(huán)境進(jìn)行決策，進(jìn)而有效地實(shí)現(xiàn)其目的算法。這使得該方法與傳統(tǒng)的博弈過程具備較好的契合點(diǎn)。在本工作中，我們將Q-learning算法與22博弈相結(jié)合提出了新的博弈演化動(dòng)力學(xué)模型。通過模擬結(jié)果，我們發(fā)現(xiàn)博弈參數(shù)在囚徒困境博弈下（PD）和雪堆博弈下（SD）對(duì)學(xué)習(xí)參數(shù)下表現(xiàn)出不同的響應(yīng)特性。經(jīng)過模擬結(jié)果，我們發(fā)現(xiàn)SD系統(tǒng)中合作比例呈現(xiàn)周期性演化的特征，而PD中無(wú)此特點(diǎn)。通過對(duì)動(dòng)力學(xué)過程的分析，我們猜測(cè)產(chǎn)生這一特征的原因是兩種平衡點(diǎn)之間的競(jìng)爭(zhēng)所引發(fā)的，并設(shè)計(jì)了部分實(shí)驗(yàn)對(duì)猜測(cè)進(jìn)行了佐證。此外，通過部分技巧，我們對(duì)系統(tǒng)的動(dòng)力學(xué)過程進(jìn)行了一定的數(shù)學(xué)分析。這些分析有助于我們有效地對(duì)個(gè)體進(jìn)行分類，并最終定性理解參數(shù)對(duì)周期特征的影響。最后，我們?cè)?span lang="EN-US">SD中發(fā)現(xiàn)了個(gè)體分類之后的部分統(tǒng)計(jì)學(xué)性質(zhì)只取決于收益矩陣的對(duì)稱性。與傳統(tǒng)博弈模型中的相互模仿學(xué)習(xí)機(jī)制不同，Reinforce Learning傾向于探索式的內(nèi)省學(xué)習(xí)機(jī)制。這種學(xué)習(xí)機(jī)制在生態(tài)系統(tǒng)和社會(huì)系統(tǒng)是廣泛存在的，我們的研究思路和方法有助于為相似的機(jī)制博弈過程建立有效的模型和分析思路。同時(shí)，我們研究結(jié)果可能有助于一定程度上闡釋真實(shí)系統(tǒng)中尤其是生態(tài)系統(tǒng)中合作比例的周期性演化。

報(bào)告人簡(jiǎn)介：

張繼強(qiáng)，2009年06月畢業(yè)于蘭州大學(xué)放射化學(xué)專業(yè)。2010年09月進(jìn)入蘭州大學(xué)物理科學(xué)與技術(shù)學(xué)院理論物理專業(yè)計(jì)算物理與復(fù)雜系統(tǒng)研究所從事復(fù)雜系統(tǒng)和復(fù)雜網(wǎng)絡(luò)的相關(guān)研究工作，其主要研究方向?yàn)閺?fù)雜系統(tǒng)中的資源配置和博弈動(dòng)力學(xué)。2016年畢業(yè)后進(jìn)入北京計(jì)算科學(xué)研究中心湯雷翰教授課題組進(jìn)行生物數(shù)據(jù)挖掘以及代謝網(wǎng)絡(luò)方面的博士后研究工作。2017年進(jìn)入北京航空航天大學(xué)大數(shù)據(jù)與腦機(jī)智能高精尖創(chuàng)新中心從事機(jī)器學(xué)習(xí)、知識(shí)圖譜和AI博弈動(dòng)力學(xué)等相關(guān)研究工作。其文章主要發(fā)表于Scientific Reports， Physical Review E等國(guó)際期刊上。

上一篇：強(qiáng)化β葡聚糖大麥粉在功能食品開發(fā)中的作用下一篇：復(fù)雜系統(tǒng)前沿論壇

返回頂部 | 查看更多新聞 | 師大新聞網(wǎng)

校歷
通勤車班次
圖書館
師大郵箱

雁塔校區(qū)

地址：西安市雁塔區(qū)長(zhǎng)安南路199號(hào)　郵編：710062

長(zhǎng)安校區(qū)

地址：西安市長(zhǎng)安區(qū)西長(zhǎng)安街620號(hào)　郵編：710119

總機(jī)：86-29-85308114 總值班室：86-29-85310005

?陜西師范大學(xué)版權(quán)所有陜ICP備05001611號(hào)