上海交通大学学报 ›› 2021, Vol. 55 ›› Issue (Sup.1): 3-4.doi: 10.16183/j.cnki.jsjtu.2021.S1.019
所属专题: 上海交通大学建校125周年科学问题专辑
李少远,殷翔
收稿日期:2021-02-04
出版日期:2021-03-28
发布日期:2021-04-09
通讯作者:
殷翔,男,副教授,博士生导师.E-mail:yinxiang@sjtu.edu.cn.
作者简介:李少远(1965-),男,河北省衡水市人,教授,从事智能优化控制研究.
基金资助:LI Shaoyuan,YIN Xiang
Received:2021-02-04
Online:2021-03-28
Published:2021-04-09
摘要: 自我博弈学习是智能涌现的基本方法之一.介绍智能体自我博弈学习的基本思想,回顾该方向的最新研究成果,提出智能体自我博弈学习是否存在极限这一核心科学问题,指出需要融合信息论、控制论等多学科方法,从信息和计算的视角探究智能涌现的根源.
中图分类号:
李少远, 殷翔. 智能体自我博弈学习是否存在性能极限?[J]. 上海交通大学学报, 2021, 55(Sup.1): 3-4.
LI Shaoyuan, YIN Xiang. Do Agent Self-Game and Learning Have Limitation of Performance?[J]. Journal of Shanghai Jiao Tong University, 2021, 55(Sup.1): 3-4.
| [1] | SILVERL D, SCHRITTWIESERL J, SIMONYANL K, et al. Mastering the game of Go without human knowledge[J]. Nature, 2017, 550: 354-359. |
| [1] | 白云洁, 谢开贵, 邵常政, 胡博. 梯级水电上下游区域风光水火联盟的博弈优化调度[J]. 上海交通大学学报, 2026, 60(2): 224-234. |
| [2] | 郭琦, 闫军, 郝乾鹏, 韩东, 杨志豪, 闫馨月, 张海鹏, 李然. 基于闭环聚类和多目标优化的风电短期功率预测方法[J]. 上海交通大学学报, 2026, 60(2): 246-255. |
| [3] | . Wav2vec-AD:用于语音识别的声学单元发现模块集成式自监督对比预训练方法[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(2): 289-297. |
| [4] | . 基于通用音素识别器的低资源语言发音词典生成探索[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(2): 265-272. |
| [5] | . DSNet:用于语音情感识别的带有中性校准的解耦孪生网络[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(2): 248-257. |
| [6] | . 基于改进YOLOv5l的交通信号灯识别[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(2): 319-333. |
| [7] | . 基于知识-数据融合模型的综合能源系统多元负荷短期预测[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(2): 499-514. |
| [8] | 吴勇华, 梅颖, 卢诚波. 基于增量加权的概念漂移数据流分类算法[J]. 上海交通大学学报, 2026, 60(1): 112-122. |
| [9] | 罗志军, 王健瑞, 殷佳伟. 复杂战场环境下的任务驱动智能目标识别方法综述[J]. 空天防御, 2026, 9(1): 1-11. |
| [10] | 陈亮汶, 朱宇昕, 沈涛, 俞羿帆, 凌霄, 盛庆红. 基于红外尾迹匹配的舰船目标检测算法[J]. 空天防御, 2026, 9(1): 80-90. |
| [11] | 周诗洋, 徐胜文, 吕品, 等. 基于改进回归树的风机净空预报[J]. 海洋工程装备与技术, 2026, 13(1): 58-68. |
| [12] | 刘东林, 周霞, 戴剑丰, 解相朋, 汤奕, 李隽诗. 考虑虚拟储能的建筑综合能源系统双层优化调度策略[J]. 上海交通大学学报, 2026, 60(1): 61-73. |
| [13] | . 触觉辅助导航车辆:增强盲区和透明物体场景中的障碍物检测[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(1): 167-175. |
| [14] | . 融合鸟瞰图特征的模仿与强化学习自动驾驶规划方法[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(1): 154-166. |
| [15] | . 合成数据驱动的无人机检测与分类多任务框架[J]. J Shanghai Jiaotong Univ Sci, 2026, 31(1): 209-220. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||