人工智能论文2018邀请专家信息及报告简介:

李武军

单位:南京大学计算机科学与技术系,软件新技术国家重点实验室

个人简介:李武军,博士,副教授,博士生导师。主要研究领域为人工智能、机器学习与大数据。2010年毕业于香港科技大学计算机科学与工程系,获工学博士学位。2010年9月至2013年12月于上海交通大学计算机科学与工程系从事教学与科研工作,任讲师和副教授。2014年1月加入南京大学计算机科学与技术系。在大数据机器学习方向开展了系统地深入研究,取得了一系列创新成果,并将其应用于社交网络分析、推荐系统、信息检索以及互联网广告点击率预估等实际问题。在AAAI/CVPR/ICML/IJCAI/NIPS/TKDE/AIJ等CCF-A类会议和期刊上发表论文30余篇。论文被国内外同行广泛引用和正面评价,引用者来自斯坦福、伯克利等机构,包括中国科学院/工程院院士、美国工程院院士、欧洲科学院院士、英国皇家工程院院士、加拿大工程院院士等19位国内外科学院/工程院院士以及70余位AAAI/ACM/IEEE Fellow等。研发了大数据机器学习平台LIBBLE,部分功能比当前学术界和企业界广泛采用的分布式机器学习平台快数十倍甚至上百倍。部分成果应用于阿里巴巴等企业,产生了显著的社会和经济效益。近五年来应邀担任包括AAAI/CVPR/ICCV/ICML/IJCAI/NIPS/SIKDD等CCF-A类会议在内的国内外会议程序委员50余次,担任包括IEEE TPAMI/TKDE/TPDS/AIJ/JMLR/ACM TOIS等CCF-A类期刊在内的20余种国内外知名期刊审稿人。更多信息请参见个人主页:http://cs.nju.edu.cn/lwj/

报告题目:并行与分布式随机学习

报告摘要:大数据机器学习为大数据智能提供核心的理论和技术支撑,已经成为人工智能与大数据研究中最热门的领域之一。目前,以随机梯度下降(SGD)为代表的随机学习已经成为大数据机器学习的核心技术之一。本报告将介绍我们研究组在并行与分布式随机学习领域最新的研究成果,并将介绍我们组自主研发并已开源的大数据机器学习平台LIBBLE (http://libble.tk/)。

李天瑞

报告人:西南交通大学李天瑞教授、博士生导师

简历:李天瑞,西南交通大学信息科学与技术学院教授,博士生导师,四川省云计算与智能技术高校重点实验室主任,主要研究方向是数据挖掘与知识发现,云计算与大数据,粒计算与粗糙集。在AI,IEEE TKDE,IEEE TEC,IEEE TFS,IEEE TC等国际期刊和中国科学、软件学报、计算机学报等国内期刊或KDD、IJCAI、UbiComp国际会议等上发表学术论文300余篇 (被SCI检索110余篇,EI检索230余篇, 入选ESI热点论文3篇和高被引论文12篇,18篇论文入选2016年教育部学科评估统计ESI前3%论文),学术影响力已进入全球计算机科学领域的前1%,排名第469位(共3173名科学家入选)(据ESI 2018年3月份统计),Google H-index是32,获得授权发明专利和软件著作权20余项;在科学出版社等出版编著6部,主编国际SCI期刊专辑9集。承担科技项目20余项[其中国家级项目7项]。并应邀到国际会议做大会特邀报告18次。担任国际会议主席、程序或组织委员会主席20余次。担任国际杂志International Journal of Computational Intelligence Systems(IF: 1.140)领域主编以及Knowledge-based Systems(IF: 4.529), Information Fusion(IF: 5.667)编委。是国际粗糙集学会会士,CCF杰出会员,ACM、IEEE和CAAI高级会员,IEEE CIS成都分会主席,ACM SIGKDD China Chapter司库,CCF成都分部执委,CCF YOCSEF成都分论坛13-14主席。已培养博士后8名,博士13名,硕士40余名。培养的学生曾获得CAAI优秀博士论文提名奖1次,ACM成都分会优秀博士论文奖4次,IEEE成都分会优秀学生论文奖4次,国际/全国会议优秀论文奖10余次,2015年天池大数据“新浪微博互动预测大赛”冠军(奖金20万元),2016年国际人工智能联合会议竞赛(社会影响力分析)亚军等。毕业学生就业单位包括国际知名研究机构如微软亚洲研究院,一流高校如四川大学和国际知名企业如百度、阿里巴巴、腾讯、华为等。

报告题目:数据驱动智能的挑战和解决方案

报告摘要:本报告首先概述了数据驱动智能的几大主要挑战,包括合理数据采集、数据量大、数据动态性、数据不确定性、数据多源异构性以及数据隐私保护等问题,接着概述了数据驱动智能的四个要素,包括数据、算法、计算力和行业应用,最后重点介绍我们近期在数据驱动智能方面的工作进展,包括大规模增量特征选择算法设计,并行知识发现方法以及在高铁大数据和智慧城市方面应用等。

管子玉

简介:管子玉,男,1982年生,博士,西安电子科技大学教授、博士生导师,国家优秀青年科学基金获得者。2004年6月本科毕业于浙江大学,获得计算机科学与技术专业学士学位。同年保送直接攻读博士学位,师从陈纯院士,于2010年6月获得浙江大学计算机科学与技术专业博士学位。2010年至2012年在美国加州大学圣芭芭拉分校从事博士后研究工作。2012年进入西北大学任研究员,2014年1月取得教授职称,同年遴选为博士生导师。2017年进入西安电子科技大学工作。2015年获得国家自然科学基金委优秀青年科学基金项目资助,2016年获陕西省青年科技新星称号。
承担的科研项目包括:国家自然科学基金面上项目、优秀青年科学基金项目、国家863项目和教育部创新团队项目等。在数据挖掘、信息检索、数据管理等领域的顶级国际会议和期刊发表论文40余篇,包括ACM WWW、ACM SIGMOD、VLDB、IEEE ICDE、ACM SIGKDD、ACM SIGIR、IJCAI、AAAI、IEEE TKDE等。担任领域内知名SCI期刊Neurocomputing和International Journal of Machine Learning and Cybernetics的编委,担任多个顶级国际会议程序委员会委员,如SIGKDD、IJCAI、NIPS、AAAI、ICML等,担任顶级会议IJCAI 2017和IJCAI 2018资深程序委员会委员,是国际会议环太平洋多媒体会议PCM 2016的组织主席。

题目:基于弱标注信息的深度学习

内容简介:深度学习近年来获得了学术界和工业界广泛关注。但是,深层神经网络需要通过大量的训练数据来学习。传统的无监督预学习技术假设数据的分布能有效帮助学习目标语义,因此并不能很好地解决语义鸿沟问题。而在有监督学习方面,针对具体学习任务的大规模标注数据也较难获得。弱标注数据指的是由于存在噪声或者不契合等问题而无法直接用于解决所关注学习任务的语义标注,如社会化标签、互联网用户产生的评论评分。弱标注数据中含有大量的语义信息,如何有效利用这些信息训练神经网络是亟需解决的问题。本次报告主要对我们近期在该领域开展的一些研究工作进行介绍:(1)利用评论评分信息学习深层情感分类模型;(2)利用图片级标注学习图片中物体的哈希表示,解决基于物体的图像检索问题;(3)利用社会化标签标注数据提升图像检索性能。

陈伟能

简介:陈伟能,华南理工大学计算机科学与工程学院教授,博士生导师,国家优秀青年科学基金获得者、“霍英东”青年教师奖获得者,广东省自然科学杰出青年基金获得者、首批“广东特支计划”科技创新青年拔尖人才、广州市珠江科技新星、英国皇家学会Newton Fund基金获得者,获第十六届霍英东青年教师奖二等奖,IEEE CIS(计算智能学会)2016年度杰出博士学位论文奖(全球评选1篇),2012年度中国计算机学会(CCF)优秀博士学位论文奖。现任中国计算机学会人工智能与模式识别专业委员会委员,IEEE广州分会副主席,多次获邀出任IEEE WCCI等领域内重要国际会议的程序委员会委员。主要研究方向是计算智能、运筹优化与云计算,已发表国际期刊和国际会议论文80余篇,其中IEEE Transactions长文20余篇,主持国家自然科学基金等国家、省部级科研项目8项,是科技部重点领域(机器智能)创新团队的核心成员。

题目:基于概率分布的演化算法

摘要:演化计算和群体智能方法,是通过模拟自然界中群体的智能现象和行为来求解问题的一类方法。由于它不依赖于待解问题的数学模型特性,在解决复杂的优化问题时具有独特的优势。
本报告将介绍一类特殊的演化算法——基于概率分布的演化算法,提出两类基于概率分布估计的演化算法框架:多解优化概率分布演化方法,以及基于概率分布的连续-离散混合空间优化方法。前者通过将基于概率分布的EC算法思想和小生境(Niching)技术相结合,通过建立具备概率模型提高算法的搜索多样性,并提高算法在不确定环境中的求解能力;后者针对如粒子群优化(particle swarm optimization,PSO)等部分重要的EC算法传统上定义于连续空间,难以直接用于离散优化问题的不足,引入概率分布的思想,将问题的解定义为集合,将算法的速度定义和解更新过程重定义为学习概率的更新,从而将算法拓展于连续、离散混合空间。最后,本报告将介绍上述方法在实际工程问题中的应用。

李宇峰

简介:李宇峰,南京大学计算机科学与技术系机器学习与数据挖掘研究所(LAMDA)副研究员,之前在南京大学计算机科学与技术系获学士和博士学位。他主要围绕半监督学习相关方面开展研究,在JMLR、TPAMI、MLJ、ICML、AAAI等领域内重要期刊会议发表论文30余篇。被Google Sholar引用1800余次,篇均引用50余次。近年应邀担任MLJ专刊编委,IJCAI15/17、ACML17高级程序委员,ACML18 workshop co-chair,以及ICML/NIPS/KDD/AAAI等领域内重要国际会议程序委员20余次。担任中国计算机学会人工智能与模式识别专委会委员、中国人工智能学会机器学习专委会委员、江苏省人工智能学会机器学习专委会秘书长等。获CCF优秀博士论文奖、江苏省优秀博士论文奖,入选CCF首届青年人才发展计划等。

题目: 安全半监督学习:算法和理论分析初探

摘要: 对于数据很多,标记很少的应用情景,半监督学习方面的研究得到了很多的进展。然而,目前半监督学习技术还不能放心地实施,因它有时利用更多的未标注数据反而会恶化性能。因此,亟需要发展安全半监督学习技术,即利用未标注数据在最坏情况下都不会恶化性能的技术。围绕算法设计和理论分析,这次报告介绍我们在安全半监督学习方面取得的探索结果。

吴建鑫

个人情况:南京大学教授, 研究兴趣为计算机视觉与机器学习,尤其是资源(计算、存储、能源、数据与标注)受限情况下的深度学习。曾获中组部青年千人和基金委优秀青年科学基金资助,曾任ICCV、CVPR、AAAI等领域主席。

题目: 深度学习实践:庖丁解牛与盲人摸象

摘要: 深度学习是目前计算机视觉与机器学习领域最热门、也是在很多实际问题中实践效果最好的方法。然而,深度学习,尤其是卷积神经网络CNN的机理目前尚不明确。本次报告将介绍我们研究组在CNN深度学习方向上两个方面的实践:庖丁解牛与盲人摸象。庖丁解牛即将CNN的各个构成模块分别探索,发现其优缺点并加以改进,从而对CNN的各个模块形成深入的理解。盲人摸象即对在ImageNet上学习到的CNN预训练模型能起到什么样的作用加以研究,在CNN整体机理尚不清楚的前提下,对预训练模型在各个视觉问题中的无监督应用加以研究。

彭绍亮

简历: 彭绍亮,三级教授,博导,国家超级计算长沙中心副主任,长期从事高性能计算、大数据、生物信息、移动计算等技术研究工作,并担任国防科技大学“天河”生命科学方向负责人,华大基因研究院“特聘教授”,湖南大学“岳麓学者”三级教授。已发表学术论文数十篇,其中包括Science, Nature Communications, Cell AJHG, Genome Biology, NAR, Cancer Research, ACM/IEEE Transactions, BIBM, 《中国科学》等。曾参与天河系列超级计算机应用软件研发工作,参与国家973项目、863项目、军队重大型号项目等13项,获军队科技进步一等奖1项,2016年荣立三等功。是中央军委科技委生物交叉立项专家组成员、国家科技专家库专家、中国计算机学会理事(2016-2019),CCF计算机应用专委会副主任和生物信息专业组副主任,YOCSEF长沙主席(2016-2017)和总部AC委员(2017-), CCF高性能计算、大数据专委委员、CCF杰出会员和杰出讲者、担任多个国际期刊主编和副主编,包括International Journal of Biological Sciences (SCI期刊,2013 IF=4.37) 执行主编(Executive Editors),Interdisciplinary Sciences: Computational Life Sciences(计算生命科学-SCI期刊)国际期刊副主编(Associate Editor)等。2014,2015年连续两次率队获得全国并行应用挑战赛金奖第一名(人类基因组重测序软件流水线深度并行优化,天河2号上一种大规模虚拟药物筛选平台),和IEEE International Scalable Computing Challenge 2015,2017、国际iGEM竞赛 2015,2016金牌等国际竞赛奖。目前单篇论文最高他引1284次。还担任了湖南省生物信息学会理事长、CCF 2016大数据技术大会(BDTC)程序委员会主席、CCF大数据学术大会程序委员会副主席、2017第四届全国计算生物学学术会议大会主席、2017第二届中国计算机学会生物信息学会议程序委员会主席、2019第17届APBC亚太地区生物信息会议程序委员会主席。

报告题目:大超人:天河超级计算机上的人工智能医生

报告摘要:机器人能挂号看病?基于国家超级计算长沙中心的天河超级计算机和健康医疗大数据研发的辅助诊疗机器人已经初具雏形,堪称大数据、超级计算和人工智能技术在医疗健康领域中的完美应用案例。2015年Gartner等调查报告:“14亿人口的国家,每千人医生1.75,每千人农业人口的医生只有0.47,误诊率高于40%”。医疗资源的严重缺乏和误诊率的不断攀升造成国家和人民巨额医疗、医保开销,医患矛盾不断加剧。如何解决这些尖锐矛盾,全面提高全民医疗和健康水平。“大超人”经过多年的技术储备、研发和测试横空出世。

什么是“大超人”:医疗大数据+天河超级计算机+人工智能算法。

“大超人”是国际首个面向临床应用的机器人全科医生,包括“健康体检机器人”、“智能分导诊机器人”、“临床诊断辅助决策机器人”、“巡房机器人”、“家庭健康机器人”、“骨质疏松筛查机器人”等系统,从“诊前”、“诊中”、“诊后”3阶段全力支持和辅助医生进行全方位精准的智能诊疗,并呵护病人和每个家庭成员的健康。大超人初期的研发和测试都基于天河超级计算机和海量医疗健康大数据,采用机器学习等人工智能算法,研发了更符合医学逻辑的人工智能混合算法平台,在诊断中学习,在学习中诊断。该系统目前已于2016年在国内多家三甲医院进行了部署、测试、试运行,挂号机器人准确率达9成以上,诊疗速度比人工快2-10倍,误诊率下降20%以上。在2017年8月19日,在第20届全国高等医学院校诊断学教学改革研讨会上(南华医院),进行了“人机PK”, 将100份电子病历导入系统中,现场4.8秒给出的诊断结果,每个病人用时不到0.05秒,准确率达到100%,得到我国临床诊断学领军人——首都医科大学临床检验诊断学系主任康熙雄教授等200多位与会医疗专家的热烈互动和点赞!国际国内几十家媒体进行了现场直播和报道(CCTV,湖南卫视等)。2018年骨质疏松筛查机器人已经在湖南湘雅等几十家医院门诊部署,24小时无人值守模式下已经接待了1万多名患者,准确率超过90%。相关研究成果于2018年2月在Science上正式发表。

郭平

郭平: 教授,博士生导师, 国际电气电子工程师协会高级会员。1993 -1994在美国莱特州立大学(Wright State University)计算机科学与工程系访问,2000.5 - 2000.8在中科院自动化所模式识别国家重点实验室访问,2005.6 - 2005.12在香港中文大学 计算机科学与工程学系访问。近年来主持了国家自然科学基金和国家“863”高技术课题子项目、教育部留学回国人员科研启动基金、模式识别国家重点实验室开放课题基金、中科院计算机科学重点实验室开放课题等项目。到目前为止已经在国际国内重要学术期刊和会议上发表论文百余篇, 2000年在美国召开的工程中的神经网络(ANNIE’2000)国际会议获优秀论文奖。研究兴趣包括人工神经网络理论及其在模式识别、图像处理、软件可靠性工程、光谱分析和智能信息处理等方面的应用。

报告题目:天文学中的人工智能

孟德宇

讲者简介:西安交通大学数学与统计学院教授,博导。曾赴香港理工大学,Essex大学与卡内基梅隆大学进行学术访问与合作。共接收/发表论文80余篇,其中包括IEEE Trans论文22篇和CCF A类会议30篇。担任ICML,NIPS等会议程序委员会委员,AAAI2016高级程序委员会委员。目前主要聚焦于自步学习、误差建模、张量稀疏性等机器学习相关方向的研究。

报告题目:大数据环境下的机器学习误差建模方法

报告摘要:传统机器学习主要关注于确定性信息的建模,而在复杂场景下,机器学习方法容易出现对数据噪音的鲁棒性问题,而该鲁棒性问题与误差函数的选择紧密相关。本次报告聚焦于如何针对包含复杂噪音数据进行误差建模的鲁棒机器学习原理。这一原理对在线视频处理、医学图像恢复等问题,已体现出个性化的应用优势,该原理亦有希望能够引导出更多有趣的机器学习相关应用与发现。

郑伟诗

简介:郑伟诗博士,中山大学数据科学与计算机学院教授。他主要面向大规模智能视频监控,展开视频图像信息与信号的处理研究,并开展大规模机器学习的算法和理论研究。他目前的主要研究应用领域是:视频监控下的行人身份识别与行为信息理解。面向大规模监控网络下的行人追踪问题,他在国内外较早和持续开展跨视域行人重识别的研究,发表一系列以跨视域度量学习为主线的研究工作,他提出的基于相对比较思想建模思路在行人重识别中被广泛深入研究。他已发表100余篇主要学术论文,其中60余篇发表在图像识别和模式分类IEEE TPAMI、IEEE TIP、IEEE TNN、PR、IEEE TCSVT、IEEE TSMC-B等国际主流权威期刊和ICCV、CVPR、IJCAI等计算机学会推荐A类国际学术会议。担任PR等期刊的编委。获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金、广东省自然科学杰出青年基金和广东省创新领军人才项目支持。主页:http://isee.sysu.edu.cn/~zhwshi/

报告题目:行为意图预测分析研究

Topic:Early Action Prediction

报告摘要:不同于行为识别,行为意图预测分析仅利用部分已观察的视频片段,实现整个视频动作行为类别的预测。这次报告将重点介绍我们最近基于视频数据的行为意图预测分析的研究成果。同时,我们也将简要介绍本组与之相关的交互行为分析工作,包括基于模板学习的人物交互行为分析、多通道异质特征数据融合的人物交互行为分析、基于广义相似性函数的人与人交互建模的多人交互行为分析学习模型。

朱占星

北京大学大数据科学研究中心助理研究员,北京大数据研究院研究员。2016年在英国爱丁堡大学获得机器学习方向博士学位。 主要研究领域为人工智能,机器学习,深度学习的优化方法,深度学习机制理论,大规模贝叶斯计算与优化理论,机器学习在交通大数据应用及计算机图形学中的应用等,在机器学习领域顶级期刊及会议有多篇文章发表,包括NIPS, ICML, ACL, AAAI及 ECML 等。
科研项目:深度学习及机器学习方法论:深度学习机制,深度学习优化方法,大规模优化,大规模贝叶斯计算,MCMC等;深度学习及机器学习在大数据中的应用:深度学习在交通大数据中的应用,深度学习/增强学习在计算机图形学中的应用,机器学习在工业系统控制系统中的应用。

报告题目:Towards understanding optimization dynamics, generalization and robustness in deep learning

熊德意

个人简介:熊德意,苏州大学计算机科学与技术学院教授、计算机系系主任。国家优秀青年科学基金(国家优青)获得者,英国皇家学会牛顿高级学者基金获得者,江苏省“333工程”和“六大人才高峰”培养对象,苏州市“高等院校、科研院所紧缺高层次人才”引进对象,入选2017年度中澳青年科学家交流计划。2007年至2012年在新加坡资讯通信研究院任研究科学家。主要研究方向为机器翻译、多语言信息获取、自然语言理解和深度学习等。在Computational Linguistics、 IEEE TASLP、 AI、JAIR、 AAAI、 IJCAI、 ACL等国际著名期刊和会议上发表论文60余篇,Springer出版英文专著一部,编著会议论文集多部。2009年获得北京市科学技术奖二等奖,2016年获得中文信息学会“钱伟长中文信息处理科学技术奖-汉王青年创新奖”一等奖。曾是亚洲自然语言处理联合会AFNLP干事、新加坡中文与东方语文信息处理学会理事会成员。目前是中文信息学会理事,江苏省人工智能学会智能系统及应用专委会副主任。担任IALP 2012程序委员会共同主席、CWMT 2017程序委员会共同主席、欧盟多国联合项目QTLeap咨询专家。

题目:从机器翻译看自然语言对话及其挑战

摘要:机器翻译和自然语言对话是人工智能中的一对姊妹花,两者都是AI-完全问题,且都依托于自然语言理解,具有相似的形式化描述和方法论体系。近年来,这对姊妹花在学术界和工业界中引起了极大的研究兴趣。随着两者本身技术的发展以及大数据、云计算技术的推动,机器翻译和自然语言对话都处在产业发展的拐点。本报告将探讨机器翻译技术在自然语言对话中的应用,并从大数据和自然语言理解的角度分析两者面临的挑战。

张道强

张道强,教授,博士生导师,国家优秀青年基金获得者,“万人计划”青年拔尖人才。分别于1999年和 2004年在南京航空航天大学计算机科学与工程系获学士和博士学位。2004年起留校任教, 2008年破格晋升为教授,主要研究方向为机器学习和模式识别技术及应用。2010年至2012年在美国北卡罗莱纳大学教堂山分校(UNC-Chapel Hill)从事脑影像分析及脑疾病早期诊断研究。已在国内外核心期刊和会议上发表150余篇论文,Google Scholar论文他引7000余次,H指数40。研究成果获教育部自然科学二等奖1项(第一完成人),获国际期刊《Neuroimage》和《Pattern Recognition》高被引论文、国际会议PRICAI’06、STMI’12及BICS’16最佳(学生)论文等。目前担任《PLOS ONE》、《自动化学报》、《计算机应用》等期刊编委。任中国图象图形学会理事、中国人工智能学会机器学习专委会常委、中国计算机学会人工智能与模式识别专委会委员、江苏省人工智能学会(筹)医学图像处理专委会主任委员等职务。曾获全国优博论文提名、霍英东青年教师奖、江苏省“333工程”高层次人才、江苏省杰出青年基金等。2014至2017年连续4年上榜Elsevier中国高被引学者榜单。

Title: Human Brain Mapping and Decoding: An Overview

Abstract:A universal unanswered question in neuroscience and machine learning is whether computers can break the neural codes. Machine learning algorithms to encode information into neural activity and extract information from brain patterns afford an understanding of how percepts, memories, thought and knowledge are represented in patterns of brain activities. Most of the previous studies have employed task-based functional Magnetic Resonance Imaging (fMRI) datasets for breaking the neural codes because it provides better spatial resolution in comparison with other modalities. Indeed, fMRI enables us to ask what information is represented in a region of the human brain and how that information is encoded, instead of asking what a region function is. This talk reviews two challenges in fMRI analysis, i.e. functional alignment, and feature selection. First of all, we introduce hyperalignment method and its application in fMRI analysis. And then two new approaches will be presented to improve the performance of functional alignment, including deep and supervised methods. After that, the reasons and difficulties of selecting features in task-based fMRI analysis will be discussed. Here, a novel anatomical-based feature selection method for analyzing whole-brain fMRI datasets will be introduced. In the end, we will explain some future works.

耿新

耿新,国家基金委优青,江苏省杰青,东南大学计算机科学与工程学院教授、博导、副院长,模式学习与挖掘(PALM)实验室主任。主要从事模式识别、机器学习、计算机视觉等方面的研究。在重要国际学术期刊和会议发表论文五十余篇。现为CCF青年工作委员会执委,CSIG视觉大数据专委会副主任,IEEE计算机学会南京分会副主席,江苏省计算机学会理事、青年工作委员会主任,CCF人工智能与模式识别专委会、计算机视觉专委会委员,中国人工智能学会机器学习专委会、模式识别专委会委员,《Frontiers of Computer Science》青年编委。

报告题目:
面向标记分布学习的标记增强

报告摘要:
许多机器学习任务都可以泛化为对给定的示例预测不同标记的描述度(即标记描述示例的程度),而所有标记对一个示例的描述度构成该示例的标记分布,在以标记分布标注的数据集上学习的过程称为标记分布学习。现实世界中存在不少本身就具有标记分布信息的数据,而更多情况下,标记分布信息不完整时,可通过先验知识或者机器学习方法生成完整的标记分布,这一过程称为标记增强。标记分布学习方法配合标记增强方法能够有效匹配大多数有监督学习问题,具有广泛的应用前景。