产业界高峰论坛-中国计算机学会人工智能大会(CCFAI 2021)

产业界高峰论坛

时间: 7月24日上午，地点: 烟台国际博览中心二层第六会议室论坛主席：叶杰平，贝壳找房副总裁、首席科学家论坛主持人：张露露，贝壳找房人工智能技术中心，高级技术发展专家
时间	报告名称	报告人
08:30 – 08:35	开场
08:35 – 09:20	AI在新居住领域的应用	叶杰平贝壳找房副总裁、首席科学家美国密西根大学教授
09:20 – 10:05	百度数据联邦平台和新冠疫情预测的合作研究	窦德景百度研究院大数据实验室和商业智能实验室主任美国俄勒冈大学教授
10:05 – 10:15		茶歇
10:15 – 11:00	超大规模多模态预训练模型M6	杨红霞阿里巴巴资深算法专家
11:00 – 11:45	大规模并行文本生成技术的创新和实践	周浩字节跳动人工智能实验室资深研究员

报告介绍：

叶杰平

个人简介：2005年获得美国明尼苏达大学计算机博士学位。现任贝壳找房副总裁、首席科学家，曾担任滴滴出行副总裁、AI Labs负责人。同时，现任美国密西根大学计算医学与生物信息学系、电气工程与计算机科学系教授，曾在美国亚利桑那州立大学任教。此外，叶杰平博士是IEEE Fellow、ACM杰出科学家和智源学者。主要从事机器学习、数据挖掘和大数据分析领域的研究，致力于推进人工智能技术在居住、出行和医疗等领域的应用。他是多个国际顶级人工智能会议的资深委员会会员、区域主席和委员会副主席,也是多个顶级人工智能期刊的副主编。曾获得KDD和ICML最佳论文奖，荣获2010年美国国家自然科学基金会生涯奖、2017年中国计算机学会“CCF科学技术奖科技进步卓越奖”、2019年度国际运筹学领域顶级实践奖--瓦格纳运筹学杰出实践奖（Daniel H. Wagner Prize）。

报告题目：AI在新居住领域的应用

报告摘要：贝壳找房作为科技驱动的新居住品质服务平台，通过开放数据资源和技术能力，以数字化手段重塑居住产业互联网，聚合和赋能全行业的优质服务者，为消费者提供包括二手房、新房、租赁、装修等全方位的居住服务，打造“数字新居住、产业共生长”的行业生态。目前，贝壳找房已进驻全国103个城市，入驻合作新经纪品牌超过273个，连接经纪门店超过4.9万家，服务超过52.8万经纪人。在本次报告中，叶杰平博士将分享贝壳如何利用大数据和AI技术来分析居住场景下特有的数据，为用户提供可持续、高效的居住服务。此外，还将发布由贝壳联合CCFAI共同组织的居住科技领域首次数据竞赛。

窦德景

个人简介：窦德景是百度研究院大数据实验室和商业智能实验室的主任，也是美国俄勒冈大学计算机和信息科学系终身正教授。窦教授1996年在清华大学电子工程系本科毕业，2004年在耶鲁大学获得人工智能专业博士学位, 2012-2013年曾在斯坦福大学生物医学信息研究中心任客座副教授。窦教授在2005年建立Advanced Integration and Mining (AIM) Lab, 2018年起担任美国NSF大（深度）学习中心（Center for Big Learning）的俄勒冈大学主任。窦教授的研究领域包括：人工智能，数据挖掘，数据整合，自然语言处理，和生物医学和健康信息学。窦教授发表了超过100篇的学术论文，很多文章发表在最有声望的会议文献和学术期刊。窦教授还是很多会议程序委员会成员并担任过五次主要国际学术会议的程序委员会主席,自2007年以来多次被NSF（美国国家科学基金）和NIH（美国国家卫生研究院）邀请作为专家评审团成员，现在是数据语义学和智能信息系统等三个学术期刊的编委会成员。窦教授作为主要项目负责人（PI）获得过NSF和NIH超过500万美元的研究基金，目前是ACM和IEEE的高级会员。

报告题目：百度数据联邦平台和新冠疫情预测的合作研究

报告摘要：在大数据的研究和落地应用中，一个重要问题是：如何在保证数据隐私与安全的前提下，使得多个模型提供方和数据提供方能够合作解决重要问题。百度是国内领先的互联网和人工智能平台公司，也是唯一同时拥有大量搜索数据和地图数据的企业。为了国内高校，政府部门，研究所，和其他企业能够更安全和有效地利用百度的大数据，我们百度研究院在2020年建立了百度数据联邦平台（简称数邦）。数邦属于百度大脑的一部分，具有高可信，分布式机器学习，和基于云有效资源管理等三大属性。从2020年初开始的新冠疫情预测的合作研究中，我们使用数邦平台和国内多个高校，政府部门，研究所，和企业开展合作，在时空大数据挖掘和深度学习方向取得了一系列有意义的研究成果。

杨红霞

个人简介：美国杜克大学博士学位，阿里巴巴资深算法专家，原IBM全球研发中心Watson研究员，Yahoo！主任数据科学家。带领团队开发基于计算平台和搜索推荐的智能算法，稳定的支持了阿里巴巴搜索、广告等30几个核心BU和其业务场景。在顶级统计和机器学习国际学术期刊会议发表论文70余篇，美国专利9项。目前主导阿里巴巴第三代人工智能的关键性突破技术--认知智能技术发展和其在搜索推荐等业务场景落地，已经获得2019世界人工智能大会最高奖项卓越人工智能引领者（Super AI Leader，简称SAIL奖），2020年国家科学技术进步奖二等奖和2020年杭州市领军型创新团队等。

报告题目：超大规模多模态预训练模型M6

报告摘要：继清华大学和阿里巴巴达摩院联合研发的超大规模多模态预训练模型M6连续突破百亿、千亿、万亿里程碑后，在国产超算的加持下，我们最终成功实现了全球最大规模预训练模型的研发，其参数规模高达130万亿，远超海外谷歌大模型1.6万亿规模及人类大脑神经元千亿级数目。超大规模多模态预训练模型被认为是下一代人工智能的基础设施，随着参数规模的不断提升，研究团队发现算法的表现也随之大幅提升，在部分领域展现出接近人类认知的表现。作为中国大模型研发的代表作之一，M6有望应用于包括传统制造业在内的诸多生产领域。比如，M6拥有惊人的设计才能，可以根据文本自动生成超高清图片，它设计的服装模拟图清晰可见织物纹理，能大幅降低服装制造业生产成本和周期。此外，M6大模型也有很强的写作才能，可以根据图片自动创作文案，在电商等领域有广泛的应用空间。目前M6已在淘宝、支付宝等平台投入使用。

周浩

个人简介：周浩，字节跳动人工智能实验室资深研究员，主要负责文本生成技术的研究和应用。周浩于2017年博士毕业于南京大学，获得南京大学优秀博士论文和中国人工智能学会优秀博士论文。他的研究方向包括机器学习及其在自然语言理解中的应用。目前，他主要关注深度文本生成模型。他曾担任多个会议的程序委员会成员，多次在国际会议如EMNLP等做Tutorial报告，并在相关会议包括ACL, EMNLP, NeurIPS, ICML和ICLR上发表论文50余篇。

报告题目：大规模并行文本生成技术的创新和实践

报告摘要：文本生成是自然语言处理的重要方向之一，很多关键的下游任务包括机器翻译，人机对话，自动问答等都依赖文本生成技术。当前主流的文本生成模型主要遵循自左至右的生成范式，并使用Transformer来参数化，在实践中取得了不错的效果。但是自左至右的自回归式生成会带来每个位置生成时互相等待，效率下降的问题。为此有研究者提出了并行（非自回归）文本生成技术，在损失生成准确率的前提下大大提高了生成的效率。本次报告我们将介绍字节跳动在大规模文本生成技术方面的探索，深入讨论高效且不损失精度的并行文本生成技术是否可行，并且尝试从理论和实践两个角度给出一些初步结果。

产业界高峰论坛

主办单位

承办单位