报告简介
欢迎来到广州!
报告人:倪明选, 澳门大学讲座教授
报告题目:“平民化”——大数据技术发展的新目标
报告摘要:
过去五年,大数据技术经历了一段高速发展的时期。其中,以 Hadoop 和 Spark 为代表的大数据处理技术日趋成熟与完善,广泛地被许多企业或机构采用;基于传统机器学习方法或深度学习的大数据预测与分析技术迅速流行,在 BAT 等大型互联网企业中得到了深度应用;而云计算、异构计算、可视化等相关技术,也在大数据处理和大数据分析技术的推动下迅猛发展。然而,尽管大数据的观念已经深入人心,大数据的价值已被普遍接受,大数据技术却还没有真正普及。随着互联网+的兴起,越来越多的传统企业开始拥抱互联网,正在或将要收集和积累更多的数据。但是,如何让他们也能运用大数据技术将数据价值真正发挥出来,并不是一项简单的工作。许多传统企业或机构开始在大数据领域进行投入,却进展缓慢,始终“不得其门而入”。
我们认为,大数据应用目前不够普及的主要原因是之前的技术发展强调“可扩展性”、“处理速度”、“预测准确度”等专业指标。造成的结果是对于领域专家(非计算机专家)而言,大数据技术的学习曲线非常陡峭。在目前已经能够满足大规模数据的处理、管理、分析与挖掘需求的情况下,大数据技术需要以“平民化”——即如何以技术方式让数据的获取、使用和实施等各个环节变得更为容易——作为新的发展方向。本演讲将以实际的商业大数据应用案例为例子,梳理大数据“平民化”的具体目标,阐述其面临的主要挑战,并提出可能的解决方案。
个人简介: 倪明选是澳门大学讲座教授并担任负责学术事务的副校长。在今年一月加入澳门大学前,他是香港科技大学计算机科学与工程系讲座教授并担任校长特别助理与霍英东研究院院长。倪教授曾担任国家973计划在无线传感网络项目首席科学家,也兼任上海交通大学神州数码讲席教授,北京清华大学IV讲席教授与新竹清华大学孙运璿荣誉讲座教授 。倪教授于1980年获得美国普度大学电机工程博士学位,由于其在并行计算和分布式系统研究领域的卓越贡献,他在1994年被评为IEEE Fellow。他的文章与论文大多发表在一流的期刊与会议,被同行高度引用超过 21,000 次以上,H-index是63。为表彰他在计算机领域的学术成就和为中国的计算机事业所作出的杰出贡献,他获得中国计算机学会2009年海外杰出贡献奖。倪教授及其领导的团队荣获2010年教育部自然科学一等奖,2011年国务院自然科学二等奖,与2015年广东省自然科学一等奖。
报告人:夏勇, 西北工业大学教授
报告题目:面向智能化医疗的医学影像分析技术
报告摘要: 信息处理技术的飞速进步,推动了传统医疗向数字化医疗的转变,而今更朝向智能化医疗发展,从而给医学影像分析带来了空前的机遇与挑战。本报告将基于群体智能和人类视觉系统带来的启发,从医学影像去噪增强、目标区域分割、图像分类和感兴趣目标跟踪等方面介绍医学影像分析领域的一些研究内容。
个人简介: 夏勇,博士,西北工业大学教授,分别于2001、2004和2007年从西北工业大学计算机学院获得工学学士、工学硕士和博士学位,2007年1月加盟悉尼大学信息技术学院生物医学与多媒体技术(BMIT)实验室,开展博士后研究,2013年入选国家“青年千人”计划,并于同年底回到西北工业大学计算机学院工作。 迄今已在重要国际期刊和会议上发表学术论文50余篇,其中近30篇发表在被SCI检索的期刊上,先后参与了十多项中国和澳大利亚的国家级科研项目,在图像处理、医学影像分析、计算机辅助诊断和模式识别等领域做出了数项具有一定科学价值和应用价值的贡献,受到了国内外同行的积极评价,部分成果已经被应用在一些科研和工程项目中,提高了图像处理与分析的质量,也因此得到了国防科学技术奖三等奖、中国计算机学会优秀博士论文奖和全国优秀博士学位论文提名的肯定。
报告人:袁 野, 东北大学教授
报告题目:Query Processing over Big Uncertain Graphs
报告摘要: Recent advances in social and information science have shown that linked data pervades our society and the natural world around us. Therefore, graphs have become ubiquitous models to represent such complex structured data. However, in many novel applications, uncertainty is inherent in the data due to a variety of reasons, such as noisy measurements, inference and prediction models or explicit manipulation, e.g., for privacy purposes. In these cases, data can be represented as an uncertain graph, also called probabilistic graph, i.e., a graph whose nodes and edges are labeled with probabilities denoting their existences. This talk focuses on the data model, semantics, computational complexity and algorithms of querying processing over big uncertain graphs. In this talk, we will first introduce data models that are used to model uncertain and probabilistic graph data. Next, we will discuss various types of queries together with their query processing techniques. Finally, we will introduce some applications of querying uncertain graphs, i.e., routing in sensor networks and medical image segmentation.
个人简介: 袁野,教授,就职于东北大学计算机系统研究所。 分别于2004年、2007年和2011年获得东北大学计算机专业学士、硕士和博士学位。获得2012年CCF优秀博士论文奖、2013年全国优秀博士论文提名奖、2012年辽宁省优秀博士论文奖、2014年辽宁省科技进步一等奖。在SIGMOD、VLDB、ICDE、VLDB Journal、IEEE TKDE等国际知名学术会议和期刊发表论文30余篇。主要研究方向包括: 图数据管理、不确定数据管理、 数据密集型计算、 数据隐私保护等。
报告人:邹磊,北京大学副教授
报告题目:Natural Language Question Answering Over Knowledge Graph----A Data-driven Approach
报告摘要:
As more and more RDF data become available on the web, the question of how end users can access this body of knowledge becomes of crucial importance. Although SPARQL is a standard way to access RDF data, it remains tedious and difficult for end users because of the complexity of the SPARQL syntax and the RDF schema. An ideal system should allow end users to profit from the expressive power of Semantic Web standards (such as RDF and SPARQLs) while at the same time hiding their complexity behind an intuitive and easy-to-use interface. Therefore, RDF question/ answering (Q/A) systems have received wide attention in both NLP (natural language processing) and DB (database) areas.
In this talk, besides reviewing some existing work about RDF Q/A in both NLP and DB areas, we introduce our recent work along this direction. Specifically, we design a graph-based RDF Q/A system, called gAnswer, representing an natural language question as a query graph. Then, we answer natural language questions by employing subgraph matching process. We also present another work, automatically building templates for RDF Q/A, which is based on joining natural language query workloads and SPARQL query workloads.
个人简介: 邹磊分别于2003年和2009年毕业于华中科技大学计算机科学与技术学院,获得工学学士和工学博士学位。邹磊于2014年获得中国计算机学会自然科学二等奖(“海量图结构数据存储和查询优化理论研究”,邹磊排名第一)和2009年获得中国计算机学会优秀博士学位论文提名奖。邹磊于2009年9月加入北京大学计算机科学技术研究所,任讲师;并于2012年8月晋升副教授。他目前的研究领域包括图数据库,RDF知识图谱,尤其是基于图的RDF数据管理,面向海量知识图谱的自然语言问答系统。目前其已经发表了30余篇学术论文,包括CCF-A类的国际顶级期刊/会议论文15篇,例如SIGMOD, VLDB, ICDE, TKDE, VLDB Journal, TKDD等
报告人:董玮,浙江大学副教授
报告题目:Towards a Software-Defined Architecture for the Internet of Things
报告摘要: Software defined networking has been a hot researchtopic for the networking community. Software design for the Internet of Things (IoT) has many differences from the Internet. In this talk, I will focus on the design of a software-defined architecture for the IoT. I will present a novel taxonomy for Software Defined IoT according to different abstractions of functionalities. I will examine the major challenges towards a generic and efficient Software-Defined IoT architecture. I will also review some useful techniques which are either adopted in existing solutions or can be used to address part of the challenges. Our recent work towards this direction will also be introduced.
个人简介: 董玮 (http://www.emnets.org/dongw),浙江大学计算机科学与技术学院副教授,博导,浙江大学求是青年学者,IEEE、ACM会员,中国计算机学会高级会员。2001年-2005年在浙江大学计算机学院学习,获工学学士学位。2002年-2005年进入浙江大学竺可桢学院工高班学习。2005年-2010年在浙江大学计算机学院学习,获工学博士学位。博士论文《面向无线传感网的嵌入式操作系统设计》获2011年浙江省优秀博士学位论文和2013年全国百篇优秀博士论文提名。2011年在香港科技大学计算机系,从事博士后工作。主要研究方向为物联网/传感网、网络测量、无线与移动计算。承担国家973基础研究计划、国家自然科学基金、教育部博士点基金等多项国家和省部级项目。已发表论文70多篇,包括国际一流期刊IEEE/ACM TON, TC, TPDS, TMC, TOSN, TECS以及国际一流会议ACM SIGMETRICS, IEEE INFOCOM, IEEE ICNP, RTSS, ICDCS等。担任IJDSN的客座编委、IEEE ICPADS’15程序委员会副主席、IEEE RTSS’15、IEEE DCOSS’15、ICCCN’15、BIGCOM’15、VTC’15、APSCC’14等多个国际知名会议的程序委员会委员,长期担任TON, TPDS, TMC, ICNP, INFOCOM等期刊和会议的审稿人,全国高校物联网应用创新大赛仲裁委员会委员、浙江省物联网科技创新服务平台技术委员。
报告人:俞扬,南京大学副教授
报告题目:演化学习研究进展
报告摘要: 机器学习任务中往往包含非凸优化问题,以往基于凸放松的解决方案常带来很多局限,非凸优化问题的有效解决将为机器学习带来更大的发展空间。演化优化算法在许多复杂工业优化中已显示出卓越的优化性能,为解决非凸机器学习问题提供了选择,然而以往演化优化算法由于理论基础薄弱,难以深入应用于机器学习任务中。本次报告将汇报我们对于演化优化算法近似逼近能力的理论分析工作,该工作揭示了演化算法可以是目前最好的近似优化算法,并汇报基于该理论,将演化优化应用在机器学习任务中的一些结果。
个人简介: 俞扬,博士,副教授。主要研究领域为人工智能、机器学习、演化计算、数据挖掘。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位。2011年8月加入南京大学计算机科学与技术系、机器学习与数据挖掘研究所(LAMDA)从事教学与科研工作。曾获2013年全国优秀博士学位论文奖、2011年中国计算机学会优秀博士学位论文奖。发表论文20余篇,包括多篇Artificial Intelligence、JAIR、IEEE TEC、IJCAI、AAAI、KDD等国际一流期刊和会议,获得KDD'12 Best Poster、GECCO'11 Best Theory Paper、PAKDD'08 Best Paper、PAKDD’06数据挖掘竞赛冠军等论文和竞赛奖。任《Frontiers of Computer Science》青年副编辑、人工智能领域国际顶级会议IJCAI’15高级程序委员、IEEE计算智能协会演化计算技术委员会委员、IEEE计算智能协会数据挖掘与大数据分析技术委员会委员、Artificial Intelligence、IEEE TEC、IJCAI、KDD、ICML、ICCV等多个一流期刊的评审人和会议的程序委员。
报告人:王成,同济大学研究员
报告题目:在线社交网络数据流量建模与网络负载分析
报告摘要: 近年来,作为典型的 OTT(Over The Top)服务,在线社交网络(Online Social Networks, OSN)的规模正在迅速扩张,其产生的数据流量也在迅猛增长,这使得研究大规模OSN服务对承载网络施加的流量负载成为当下正受到互联网相关产业和研究界高度关注的亟需解决的问题。OSN中的数据传输模式不同于传统网络,其内容分发所产生的流量受到包括用户地理分布、用户社交关系以及分发内容特征等诸多方面的影响,这使得研究OSN流量负载具有独特的挑战性。我们拟从OSN内容分发数据流量的建模着手,解析数据流量的生成机制和时空分布规律,分析网络流量负载在动态环境下的时空分布律;依此为评估当前OSN数据传输系统的性能提供理论指标,为面向OSN服务的承载网络架构优化问题以及数据传输协议改进问题提供理论指导,为探究大规模 OSN 信息传播机理提供理论基础和分析方法。
个人简介: 王成,男,1980年3月生,现为同济大学嵌入式与服务计算教育部重点实验室副主任、研究员。主要从事无线通信网络和移动社交网络数据传输协议设计与性能分析方面的研究。在IEEE Transactions系列期刊、重要学术会议ACM MobiHoc、ACM CIKM、IEEE INFOCOM和IEEE ICDCS上共发表及录用33篇论文;获得ACM MobiHoc 2014的唯一最佳论文奖。先后获得CCF优秀博士学位论文奖和上海市优秀博士学位论文奖;入选上海市青年科技启明星计划、教育部新世纪优秀人才支持计划和上海市曙光学者计划;现任国际期刊Ad Hoc & Sensor Wireless Networks编委,入选Frontiers of Computer Science青年AE计划,任CCF YOCSEF上海学术委员。