(学术讲座现场 刘雪 摄影)
2019年11月12日,依托科技部2019年度高端外国专家引进计划“海洋综合导航定位理论与方法国际合作研究”项目的支持,应海洋与空间信息学院测绘系邀请,王东明教授在西环207为师生做了题为“大数据最新技术进展”的学术讲座。
报告从大数据挑战、大数据技术、大数据市场以及应用四个方面展开,并对其中的数据清理做了重要讲解。报告中王教授介绍了常见的大数据数据库,如HDFS、Quant cast File System、Lustre等。最后,还介绍了Weka、Carrot2以及自然语言处理工具包NLTK、开源神经网络库OpenNN等开源大数据操作软件。在报告过程中,王教授不断强调使用Linux系统做计算机方面工作的好处以及Python语言学习的重要性与实用性。
王东明,中科院测量与地球物理研究所博士,北京大学博士后,先后担任世界500强SAP Sybase Canada高级工程师,Active Energy 高级架构师,创立UeRegister(加拿大),杭州深地信息科技有限公司(中国)。主要从事数据库引擎和大数据研发,拥有大型软件开发方法,掌握软件开发生命周期(SDLC)技术,拥有SQL数据库的引擎核心技术设计架构过P级的数据库和大型分布式系统;拥有操作系统的架构技术,有自己开发的基于Linux内核的操作系统,拥有大数据的最新技术,在大数据的存储、分析和处理,大型分布式计算以及高性能GPU计算上都有丰富经验。
(作者:刘雪 黄丙湖 审核:崔学荣 来源:海洋与空间信息学院)