English

      2020年4月27日,欧洲海洋局发布《未来科学简报》第6期,题为“海洋科学中的大数据”。本期简报指出海洋科学正在迅速进入数字时代,并探讨了大数据,如高速率获取的、高维度多变量的海量数据,以推进海洋科学的潜在可能。

      简报第一章探讨了海洋观测范围和规模的扩大,以及自动化采样和“智能传感器”,正在导致数据的不断累积。这为通过更复杂的、跨学科的分析来改变我们研究和理解海洋提供了机会,并为海洋资源的管理提供了新的方法。然而,更多的数据并不一定意味着我们有正确的数据来回答许多关键的科学问题,并就可持续利用海洋资源作出科学、数据驱动的管理决策进行了讨论。简报指出,为了提高海洋大数据财富的价值,大数据就必须公开共享、互操作,并将其整合到复杂的跨学科分析中,这些要以人工智能为基础。然而,海洋科学界还没有达到大数据革命的程度,“数据泛滥”带来了一系列独特的挑战,这对许多海洋科学家来说都是新的挑战。本文分析了在海洋科学数据采集、数据处理和管理、计算基础设施和互操作性、数据共享、大数据分析、数据验证、培训和协作方面相关的瓶颈和机遇,提出应克服某些特定的挑战,以确保海洋大数据价值的最大化。并提供了大数据在支持海洋科学中应用的一些最新进展和案例。

      第二章探讨了气候科学和海洋生物地球化学,特别着重于欧洲和全球计划,以整合用于全球气候谈判的碳和其他生物地球化学数据。第三章讨论了如何利用大数据创建高分辨率、多学科的生境地图,以规划新的海洋保护区。第四章着眼于海洋生物观测,包括遗传序列、图像和水声数据,并呼吁建立一个全球连接的长期生物观测网络,以便利用大数据进行更复杂的跨学科分析。第五章论述了海洋和近海的食物供应,重点是水产养殖和利用人工智能管理海虱等暴发以及鲑鱼养殖。

      为使海洋科学成为大数据驱动的学科,简报第六章中提出以下建议:

      (1)通过不断开发“智能传感器”以实现自动采样和数据处理,从而加强数据采集,以便机器能够收集更多的海洋数据。另外建议提高数据传输的效率,以便进行更多的实时或接近实时的分析和决策;

      (2)通过更广泛地采用基于可查找、可访问、可互操作和可重用(公平)原则的社区数据标准和精心设计的数据管理计划,加强数据处理和管理,使数据具有机器可读性。建议更多地利用现有的海洋数据管理基础设施;

      (3)通过升级欧洲海洋数据管理基础设施,处理和交换更多的多学科和实时数据,提高数据的互操作性和可访问性。这些基础设施应该包括更集成的云计算、数据存储和大数据分析工具。建议欧洲海洋科学共同体更多地参与开发虚拟研究环境和欧洲开放科学云倡议。建议这些基础设施应长期保持下去,多媒体和数字部门的计算技术应得到更多的跨学科应用;

      (4)通过新的激励措施和协议,如社会网络或数据影响因素,改善科学家、工业界和政府之间的数据共享

      (5)通过发展数据科学家与海洋科学家之间的密切合作、开发标准化模型和精心管理的社区数据集来培训算法,增加大数据分析的使用并确保数据验证;

      (6)通过建立新的区域和全球海洋科学网络,并巩固现有网络,开展人工智能方面的专门培训。建议培训数据管理员,以保持数据输入人工智能算法的质量;

      (7)以工作组的形式加强海洋科学家、计算机科学家、数据科学家和数据管理人员之间的合作,让数据科学家参与海洋研究的设计。


(来源:中国网,编译:李学荣)