科学研究离不开数据。近现代科学诞生以来,科学研究经历了从孤数据、小数据、多数据到大数据的漫长演化过程。自年Nature《大数据》专刊、《大数据时代》一书出版以来,“大数据”的概念快速席卷全球。“大数据”的概念揭示出新世纪以来全球数据呈现出的前所未有的爆发式增长态势,几乎每个领域都在经历着数据爆炸,都被推进了一个前所未有的大数据时代。
大数据时代的来临,全面催生科学研究领域科研模式的重大变革,以数据分析为主的专门学科领域的“信息学”(Informatics)就开始蓬勃发展。继实验科学、理论科学、计算科学之后,出现了以数据为中心思考、设计和实施科研活动,通过对海量数据的处理和分析来获得科学发现的第四范式——“数据密集型科学发现”。随之,生物信息学、医学信息学、化学信息学等一系列专门学科信息学不断产生,而且新的专门领域的学科信息学还在不断涌现。随着数据密集型科学的科研范式快速兴起,科学大数据已经成为世界各国科技发展的新型关键战略性资源,也是科研产出的又一项重要成果。
▲科学研究的四交叉方法
数据是各个学科的生命力和基础,处于核心支配位置
在大数据密集型科学新范式背景下,“数据密集”、“数据驱动”已成为科学研究与学科领域知识发现的显著特色和主要方式,基于大数据开展学科领域知识发现的新的研究模式成为科技领域知识发现方式变革的重要方面。可以概括地说,在科技大数据时代和数据驱动的科学新范式下,科技大数据是科技研究与发现的战略性新生产资料,先进计算是科技创新与发展的战略性新生产力,而未来网络和信息通讯是战略性新生产关系。在科技大数据时代和数据驱动的科学新范式下,基于科技大数据的科学知识发现能力日益成为科技研发竞争力的关键,而战略性基础是科技大数据体系的有效管理、高效服务、深度应用等。可以毫不讳言地说,科技强,则国家强;而数据强,则科技强。未来,真正是“得数据者得天下”、“得数据者得创新”。
学科信息学(SubjectInformatics)是在数据密集型科学新范式下发展起来的新兴学科,其内涵是学科领域在科研创新中应用信息科学与计算科学的技术、手段与方法,进行科学数据收集、存储、处理、再分析、可视化和知识发现,从而创造新知识、发现新方法、提供学科战略决策咨询的交叉性学科。学科信息学的本质是学科研究的全面信息化和数据化,是信息科学和数据科学在特定学科领域研究中的内生化应用。学科信息学是基于学科数据的、用于科学研究发现活动的一般性规律的科学,是在专门学科信息学发展与应用基础上发展起来的,是专门学科信息学理论与实践的一般化发展,重点突出了对学科信息、数据的计量分析与挖掘分析。学科信息学的发展对学科领域的知识创新和知识发现具有至关重要作用。
▲学科信息学的学科体系
《学科信息学与学科知识发现》(张志强主编.北京:科学出版社,.10)一书尝试从学科信息学与数据驱动的理论、数据、技术和应用等方面进行全面的理论梳理,对“什么是学科信息学”、“学科信息学的发展现状如何”、“学科信息学的具体应用领域有哪些”等一系列关键问题进行深入剖析,并针对科技大数据的理论、数据、方法技术和应用进行研究,包括如何建设科技大数据体系、如何在科技大数据中进行知识发现、如何对当前科技大数据知识发现进行应用等一系列关键问题。全书共分理论篇(1章)、数据篇(2章)、技术篇(4章)与应用篇(7章)等四篇共14章,分别对上述问题予以深入阐述。
←左右滑动查看目录→
综述专门学科信息学的产生背景与内涵基础上对学科信息学的缘起与内涵进行了系统的介绍,并对生物医学信息学和*策信息学这两个典型学科信息学的发展应用现状进行了详细解读。最后,从多个视角对学科信息学的重要作用和应用前景进行了剖析和展望。
▲不同阶段的*策科学研究主题知识图谱(动图)
本书利用CiteSpace软件,对*策科学领域不同阶段进行研究主题聚类和识别,从知识层揭示*策科学的发展演化特点。
选取发展最为迅速的学科信息学与数据驱动的学科知识发现学科——生命与健康科技领域为分析对象,在系统梳理和调研生命与大健康领域科学数据相关*策和数据库基础上对国内外生命与健康科学大数据平台进行了归纳和总结。同时,选取中国科学院成都文献情报中心与广州生物医药与健康研究院联合研建的“干细胞知识发现平台”为研究对象,在梳理国内外知识发现的技术方法与实践应用和进展基础上,从信息对象实体、信息需求与知识服务等方面对干细胞科技大数据建设情况等进行总结。
▲干细胞领域知识发现平台
资料来源: