如何实现不同维度的数据共享?医疗AI场景落地要「打地基」

作者:wujing 浏览(695) 评论(0)
如何实现不同维度的数据共享?医疗AI场景落地要「打地基」

来源:火石智造   文 | 陆月琴



01

VIEWPOINT


AI:从技术教育市场过渡到思考如何将技术与医药产业相结合落地


随着5G时代的推进,人工智能发展三大要素:数据、算法、算力逐步走向成熟,经历了技术驱动和数据驱动阶段,行业进入快速成长期,通过人工智能不同领域的深化应用,以人工智能为主要技术的行业格局逐渐清晰,人工智能现在已经进入场景驱动阶段,深入落地到各个行业之中去解决不同场景的问题。


此类行业实践应用也反过来持续优化人工智能的核心算法,形成正向发展的态势。目前,人工智能主要在制造、家居、金融、零售、交通、安防、医疗、物流、教育等行业中有广泛的应用。


在医疗行业中,垂直领域的图像算法和自然语言处理技术已可基本满足医疗行业的需求,市场上出现了众多技术服务,如智能医学影像技术,人工智能细胞识别医学诊断系统,智能辅助诊断服务平台,统计及处理医疗数据等。近年来,很多厂家都着力于治理医疗数据,为接下来的区域性医疗信息互通做准备,结合CDSS等许多临床辅助系统,不断推动着精准医疗的进程,其中NLP(自然语言处理)是大家都非常关心的一个技术热点,从NLP到知识图谱,如何让机器和人一样进行“思考”和“推断”是一个技术难题。


02

VIEWPOINT

本体:元数据之间关系的逻辑定义是实现数据共享的基础


我们从最原始的规则型知识库到目前的知识图谱,本体在语义Web 中扮演着非常重要的角色,它是实现语义层次上Web 信息共享和交换的基础。


在众多本体定义中,接受度最高的是由斯坦福大学 Tom Gruber 提出的,本体是概念模型的明确的规范化说明,本体的形式化定义为一个五元组,分别为:概念(Concept)、关系(Relation)、属性(Property)、公理(Axiom)以及函数(Function),释义如下:


1)实例:是本体中逻辑层次的最底层。

2)概念:它在本体中扮演着极其重要的角色,是人与机器交互的桥梁。

3)关系:关系用来形容两个或两个以上概念实例之间的联系。

4)属性:属性分为对象属性和数据属性。对象属性连接的是个体和个体,而数据属性连接的是个体和文字值,也可以简单理解为是语句中描述个体的谓语。

5)公理:是指公认的事实,可以提供用于推导的必要和/或充分条件。用来进行知识推理。

6)函数:函数是关系的特定表达形式。可以使得推理从一个概念指向另一个概念。


按照本体的作用,通常分为三种类型,分别是:


1. 元数据本体:本体可以被用来标准化各种数据。传统元数据之间的关系缺乏有效的表达,机器不能理解。而本体可以有效地给出元数据之间关系的逻辑定义,并增强不同元数据系统之间的互操作性。例如,美国NIH资助并组织构建了一套人病原基因组序列的标准化元数据体系,并对这些元数据进行了基于OBI的本体化。


2.作为增强版控制术语集的本体:控制术语集又称为受控词表,是一种对知识术语加以组织整理,权威认定,赋予特定编码,以利于特定语境下的标记与检索使用。此类术语集在医学界应用广泛。例如,MedDRA、SNOMED-CT、MeSH等。


3.作为知识库的本体:本体亦可以作为一个知识库去存储一个领域内的知识,随着人们不断探索,通过大量结构化的关系数据,可以方便人们查询使用,更方便不同地域、不同领域、不同用户之间对于已知知识的交流分享,在原有的基础上创造新的本体,比如药物神经不良反应本体的构建。


本体对现代生物医学大数据与精准医疗的研究应用很重要,然而本体这个外来词对很多生物医药学研究者与临床医疗工作者还很陌生。了解医药学本体概念和研究方法有助于加速大数据、人工智能技术在医疗健康场景落地。


PS:关于“本体”的理解会有具体案例分析,尽请期待下回讲解~


参考资料:


1、何勇群.余 红.杨啸林.邵 晨.周 伟.朱 彦.王海河.刘清平.谢江安.ZHENGJie.朱伟民.本体:生物医学大数据与精准医学研究的基础.生物信息学.2018年3月第16卷第1期


2、马旭明.王海荣.本体构建方法与应用.信息与电脑.2018年第5期

评论

没有登录不能评论