“从非结构化数据当中提取信息,是非常重要的工作。非结构化数据可以是影像,也可以是文本。”汉斯说,将来源不同的数据与具体病例关联,进而进行研究。“这些数据需要在机器内部互相理解,比如手术报告,医生会以个性化的语言书写,除了真相外,医生还会写下他怀疑的信息,否定的信息等,如何将这些信息提取出来,进行分门别类的分析呢?”汉斯介绍,很多医疗领域从业者已经建立了很大的知识库,比如联合医疗语言系统,这是一个非常大的知识体系,有18万不同的概念,算是一个小型的“知识图谱”,作为基础架构更待共同完善。

制造业方面,工业企业利润增速自2018年5月开始持续下滑,12月数据已降至-1.9%,显示出企业盈利情况的走弱。从PMI分项来看,2018年下半年生产指数开始下滑,相应的产成品库存也逐渐抬高,自12月份开始,库存指数连续两月出现下降,企业开始进入主动去库存阶段,反映出对未来经济悲观预期程度的加深。由此可以推断,2019年,在企业盈利走弱以及工业企业去库存的过程中,制造业投资增速将逐步放缓。