传统知识管理受技术条件限制,严重依赖于人对信息知识的加工水平,且不能从技术上解决跨系统、跨平台、跨数据库的问题,从而严重制约了知识管理平台在研发创新中的重要作用,近年来已无明显技术进步和项目应用。全新一代的基于人工智能技术的语义知识管理平台,其在继承传统知识管理平台优点的基础上,以科学创新理论为方法论,将人工智能技术应用到知识管理应用领域,从而实现信息、知识的智能获取和创新应用,极大地提高研发设计的效率和质量,并为企业院所的信息化大融合(智慧院所)作好数据融合的准备。
1.语义知识管理平台建设目标
在继承传统知识管理平台优点的基础上,以科学创新理论为方法论,将人工智能技术应用到知识管理应用领域,从而实现信息、知识的智能获取和创新应用,极大地提高研发设计的效率和质量,并为湖北省标准化与质量研究院的信息化大融合(智慧院所)作好数据融合的准备,促进湖北省标准化与质量研究院创新驱动发展。
2.语义知识管理平台建设原则
语义知识管理平台的建设应遵循如下原则:
(1)开放性原则。面对国内外各类数据资源,数据库服务平台技术的开放性至关重要,直接关系到内容的交换、系统的平滑升级、先进技术的更好利用。操作平台、存储架构、软件平台、网络架构等都建立于主流相关厂商现有开放策略和标准的基础之上。
(2)先进性原则。立足于国内最先进的系统设计思想,在投资一定的前提下,采用可能的最先进的软件技术和开发工具,以达到使系统具备在国内处于领先地位的终极目标。
(3)技术的标准性和规范性原则。在技术上要采用国际标准或国外先进标准,在项目设计中要采用发展前景优秀的新技术,使平台有利于技术升级和设备维护。在管理上要严格执行规范,保证各系统之间的信息共享、互通互连。要兼顾到未来的技术发展和产品的长期稳定性,充分采用现有成熟而先进的技术,保证项目满足实际应用需求。
(4)安全可靠性原则。提高整个系统和网络的性能的前提是要保障数据可靠安全的生成、存储、处理和传输。系统体系能够支持一个数量持续增长、复杂的业务应用,并具有较高的网络效率和可靠性,为系统提供可靠的数据处理支持环境。
(5)实用性原则。用户界面做到直观、丰富、友好,把数据库平台建成一个结构合理、功能齐全、界面友好、实用好用的系统。
(6)系统强伸缩性原则。平台要有较远的前瞻能力和预见能力,当前提出的需求也不是一成不变的,同时,随着时间的推移更先进的管理思想与保障技术也逐渐出现,所以,保证时间、成本的增长在允许的前提下时,系统的伸缩性要给予最大程度的考虑。
3.语义知识管理平台建设内容
3.1技术架构
采用“自建+外采”的整合方式,通过大数据信息技术对标准、专利等文献知识进行统一规划、整合加工、深度挖掘分析等,逐步建立语义知识管理平台。自建资料包含国家标准、行业标准、地方标准等相关文献信息,外采资料指通过第三方数据库、万维网获取的各种类型的资料。将自建和外采资料通过语义知识管理平台有针对性地对行业或机构发展中的重点和难点问题进行知识关联,一站式知识获取,并提供知识分析和服务,形成有相关研究数据支撑、可信度较高的可行性研究报告。
3.2核心技术
(1)机器学习和深度学习技术。使用训练数据集来教计算机应该怎么做,然后系统去执行该任务。通过清洗准备大数据,使机器学习使用训练数据集来进行分类,调节特定的算法来实现目标分类,从而达到该计算机可学习识别知识信息中的关系、趋势和模式的目的。即信息知识的获取和分类用是由数据、信息内容自身决定的,不是基于人为标注加工、流程控制,技术上才能满足创新应用对知识的实时、多维、答案提示要求。
(2)自然语言处理和机器翻译。基于机器学习和深度学习技术,语义知识管理平台将人工智能应用(自然语言处理、机器翻译、语义搜索)服务于创新研发领域。自然语言处理将数据源中的非结构化数据转化为结构化数据,以实体和事件为中心进行跨文本的信息聚合,既能自动化地实现海量数据、信息的加工处理,又能实现友好的人机对话,从根本上解决传统知识管理平台内容加工对人的依赖性,彻底释放知识的价值。
(3)语义搜索。核心是基于用户的搜索。系统理解用户的搜索行为和动机,而不是仅仅基于关键词去简单搜索,而是在原有关键词的基础之上,根据用户情景以及意图分析,将最符合用户需要的信息、知识推送给用户。
(4)第三方数据库海量的大型多语种语料库。第三方数据库海量的、已清洗的多语种数据知识内容是人工智能技术中非常重要的训练数据,它帮助语义知识管理平台成为实际服务于研发创新的工程应用。
(5)长短期记忆(LSTM)与门控循环单元(GRU)技术。因为其不仅具备与其他循环神经网络一样的优点,并且还有更好的记忆能力,能够解决机器学习技术“失忆”的缺陷,使语义知识管理平台无论是运行于互联网还是企业内网都能保证相同的计算应用能力。
3.3总体架构
基于人工智能技术的语义知识管理平台总体架构如图1所示。整个系统框架分为4层,自下而上分别是:数据层、知识获取层、知识应用层以及业务层。
(1)数据层。利用第三方数据库、万维网,将由外部导入的知识与内部知识库结合,形成完整的湖北省标准化与质量研究院内部知识获取、知识应用、知识共享平台。
(2)知识获取层。可以灵活的进行一站式知识获取,简单易用;提供丰富的、专业的、权威的、可追溯的知识文献;提供知识库定制,知识订阅和推送服务;实现中、英、德、日、法、俄等跨语种全文摘要翻译及原生语言文献自动获取;外网、内网知识内容的统一管理,保证知识内容的完备性。
(3)知识应用层。基于全球专业权威信息知识内容,提供专利、市场、技术、竞争对手分析和领先技术追踪,为新产品、新型号、新工艺、新设计提供技术支撑;灵活易用的二次开发能力,将现有设计研发系统与知识创新研发工具集成扩展,形成湖北省标准化与质量研究院专有的研发设计制造一体化平台。
(4)业务层。在继承传统知识管理平台优点的基础上,以科学创新理论为方法论,将人工智能技术应用到知识管理应用领域,从而实现信息、知识的智能获取和创新应用。
4.结语
基于人工智能技术的语义知识管理系统利用第三方数据库、万维网,将由外部导入的知识与内部知识库结合,形成完整的湖北省标准化与质量研究院内部知识获取、知识应用、知识共享平台。知识管理系统提供了统一的检索平台供查阅,实现了资料的统一管理和有效利用,提升了标准规范的利用价值,提高了工作效率,创新了服务质量。后续将不断挖掘平台价值和潜能,深化合作,促进更多新的技术平台在院内落地,不断激发创新活力,促进改革创新,实现跨越式发展。
作者:余 梅1 徐术坤1 方 远2 邵 璇1([1]湖北省标准化与质量研究院;[2]中南建筑设计院股份有限公司)
本刊发于《中国高新科技》杂志2020年第21期
(转载请注明来源)