更新时间:2022-08-26 15:11:54

A-E

术语 定义
API(应用程序编程接口) API是指一些预先定义的函数,应用将自身的服务能力封装成API,并通过API网关开放给用户调用。API包括基本信息、前后端的请求路径和参数以及请求相关协议。
APP ID APP ID是指AnyDATA生成的密钥对。在APP认证方式下使用,用来计算校验值,API网关收到API请求后会核对校验值的正确性,完成身份认证。
本体 本体是某个领域中抽象概念的集合,能够描述某个范围内一切事物的共有特征以及事物间的关系。
本体预测 本体预测是指通过算法从一个或多个数据源预测出相关实体及其关系。
百科知识抽取模型 百科知识抽取模型是基于百科领域设计的模型,用于提取非结构化文本的相关知识。

 

F-J

术语 定义
辅助决策 辅助决策是指基于决策树或概率图等知识模型,通过规则引擎或者推理引擎,寻找及选择最佳路径,适用于路径优化、条件依赖等多选项等场景。
概念 概念是抽象的、普遍的,充当指明实体、事件或关系的类别。
关系 关系是指实体与实体之间的联系,如父子关系。
关系类 关系类是关系在概念层面的抽象,用于描述关系的类型。例如:中国 -【首都】- 北京,德国 - 【首都】- 柏林,分别表示了两个国家与两个城市的关系,但是他们都属于一个类型:【首都】。
根因分析

根因分析是一种结构化的问题处理方法,用以逐步找出问题的根本原因并加以解决,而不是仅仅关注问题的表面现象。

ADF2 的根因分析是指利用图分析技术找到根本原因的方法。

关联分析

关联分析,就是从大规模数据中,发现对象之间隐含关系与规律的过程,也称为关联规则学习。

ADF2 中的关联分析是指利用知识图谱中的实体以及实体间的关系进行关联分析,这些关系可以是知识图谱中显性存在的,也可以是利于知识图谱推理出来的

工业企业认知模型 工业企业认知模型表示了企业的价值链,包括设计、研发、生产、测试、产品市场、销售服务、供应、服务支持等。
合同要素抽取模型 合同要素抽取模型是一种基于NLP技术自动提取合同要素的模型。

 

K-O

术语 定义
科技新闻抽取模型 科技新闻抽取模型是基于科技新闻领域设计的模型,包含论文、作者、产品、公司等本体。AnyDATA系统会基于设计好的本体训练出深度学习模型并利用该模型提取非结构化文本的相关知识。
领域专家 领域专家是指某个特殊领域的专家,协助数据科学家进行知识建模、基于领域知识进行数据标注以及评估认知智能应用效果。
领域认知智能 领域认知智能是利用人工智能的手段获取 领域知识 并利用 领域知识 完成领域内任务的技术体系。
领域智商 领域智商即领域知识网络的智商,用于衡量某个领域知识网络在该领域认知智能应用时,可达到的智慧程度;它是领域知识网络的价值量化指标。
领域知识 领域知识就是指一组有内在联系的知识的集合,它往往与特定的职业、研究方向、兴趣、社群或文化圈层等相关联。
领域知识网络 领域知识网络是围绕领域认知模型的知识表示集合,包括领域的领域知识图谱、领域词库、领域语言模型、领域规则库等。
领域认知模型 领域认知模型是对领域内的概念类或现实世界中对象的可视化表示。它专注于分析问题领域本身,发掘重要的业务领域概念,并建立业务领域概念之间的关系。
领域知识图谱 领域知识图谱是某个领域的知识图谱。
领域词库 领域词库是某个领域内术语、专用语的集合。用于领域内的自然语言任务处理,如:分词、实体识别、关系抽取、意图理解等。一般通过领域语料库训练或人工录入而成。
领域规则库 领域规则是指领域内的业务规则,是对业务定义和约束的描述,这里特指计算机能够读取和进行逻辑判断的业务规则。领域规则库是某一领域业务规则的集合,同样计算机能够处理和进行逻辑运算。
领域预训练语言模型

语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系。它的任务是预测一个句子在语言中出现的概率。语言模型是机器理解人类语言的途径。预训练语言模型是指利用大规模语料预先训练好的语言模型,这些模型可以用于:分词、关键词提取、知识识别、文本分类等任务。

市面上绝大多数的语言模型都是基于互联网通用语料进行训练的,确实特定领域内专属的语言特征。

领域预训练语言模型是利用领域内的语料库进行预训练的语言模型,可以用于领域内自然语言处理任务。

领域实体识别 实体识别为用户输入的查询实体推荐一组最相关的实体集合。领域识别识别可以识别领域内的专属实体。
领域关键词提取 关键词抽取是通过一定的方法抽取出能表达文本的中心主题词的过程,也成文本标签抽取。领域关键词抽取可以从文本中抽取出符合该领域特征的关键词。(例如:化工领域的 三甲基甲苯,N-甲基苯胺等)。
领域认知智能应用 领域认知智能应用是指基于AnyDATA认知智能框架开发的领域的应用程序。
领域知识服务平台 领域知识服务平台是一个以领域知识网络作为交易标的,为供需双方提供领域知识产品的发布、订阅与运营服务的平台。
领域知识网络即服务 知识服务是指从各种显性和隐性知识资源中按照人们的需要有针对性地提炼知识和信息内容,搭建知识网络,为用户提出的问题提供知识内容或解决方案的信息服务过程。

 

P-T

术语

含义

企业知识中台 企业知识中台是一个企业级工业知识中心,构建企业价值链认知框架,建设产业和专业的知识网络,以沉淀鲜活、准确、融合的数据知识资产,让企业大脑“有知识”。
认知智能框架

认知智能框架由工作台、运行时和SDK组成。其中:

SDK 分为:数据加工 SDK 和认知引擎 SDK

运行时分为:知识网络生成和认知引擎

工作台分为:知识网络工作台和认知引擎工作台

认知引擎工作台 认知引擎工作台的目的是为应用开发者提供可视化的知识图谱探索式分析能力和认知搜索、智能问答的开发能力,降低认知智能应用的开发成本。
认知智能 认知智能是让机器具备以知识为基础的理解和推理能力,最终辅助用户决策。认知智能的核心能力是“理解”和“解释”,体现在机器能够解释数据、解释过程进而解释现象的能力,体现在推理、规划等等一系列人类所独有的认知能力上。
认知能力 认知能力是指人脑加工、储存和提取信息的能力,即我们一般所讲的智力,如观察力、记忆力、想象力等。
认知引擎 认知引擎是指在知识网络的基础上进行相关的分析和计算,并实现理解、推理和决策的能力,包括图计算引擎、语义理解引擎、规则引擎、推理引擎,以及为上层认知智能应用提供开发能力的SDK。
认知搜索 ADF2 利用 NLU 技术理解用户输入的搜索或者问答的意图,并在知识网络中进行知识匹配,精确地找到用户想要的答案,并能给出相应的解释。
SDK SDK是指软件开发工具包,辅助开发的相关文档、范例和工具的集合。
数据加工 SDK ADF 提供的数据加工 SDK,及基于 Hugging Face Dataset 开发的 Python SDK,数据科学家在生成知识网络之前,可以对数据进行任意的加工,包含模型训练之前的数据增强或直接将数据加工成认知网络生成所需要的数据格式(三元组、词库文件、结构化数据等)。
数据科学家 数据科学家是指运用AnyDATA认知智能框架对全域数据进行整合、治理、洞察,实现数据知识化的工程师或专家。
实体 实体是指客观存在并可相互区别的事物,如具体的人、事、物。
实体类 实体类是实体在概念层面的抽象,用于描述实体的类型。例如:【爱数】是【公司】,【公司】是【爱数】的实体类。
属性 属性是描述实体或关系某方面的特征,如人的身高、体重。
属性索引 属性索引是指针对实体或关系的某个或某些属性建立索引,以便检索实体或关系。
数据源 数据源是指构建知识网络的数据来源。
数据知识化 数据知识化是指从全域数据中抽取知识形成知识网络的过程。
图可视化分析 这里主要指基于知识图谱的可视化分析。利用数学中的“图论”进行的各类分析,包含:图数据查询、基本信息统计、图探索、凝聚点分析、最短路径分析、社区分析、连通性分析等,并利用可视化的技术展示分析结果。

 

U-Z

术语

定义

文本摘要提取 从文章中抽取出若干可代表文章中心思想的句子。
文档知识抽取模型 文档知识抽取模型是一种通用的文档知识抽取模型,利用规则抽取和深度学习模型抽取出文档结构及文档内部知识,并建立文档之间的关联。
先进分析解决方案 先进分析解决方案是指通过将结构化、非结构化和半结构数据知识化构建全域数据知识中台,打造组织全局的数据洞察能力,从而实现业务的智能搜索、个性化推荐、知识问答、推理与根因分析,打造认知智能+大数据的解决方案。
先进分析 先进分析是在传统的数据分析的基础上加入了领域认知智能,实现从统计分析、全文检索到推理分析、预测分析的升级。
运行时 AnyDATA Framework 2 的运行时为用户提供一套运行环境,用户可以将基于 SDK 或在工作台上开发的知识抽取模型、知识网络生成任务、具有认知能力的应用程序运行起来。从而降低知识网络和认知智能应用的开发成本。
应用开发者 应用开发者是指运用AnyDATA认知智能框架进行认知智能应用开发的工程师。
业务模型 业务模型是以软件模型方式描述企业管理和业务所涉及的对象和要素、以及它们的属性、行为和彼此关系。
业务对象 业务对象是简单的真实世界的抽象,可能是某个人、事、物。
意图理解 用于认知搜索和智能问答:利用NLU(自然语言理解)技术来对用于输入的搜索语句或者问句的意图进行精确的识别,用于在后续的搜索和问答任务中给用户更加精确的答案。
业务智能化 业务人员由决策者变为决策的辅助者或监督者,实际业务决策过程由技术平台自动化进行,从而有效提高决策准确性和效率,形成了数据驱动的新业务模式。
知识网络工作台 知识网络工作台的目的是为数据科学家和领域专家进行知识网络生成过程提供可视化的知识建模、数据标注、知识网络生成、知识网络管理和领域智商评估能力。
知识质量 知识质量,指的的知识网络的数据质量,ADF2 的知识质量目前有两个维度组成,分别是数据重复率以及数据缺失率。
知识量

知识量是知识网络中知识的总量,为所有知识表现形式的知识量的总和,下面是不同知识表示方式的知识量计算:

对于领域知识图谱:指实体、关系、属性的数量。

知识图谱知识量 =∑(实体个数* 实体属性个数)+∑(关系个数* 关系属性个数)

对于领域词库:指领域词库中词的个数

对于领域预训练语言模型:指语言模型中的参数量

对于领域规则库:代表规则数量

知识表示 知识表示是对知识的一种描述,或者说是对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构。常见的知识表示方式有知识图谱、决策树、规则库。
知识网络 知识网络是多元、异构、混合的知识表示方式的集合,让认知引擎能够理解、推理和决策。
知识图谱 作为一种“知识表示形式”,知识图谱是一种大规模语义网络,包含实体、概念及其之间的各种关系。
知识抽取模型 知识抽取模型是指利用机器学习算法训练的,用于从非结构化数据中抽取实体、关系的模型。
知识抽取 知识抽取是指从不同来源、不同结构的数据中进行知识提取,将数据结构化知识后存入到知识网络。
知识映射 知识图谱的专属过程:知识映射建立从基础数据中抽取的结构化信息与所创建的知识图谱中的实体、属性、实体间相互关系的映射关系。
知识融合 知识图谱的融合:将来源于不同数据源的对于统一实体或概念的信息融合起来。需要考虑实体属性的融合,实体概念的融合(例如:【上海爱数】与【上海爱数信息技术股份有限公司】是同一个实体,【成立时间】属性分别为:2006.9 和 2006,需要考虑数据真实性、完整性、时效性或自定义规则进行融合处理)。
知识匹配 根据用户的输入在知识网络中利用精确匹配、模糊匹配或算法匹配的方式找到相应的知识。(例如:陈骁于2003年加入爱数,匹配到的知识是:【陈骁[人]】-[供职于]->【上海爱数信息技术股份有限公司[公司]】)不叫做“知识搜索”的原因是可能会与“认知搜索”、“智能搜索”等名词相冲突。
智能推荐 利用 ADF2 生成的知识图谱中的实体以及他们之间的关系进行推荐。(例如:知识图谱中包含用户对于物品的喜好和物品间的相似度关系,那么可以通过物品的相似度将物品推荐给浏览过类似物品的用户)。
智能问答

智能问答有多轮问答和单轮问答的形式,用户可以输入自己问题,智能问答系统(或智能问答机器人)能够精确的定位用户所需要的提问知识,并给出答案。单轮问答与搜索类似,通过一个问句直接给出最佳答案;多轮问答需要记录用户输入问题的上下文,并适时进行追问,获取更多的信息。

智能问答一般会融合 NLU、搜索引擎、知识图谱、NLG 的技术。

ADF2 能够辅助上层应用实现智能问答,通过知识网络中的知识图谱、规则库等知识表示方式进行意图理解、认知搜索并最终给出答案

知识推理 知识推理是指在计算机或智能系统中,模拟人类的智能推理方式,依据推理控制策略,利用形式化的知识进行机器思维和求解问题的过程。
制造业工业大脑 制造业工业大脑可对跨领域业务和数据关联,增强企业大脑的根因定位、关联分析、认知搜索与智能问答,让企业大脑“会思考”,辅助决策,进而推动企业管理和分析的智能化。