众所周知,随着人工智能时代的到来,人与计算机之间的交流越发成为可能。

人与计算机之间的交互是离不开一个完备的会话理解系统也称为CU系统。

而典型会话理解(CU)系统包括自动语音识别(ASR)系统、自然语言理解(NLU)系统、会话管理(DM)系统和自然语言生成(NLG)系统。如果要构建这样的系统需要大量的专业知识,时间和其他资源的。

今天我们要介绍的一项微软专利(专利公开号:CN106383866A)就是告诉我们构建会话理解系统的系统和方法。

微软这项专利涉及的经典会话理解系统如图1所示,总共由5个子系统组成,共同来完成与用户的交互信息理解。

微软专利告诉我们如何构建一个会话理解系统-小强科技

自动语音识别(ASR)系统,主要是是一种将人的语音转换为文本的技术,该部分主要是作为整个系统的输入接口转换部分。

自然语言理解(NLU)系统,作为整个CU系统的核心部分,此部分主要是通过使用一些自然语言处理技术将文本转换为语义表示,其中语义表示是计算机能理解的一种表示形式。

会话管理(DM)系统,作为CU中的大脑,主要是更新对话状态并根据对话状态选择一个或多个选定的系统动作。

NLG系统主要是根据上一层的动作,去实现动作,主要表示为将一些语义表示的动作转换为人能理解的语言,最后借助系统的输出接口展示给用户看。

本专利提供的用于构建会话理解系统的系统和方法,主要是利用预构建会话项目来进行的,预构建会话项目可以在构建者选择时形成CU系统,而不需要来自构建者的任何进一步输入。

接下来,我们从整体上来看构建者中由客户端利用CU系统构建平台来构建系统的过程。

整体由三大部分组成:构建者,CU系统构建平台,存储库。

微软专利告诉我们如何构建一个会话理解系统-小强科技

构建者,便是使用这个构CU系统构建平台的用户,主要通过终端来与CU系统构建平台进行交互。

CU系统构建平台,一方面为终端提供操作接口;另一方面,通过网络连接储存库,从而获取存储库中的任务特定模板信息,进而可以展示给构建者查看。

储存库,主要存储一些任务特定模板和这些任务特定模板对应的子任务模板,对外存储库提供访问任务模板接口。

在大致了解整体后,我们从具体实现流程来讲解构建会话理解系统。

微软专利告诉我们如何构建一个会话理解系统-小强科技

首先,我们需要创建或者提供一些预构建会话项目的存储库,其中预构建会话项目主要是由一些任务特定模板组成。基于设定好的储存库,我们需要提供对外访问和操作的接口,用来给构建者或者上层结构提供预构建项目的选择。

紧接着,提供构建者选择一个或多个预构建项目形成项目集合。

在选择好预构建项目集合后,接下来构建平台将提供构建项目的一些配置信息,供构建者设置,这样构建者便可以定制出自己的预构建项目。

接下来,根据构建者配置好的预构建项目形成会话系统中的会话组件。

到此,整个会话理解系统基本构成,接下来的操作便是一些模拟测试已经构建好的会话理解系统的操作了。

随着构建会话理解系统的系统和方法的日益成熟,这为快速构建会话理解系统节省了很多时间、资源,最重要的是也不要需要大量的专业知识作为先验来构建系统了,期待更多的构建会话理解系统的系统和方法。