我的工程实践题目是面向银行领域的自然语言理解系统设计,下面通过类图描述该项目的业务领域。
Collect application domain information
(1) 系统提供的服务有四大类包括:贷款、信用卡、理财和金融。
(2) 每个业务有不同的语料库,每个语料库中有不同类型的问题的多种问询语句以及它们的解答语句。
(3) 根据不同的语料库训练不同的模型。
(4) 用户在使用时,系统首先语音询问用户要选择哪类服务,得到用户答复后调用对应的模型,准备工作。
(5) 用户语音输入后,系统调用语音识别API,生成文本数据喂给模型进行分类以找到对应的问题。
(6) 从数据库中匹配对应问题的答复语句,最后通过语音回复用户。
Brainstorming
名词:用户、贷款、信用卡、理财、金融、业务、语料库、问询语句、解答语句、模型、语音识别API、文本数据。
动词:语音输入、语音输出、语音识别、选择模型、生成文本数据、分类、寻找、匹配。
“...是...”表达式:贷款、信用卡、理财、金融是业务。
“...分成...”、“...组成...”表达式:语料库由问询语句和解答语句组成。
Classifying the domain concepts into
类 | 属性 |
用户 | 业务、模型、问询语句 |
语音 | 语音识别API、文本数据 |
处理 | 文本数据、模型 |
语料 | 语料库 |
交互 | 询问语句、解答语句 |
关联关系:语音输入、语音输出、语音识别、选择模型、生成文本数据、分类、寻找、匹配。
继承关系:贷款、信用卡、理财、金融是业务。
聚合:语料库由问询语句和解答语句组成。
Document result using UML class diagram