(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210380330.2
(22)申请日 2022.04.12
(71)申请人 平安国际智慧城市科技股份有限公
司
地址 518000 广东省深圳市前海深港合作
区妈湾兴海 大道3048号前海自贸大厦
1-34层
(72)发明人 李蓉
(74)专利代理 机构 北京鸿元知识产权代理有限
公司 11327
专利代理师 袁文婷 张娓娓
(51)Int.Cl.
G10L 15/183(2013.01)
G10L 25/90(2013.01)
G10L 25/63(2013.01)G10L 25/18(2013.01)
G10L 15/26(2006.01)
G10L 15/04(2013.01)
G06F 40/30(2020.01)
(54)发明名称
基于情绪识别的文字标点自动添加方法、 装
置及存储介质
(57)摘要
本发明涉及人工智能领域, 提出一种基于情
绪识别的文字标点自动添加方法, 首先实时获取
用户的语音, 将用户的语音输入 预训练的语言分
析模型以确定语音的语速、 语调和语义, 再根据
预设的对比规则将语音的语速、 语调和语义与预
设的基础模 型中的样本相类比获取类比结果; 若
类比结果表示基础模型中存在与所述语音的语
速、 语调和语义相匹配的样本, 则提取与语音的
语速、 语调和语义相匹配的样本的标点添加准
则, 而后按照标点添加准则为所述语音添加文字
标点, 如此, 根据音频中不同的情绪准确分析添
加何种标点, 与传统的语音文字的转换相比, 能
够提升用户使用体验, 更准确的表达音频中的想
要表达的意思, 提高语音翻译文字的整体精准
度。
权利要求书2页 说明书12页 附图2页
CN 114724554 A
2022.07.08
CN 114724554 A
1.一种基于情绪识别的文字标点自动添加方法, 其特 征在于, 包括:
将实时获取的用户的语音输入预训练 的语言分析模型以确定所述语音的语速、 语调和
语义;
根据预设的对比规则将所述语音的语速、 语调和语义与 预设的基础模型中的样本相类
比获取类比结果;
若所述类比结果表示所述基础模型中存在与所述语音的语速、 语调和语义相匹配的样
本, 则提取与所述语音的语速、 语调和语义相匹配的样本的标点添加准则;
按照所述标点添加准则为所述语音添加文字标点。
2.如权利要求1所述的基于情绪识别的文字标点自动添加方法, 其特 征在于, 还 包括:
若所述类比结果表示所述基础模型中不存在与所述语速、 语调和语义相匹配的样本,
则在预设的临时数据库中按照所述语速和语义的对应关系对所述语音进行断句处理形成
语句段, 并按照所述语调在所述语句段的末尾添加文字标点; 并且,
将所述文字标点、 所述语句段、 所述语速、 所述语义、 所述语调之间的映射关系转换为
文字形式的标点添加准则, 并将所述标点添加准则添加至所述基础数据库中。
3.如权利要求1所述的基于情绪识别的文字标点自动添加方法, 其特征在于, 预训练所
述语音分析模型, 包括:
预采集情绪样本和与所述情绪样本相对应的样本标签; 其中, 所述样本标签包括样本
语速、 样本语调和样本语义;
构建第一识别算法模型、 第二识别算法模型和第三识别算法模型, 并将所述第一识别
算法模型、 所述第二识别算法模型和所述第三识别算法模型相连接以形成待定语音分析模
型; 其中, 所述第一识别算法模 型用于对所输入的语音进行预 处理以形成标准语音; 所述第
二识别算法模型用于对所述标准语音进行频谱转换以形成频谱; 所述第三识别算法模型用
于对所述频谱进行 数据分析以获取 所输入的语音的语速、 语调和语义;
将所输入的语音的语速、 语调、 语义与所述样本语速、 样本语调、 样本语义进行比对计
算以获取损失函数, 并根据所述损失函数的数值对所述待定语音分析模型进 行持续反 复训
练, 直至所述待定语音分析模型 的损失函数低于预设的损失阈值, 将最后一次训练的待定
语音分析模型作为语音分析模型。
4.如权利要求3所述的基于情绪识别的文字标点自动添加方法, 其特征在于, 所述将 实
时获取的用户的语音输入预训练的语言分析模型以确定所述语音的语速、 语调和语义, 包
括:
通过被用户授权的麦克风录入用户的音频作为语音;
将所述语音作为目标语音输入所述语言分析模型中, 以使所述语言分析模型中的第 一
识别算法模型对所述目标语音进 行预处理以形成目标标准语音, 使所述语言分析模型中的
第二识别算法模型对所述目标标准语音进 行频谱转换以形成目标频谱, 使 所述语言分析模
型中的第三识别算法根据预设的分析规则对所述目标频谱进行数据分析以形成关于所述
目标语音的语速、 语调和语义。
5.如权利要求 4所述的基于情绪识别的文字标点自动添加方法, 其特 征在于,
所述预处 理包括音频合 规检测处 理和音频切割处 理;
所述频谱转换包括音频降噪处 理、 特征提取处 理和频谱生成处 理。权 利 要 求 书 1/2 页
2
CN 114724554 A
26.如权利要求5所述的基于情绪识别的文字标点自动添加方法, 其特征在于, 在所述根
据预设的对比规则将所述语音的语速、 语调和语义与预设的基础模型中的样本相类比获取
类比结果之前, 还 包括预创建基础模型; 其中, 所述预创建基础模型, 包括:
根据情绪样本的语速和语调对所述情绪样本的进行情绪判断, 根据所判断的情绪为语
句添加标点;
建立所添加的标点 ‑情绪‑语速‑语调的映射关系, 根据所述映射关系创建基于语速、 语
调、 语义的标点添加准则以形成执 行所述标点添加准则的标点添加插 件;
将所述情绪样本、 所述标点 ‑情绪‑语速‑语调的映射关系存储在数据库中, 并建立所述
数据库与所述所述标点添加插 件的连接关系以形成基础模型。
7.如权利要求6所述的基于情绪识别的文字标点自动添加方法, 其特征在于, 所述标点
添加准则为:
根据语速和语调判断情绪;
根据情绪和语义对所述语句进行短句处理, 并对情绪平缓的短句添加逗号, 对情绪激
动的断句末尾添加感叹号或问好, 并根据语义和情绪在句末添加句号、 感叹号或问号。
8.一种基于情绪识别的文字标点自动添加装置, 其特 征在于, 所述装置包括:
语言分析单元, 用于将 实时获取的用户的语音输入预训练 的语言分析模型以确定所述
语音的语速、 语调和语义;
样本类比单元, 用于根据预设的对比规则将所述语音的语速、 语调和语义与预设的基
础模型中的样本相类比获取类比结果;
匹配判断单元, 用于若所述类比结果表示所述基础模型中存在与所述语音的语速、 语
调和语义相匹配的样本, 则提取与所述语音的语速、 语调和语义相匹配的样本的标点添加
准则;
标点添加单 元, 用于按照所述标点添加准则为所述语音添加文字标点。
9.一种电子设备, 其特 征在于, 所述电子设备包括:
至少一个处 理器; 以及,
与所述至少一个处 理器通信连接的存 储器; 其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程序被所
述至少一个处理器执行, 以使 所述至少一个处理器能够执行如权利要求 1至7中任一所述的
基于情绪识别的文字标点自动添加方法中的步骤。
10.一种计算机可读存储介质, 存储有计算机程序, 其特征在于, 所述计算机程序被处
理器执行时实现如权利要求1至7中任一所述的基于情绪识别的文字标点自动添加方法。权 利 要 求 书 2/2 页
3
CN 114724554 A
3
专利 基于情绪识别的文字标点自动添加方法、装置及存储介质
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 17:49:23上传分享