专利 基于情绪识别的文字标点自动添加方法、装置及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210380330.2 (22)申请日 2022.04.12 (71)申请人平安国际智慧城市科技股份有限公司地址 518000 广东省深圳市前海深港合作区妈湾兴海大道3048号前海自贸大厦 1-34层 (72)发明人李蓉　 (74)专利代理机构北京鸿元知识产权代理有限公司 11327 专利代理师袁文婷　张娓娓 (51)Int.Cl. G10L 15/183(2013.01) G10L 25/90(2013.01) G10L 25/63(2013.01)G10L 25/18(2013.01) G10L 15/26(2006.01) G10L 15/04(2013.01) G06F 40/30(2020.01) (54)发明名称基于情绪识别的文字标点自动添加方法、装置及存储介质 (57)摘要本发明涉及人工智能领域，提出一种基于情绪识别的文字标点自动添加方法，首先实时获取用户的语音，将用户的语音输入预训练的语言分析模型以确定语音的语速、语调和语义，再根据预设的对比规则将语音的语速、语调和语义与预设的基础模型中的样本相类比获取类比结果；若类比结果表示基础模型中存在与所述语音的语速、语调和语义相匹配的样本，则提取与语音的语速、语调和语义相匹配的样本的标点添加准则，而后按照标点添加准则为所述语音添加文字标点，如此，根据音频中不同的情绪准确分析添加何种标点，与传统的语音文字的转换相比，能够提升用户使用体验，更准确的表达音频中的想要表达的意思，提高语音翻译文字的整体精准度。权利要求书2页说明书12页附图2页 CN 114724554 A 2022.07.08 CN 114724554 A 1.一种基于情绪识别的文字标点自动添加方法，其特征在于，包括：将实时获取的用户的语音输入预训练的语言分析模型以确定所述语音的语速、语调和语义；根据预设的对比规则将所述语音的语速、语调和语义与预设的基础模型中的样本相类比获取类比结果；若所述类比结果表示所述基础模型中存在与所述语音的语速、语调和语义相匹配的样本，则提取与所述语音的语速、语调和语义相匹配的样本的标点添加准则；按照所述标点添加准则为所述语音添加文字标点。 2.如权利要求1所述的基于情绪识别的文字标点自动添加方法，其特征在于，还包括：若所述类比结果表示所述基础模型中不存在与所述语速、语调和语义相匹配的样本，则在预设的临时数据库中按照所述语速和语义的对应关系对所述语音进行断句处理形成语句段，并按照所述语调在所述语句段的末尾添加文字标点；并且，将所述文字标点、所述语句段、所述语速、所述语义、所述语调之间的映射关系转换为文字形式的标点添加准则，并将所述标点添加准则添加至所述基础数据库中。 3.如权利要求1所述的基于情绪识别的文字标点自动添加方法，其特征在于，预训练所述语音分析模型，包括：预采集情绪样本和与所述情绪样本相对应的样本标签；其中，所述样本标签包括样本语速、样本语调和样本语义；构建第一识别算法模型、第二识别算法模型和第三识别算法模型，并将所述第一识别算法模型、所述第二识别算法模型和所述第三识别算法模型相连接以形成待定语音分析模型；其中，所述第一识别算法模型用于对所输入的语音进行预处理以形成标准语音；所述第二识别算法模型用于对所述标准语音进行频谱转换以形成频谱；所述第三识别算法模型用于对所述频谱进行数据分析以获取所输入的语音的语速、语调和语义；将所输入的语音的语速、语调、语义与所述样本语速、样本语调、样本语义进行比对计算以获取损失函数，并根据所述损失函数的数值对所述待定语音分析模型进行持续反复训练，直至所述待定语音分析模型的损失函数低于预设的损失阈值，将最后一次训练的待定语音分析模型作为语音分析模型。 4.如权利要求3所述的基于情绪识别的文字标点自动添加方法，其特征在于，所述将实时获取的用户的语音输入预训练的语言分析模型以确定所述语音的语速、语调和语义，包括：通过被用户授权的麦克风录入用户的音频作为语音；将所述语音作为目标语音输入所述语言分析模型中，以使所述语言分析模型中的第一识别算法模型对所述目标语音进行预处理以形成目标标准语音，使所述语言分析模型中的第二识别算法模型对所述目标标准语音进行频谱转换以形成目标频谱，使所述语言分析模型中的第三识别算法根据预设的分析规则对所述目标频谱进行数据分析以形成关于所述目标语音的语速、语调和语义。 5.如权利要求 4所述的基于情绪识别的文字标点自动添加方法，其特征在于，所述预处理包括音频合规检测处理和音频切割处理；所述频谱转换包括音频降噪处理、特征提取处理和频谱生成处理。权　利　要　求　书 1/2 页 2 CN 114724554 A 26.如权利要求5所述的基于情绪识别的文字标点自动添加方法，其特征在于，在所述根据预设的对比规则将所述语音的语速、语调和语义与预设的基础模型中的样本相类比获取类比结果之前，还包括预创建基础模型；其中，所述预创建基础模型，包括：根据情绪样本的语速和语调对所述情绪样本的进行情绪判断，根据所判断的情绪为语句添加标点；建立所添加的标点 ‑情绪‑语速‑语调的映射关系，根据所述映射关系创建基于语速、语调、语义的标点添加准则以形成执行所述标点添加准则的标点添加插件；将所述情绪样本、所述标点 ‑情绪‑语速‑语调的映射关系存储在数据库中，并建立所述数据库与所述所述标点添加插件的连接关系以形成基础模型。 7.如权利要求6所述的基于情绪识别的文字标点自动添加方法，其特征在于，所述标点添加准则为：根据语速和语调判断情绪；根据情绪和语义对所述语句进行短句处理，并对情绪平缓的短句添加逗号，对情绪激动的断句末尾添加感叹号或问好，并根据语义和情绪在句末添加句号、感叹号或问号。 8.一种基于情绪识别的文字标点自动添加装置，其特征在于，所述装置包括：语言分析单元，用于将实时获取的用户的语音输入预训练的语言分析模型以确定所述语音的语速、语调和语义；样本类比单元，用于根据预设的对比规则将所述语音的语速、语调和语义与预设的基础模型中的样本相类比获取类比结果；匹配判断单元，用于若所述类比结果表示所述基础模型中存在与所述语音的语速、语调和语义相匹配的样本，则提取与所述语音的语速、语调和语义相匹配的样本的标点添加准则；标点添加单元，用于按照所述标点添加准则为所述语音添加文字标点。 9.一种电子设备，其特征在于，所述电子设备包括：至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行如权利要求 1至7中任一所述的基于情绪识别的文字标点自动添加方法中的步骤。 10.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的基于情绪识别的文字标点自动添加方法。权　利　要　求　书 2/2 页 3 CN 114724554 A 3

专利 基于情绪识别的文字标点自动添加方法、装置及存储介质

专利基于情绪识别的文字标点自动添加方法、装置及存储介质