原标题:腾讯获“新词发现方法”相关专利授权,可提高新词发现的准确度
据天眼查APP显示,5月25日, 腾讯科技(深圳)有限公司获得“新词发现的方法、装置、计算机存储介质和电子设备”专利授权,公告号CN112559694B,申请日期为2021年2月。
专利摘要显示,该方法包括,获得候选字串后,利用目标字串(指未记录在词库中的候选字串)的前缀和后缀进行信息熵计算等。目标字串和所属语境的关联程度高,则目标字串不具备独立语义,不构成词汇,关联程度低说明目标字串具备独立语义,可以构成词汇,本方案利用信息熵分值筛选掉不具备独立的语义的目标字串,提高新词发现的准确度。