专利名称:基于质量文本相似性的数据查询方法专利类型:发明专利
发明人:刘林,杜贝娜,王俊,张谦,牛志超,马语菡,沈巍,高晓琼,
董丽娜
申请号:CN201811294052.9申请日:20181101公开号:CN109255021A公开日:20190122
摘要:本发明属于数据处理技术领域,具体涉及一种基于质量文本相似性的数据查询方法。本发明利用TF公式做词频权重统计;同时在相似度匹配算法中采用基于余弦相似度的方法,通过学习样本空间,得到空间转移矩阵,使得相同的样本空间更加紧密,不同的样本空间更加分散,从而快速、准确的匹配数据库的数据。与现有技术相比,本发明提出的技术方案中解决了数据库模糊查询需要依靠苛刻的查询条件(逐字匹配、无语义性)从而造成数据匹配准确度低的问题,克服了传统sql语句无法解决复杂数据匹配的问题。同时,基于余弦相似度算法特性,也保证了其计算速度快、运转效率高的特点。
申请人:北京京航计算通讯研究所
地址:100074 北京市丰台区云岗北区西里一号院
国籍:CN
代理机构:中国兵器工业集团公司专利中心
代理人:周恒
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容