本发明提供一种短文本分类的方法及系统,该方法为:对待分类短文本进行文本处理得到文本向量矩阵。基于卷积神经网络对文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一多维卷积特征进行压缩处理得到每一多维卷积特征对应的一维精要特征。针对每一一维精要特征,计算每一一维精要特征的权重值。针对每一多维卷积特征,基于一维精要特征对应的权重值,对多维卷积特征进行加权,利用得到的自适应的卷积特征确定待分类短文本的类别。在本方案中,通过从不同角度提取短文本的多维卷积特征,并计算不同角度的多维卷积特征在短文本中的权重。基于该权重计算得到用于确定短文本类别的自适应的卷积特征,提高短文本分类的准确度。
本发明提供一种短文本分类的方法及系统,该方法为:对待分类短文本进行文本处理得到文本向量矩阵。基于卷积神经网络对文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一多维卷积特征进行压缩处理得到每一多维卷积特征对应的一维精要特征。针对每一一维精要特征,计算每一一维精要特征的权重值。针对每一多维卷积特征,基于一维精要特征对应的权重值,对多维卷积特征进行加权,利用得到的自适应的卷积特征确定待分类短文本的类别。在本方案中,通过从不同角度提取短文本的多维卷积特征,并计算不同角度的多维卷积特征在短文本中的权重。基于该权重计算得到用于确定短文本类别的自适应的卷积特征,提高短文本分类的准确度。
商品类型 | 专利 | 申请号 | 201910191018.7 | IPC分类号 | |
专利类型 | 发明 | 法律状态 | 有权 | 技术领域 | |
交易方式 | 技术转让 | 专利状态 | 已授权 | 专利权人 | |