compute similar scores of two text
Project description
[![Version][version-badge]][version-link] ![MIT License][license-badge]
compute similar scores of two strings
TextSimilarScore
这是个计算两个短文本相似度的算法
安装方法
安装以来
pip install TextSimilarScore
pip install -r resuirements.txt
使用方法
import TextSimilarScore.tools.TextSim as ts
test = ts.TextSimilarity()
# 计算连续最长公共子串的距离
print(test.lcs('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算连续最长公共子序列的距离
print(test.lcs_sequence('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算编辑距离
print(test.minimumEditDistance('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 基于tf-idf计算距离
print(test.splitWordSimlaryty('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算JaccardSim系数
print(test.JaccardSim('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
TextSimilarScore-0.0.5.tar.gz
(4.5 kB
view hashes)
Built Distribution
Close
Hashes for TextSimilarScore-0.0.5-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 8a4ec3cd3e0bb5037c0f5e7930b35bbb8248853cc3ad26c677f8a1916c1d63d1 |
|
MD5 | c2ccda8704439564c651cefaa06e28af |
|
BLAKE2b-256 | 245b89927ba1630b63a57bee8b111f193a9a8777ac24e681a04f7064d205e425 |