compute similar scores of two text
Project description
[![Version][version-badge]][version-link] ![MIT License][license-badge]
compute similar scores of two strings
TextSimilarScore
这是个计算两个短文本相似度的算法
安装方法
安装以来
pip install TextSimilarScore
pip install -r resuirements.txt
使用方法
import TextSimilarScore.tools.TextSim as ts
test = ts.TextSimilarity()
# 计算连续最长公共子串的距离
print(test.lcs('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算连续最长公共子序列的距离
print(test.lcs_sequence('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算编辑距离
print(test.minimumEditDistance('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 基于tf-idf计算距离
print(test.splitWordSimlaryty('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
# 计算JaccardSim系数
print(test.JaccardSim('中移在线全链路智能化系统研发项目', '中移在线全国智能路由决策项目'))
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
TextSimilarScore-0.0.6.tar.gz
(4.6 kB
view hashes)
Built Distribution
Close
Hashes for TextSimilarScore-0.0.6-py3-none-any.whl
Algorithm | Hash digest | |
---|---|---|
SHA256 | 89987a7d7d5f250cf52e83f5f51fc88b03df623d1343c21cc2f8bbb81181bcbc |
|
MD5 | 163e5a91e868c5706a74359ab4571c11 |
|
BLAKE2b-256 | 47e6d5e7d4217847b681c06a492db57e0bd215f1fc3fd7f48eeeec804c1da3ea |