Short Chinses literal YES or NO recognition by logic
Project description
# short_chn_yn
使用逻辑的短文本中文字面肯定否定识别。
### 1.目的
1. 中文是由字组成的,一般人的语速大概为[200字/分钟](https://dwz.cn/V7nIMYzq),如果交流时间很短(1~2s),则输出汉字为3~7字;
2. 日常交流中最常见是字面(不需要太复杂语义)肯定和否定
综上,日常交流中最常见的是3~7字的字面肯否定,例如“嗯,是的”,“不是啊”。我们主要解决这个问题。
### 2.建模
完全通过逻辑运算的方式实现:
`Yes-or-No=Not(Xor(yes,no))`
例如,“不是啊“,“不”表示False,“是”表示True,“啊”是无意义词,忽略,则`Not(Xor(True,False))=False=No`,故表示否定。
对于更复杂的情况,“难道不是吗”,进行递归,`Not(Xor(Not(Xor(False, False)), True))=True=Yes`,表示肯定。
### 3.使用
```python
import short-chn-yn as yn
if __name__=="__main__":
#实例化对象
y1=yn.yn()
s = "嗯是"
#输入
result = y1.y_n(s)
print(result)
```
其中的`simple_dict.txt`含有:`pos, neg, others, filter`四个内容,分别表示:肯定、否定、无意义词和特殊处理词(解决问题2),用户可自行修改。
`yn(dictionary)`,构造函数,可以用符合标准的字典,空缺使用默认字典。
`y_n(s, thre)`,输出判断,其中`s`为输入字符串,`thre`为阈值,因为语速是大部分人都是一定的,所以1~2s 说出的词的个数也是固定的,默认为6。
`y_n()`输出为字符串:
```
Positive: 肯定
Negtive: 否定
Nonsense: 无意义
Incognizance: 不识别
too long: 字符串长度超过thre
```
### 4.问题
1. 有的词有语义性,例如“嗯”,很难说清楚它表示肯定还是语气词。
### 5.协议
MIT
使用逻辑的短文本中文字面肯定否定识别。
### 1.目的
1. 中文是由字组成的,一般人的语速大概为[200字/分钟](https://dwz.cn/V7nIMYzq),如果交流时间很短(1~2s),则输出汉字为3~7字;
2. 日常交流中最常见是字面(不需要太复杂语义)肯定和否定
综上,日常交流中最常见的是3~7字的字面肯否定,例如“嗯,是的”,“不是啊”。我们主要解决这个问题。
### 2.建模
完全通过逻辑运算的方式实现:
`Yes-or-No=Not(Xor(yes,no))`
例如,“不是啊“,“不”表示False,“是”表示True,“啊”是无意义词,忽略,则`Not(Xor(True,False))=False=No`,故表示否定。
对于更复杂的情况,“难道不是吗”,进行递归,`Not(Xor(Not(Xor(False, False)), True))=True=Yes`,表示肯定。
### 3.使用
```python
import short-chn-yn as yn
if __name__=="__main__":
#实例化对象
y1=yn.yn()
s = "嗯是"
#输入
result = y1.y_n(s)
print(result)
```
其中的`simple_dict.txt`含有:`pos, neg, others, filter`四个内容,分别表示:肯定、否定、无意义词和特殊处理词(解决问题2),用户可自行修改。
`yn(dictionary)`,构造函数,可以用符合标准的字典,空缺使用默认字典。
`y_n(s, thre)`,输出判断,其中`s`为输入字符串,`thre`为阈值,因为语速是大部分人都是一定的,所以1~2s 说出的词的个数也是固定的,默认为6。
`y_n()`输出为字符串:
```
Positive: 肯定
Negtive: 否定
Nonsense: 无意义
Incognizance: 不识别
too long: 字符串长度超过thre
```
### 4.问题
1. 有的词有语义性,例如“嗯”,很难说清楚它表示肯定还是语气词。
### 5.协议
MIT
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
short-chn-yn-0.0.2.tar.gz
(4.8 kB
view hashes)