Skip to main content

中文复合事件抽取,可以用来识别文本的模式,包括条件事件、因果事件、顺承事件、反转事件。代码为刘焕勇原创设计,项目地址https://github.com/liuhuanyong/ComplexEventExtraction 项目介绍很详细,感兴趣的一定要去原项目看一下。我仅仅是对代码做了简单的修改,增加了函数说明注释和stats函数,可以用于统计文本中各种模式的分布(数量)情况。

Project description

一、文本事理类型分析

中文复合事件抽取,可以用来识别文本的模式,包括条件事件、顺承事件、反转事件。

我仅仅是对代码做了简单的修改,增加了函数说明注释和stats函数,可以用于统计文本中各种模式的分布(数量)情况。代码原作者为刘焕勇 https://github.com/liuhuanyong


事件图谱(事理图谱)的类型

项目地址https://github.com/liuhuanyong/ComplexEventExtraction 项目介绍很详细,感兴趣的一定要去原项目看一下。

事件 含义 形式化 事件应用 图谱场景 举例
条件事件 某事件条件下另一事件发生 如果A那么B 事件预警 时机判定 <限制放宽,立即增产>
反转事件 某事件与另一事件形成对立 虽然A但是B 预防不测 反面教材 <起步晚,发展快>
顺承事件 某事件紧接着另一事件发生 A接着B 事件演化 未来意图识别 <去旅游,买火车票>

分析出文本中的条件、顺承、反转,理论上就可以构建知识网络(本库做不到这可视化)。 1、反转事件图谱 2、条件事件图谱



二、安装方法

2.1 方法一

最简单的安装,现在由于国内外网络不稳定,可能需要尝试几次

pip3 install eventextraction

2.2 加镜像站点

有的童鞋已经把pip默认安装镜像站点改为国内,如果国内镜像还未收录我的这个包,那么可能会安装失败。只能从国外

https://pypi.org/simple

站点搜索eventextraction资源并安装

pip3 install eventextraction -i https://pypi.org/simple

2.3 国内镜像安装

如果国内镜像站点已经收录,那么使用这个会更快

pip3 install eventextraction -i https://pypi.tuna.tsinghua.edu.cn/simple/



三、使用

3.1 主函数

from eventextraction import EventsExtraction

extractor = EventsExtraction()
content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'
datas = extractor.extract_main(content)
print(datas)

运行结果

[{'sent': '虽然你做了坏事,但我觉得你是好人', 'type': 'but', 'tuples': {'pre_wd': '虽然', 'pre_part': '你做了坏事,', 'post_wd': '但', 'post_part ': '我觉得你是好人'}},
{'sent': '一旦时机成熟,就坚决推行', 'type': 'condition', 'tuples': {'pre_wd': '一旦', 'pre_part': '时机成熟,', 'post_wd': '就', 'post_part ': '坚决推行'}}]


3.2 统计

from eventextraction import EventsExtraction

extractor = EventsExtraction()
content = '虽然你做了坏事,但我觉得你是好人。一旦时机成熟,就坚决推行'
datas = extractor.extract_main(content)
print(extractor.stats(datas))

运行结果

{'but': 1, 'condition': 1, 'seq': 0, 'more': 0, 'other': 0}



如果

如果您是经管人文社科专业背景,编程小白,面临海量文本数据采集和处理分析艰巨任务,可以参看《python网络爬虫与文本数据分析》视频课。作为文科生,一样也是从两眼一抹黑开始,这门课程是用五年时间凝缩出来的。自认为讲的很通俗易懂o( ̄︶ ̄)o,

  • python入门
  • 网络爬虫
  • 数据读取
  • 文本分析入门
  • 机器学习与文本分析
  • 文本分析在经管研究中的应用

感兴趣的童鞋不妨 戳一下《python网络爬虫与文本数据分析》进来看看~

更多


Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

Built Distribution

eventextraction-1.1-py3-none-any.whl (7.4 kB view details)

Uploaded Python 3

File details

Details for the file eventextraction-1.1.macosx-10.9-x86_64.tar.gz.

File metadata

  • Download URL: eventextraction-1.1.macosx-10.9-x86_64.tar.gz
  • Upload date:
  • Size: 8.8 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.1 importlib_metadata/4.0.1 pkginfo/1.7.0 requests/2.22.0 requests-toolbelt/0.9.1 tqdm/4.46.1 CPython/3.7.5

File hashes

Hashes for eventextraction-1.1.macosx-10.9-x86_64.tar.gz
Algorithm Hash digest
SHA256 f9f2240355ba6f84fe6f456ceb7b337db22a3fc3e7af902cfebab3cae20ff4c9
MD5 cc6418f90e7deb038e5eb0dfc5d8db18
BLAKE2b-256 22dd01f0d6c78d531d158388194fe04251110f2fb2a6d3b5e2c561e2e79c4b93

See more details on using hashes here.

File details

Details for the file eventextraction-1.1-py3-none-any.whl.

File metadata

  • Download URL: eventextraction-1.1-py3-none-any.whl
  • Upload date:
  • Size: 7.4 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/3.4.1 importlib_metadata/4.0.1 pkginfo/1.7.0 requests/2.22.0 requests-toolbelt/0.9.1 tqdm/4.46.1 CPython/3.7.5

File hashes

Hashes for eventextraction-1.1-py3-none-any.whl
Algorithm Hash digest
SHA256 c3436d9ace465bcc65c85abed89bc5dc23e376f7379e736a603b10098b1625ce
MD5 cf8a9bc5e7749378fa3a91b2a7e7cce9
BLAKE2b-256 fe67dcc0042ba100bafa1866cec4266623508be31ea30ad207e48c0b48998679

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page