hanlp

HanLP: Han Language Processing

These details have not been verified by PyPI

Project links

Homepage

Project description

HanLP: Han Language Processing

中文 | 日本語 | Docs | Forum

HanLP is the multilingual NLP library designed for researchers and enterprises, built on PyTorch and TensorFlow 2.x to advance state-of-the-art deep learning techniques in academia and industry. HanLP was designed from day one to be efficient, user-friendly and extendable.

Thanks to open-access corpora like Universal Dependencies and OntoNotes, HanLP 2.1 now offers 10 joint tasks on 130 languages: tokenization, lemmatization, part-of-speech tagging, token feature extraction, dependency parsing, constituency parsing, semantic role labeling, semantic dependency parsing, abstract meaning representation (AMR) parsing.

For end users, HanLP offers light-weighted RESTful APIs and native Python APIs.

RESTful APIs

Tiny packages in several KBs for agile development and mobile applications. Although anonymous users are welcomed, an auth key is suggested and a free one can be applied here under the CC BY-NC-SA 4.0 license.

Click to expand tutorials for RESTful APIs

Python

pip install hanlp_restful

Create a client with our API endpoint and your auth.

from hanlp_restful import HanLPClient
HanLP = HanLPClient('https://hanlp.hankcs.com/api', auth=None, language='mul') # Support en, ja, zh, mul

Java

Insert the following dependency into your pom.xml.

<dependency>
  <groupId>com.hankcs.hanlp.restful</groupId>
  <artifactId>hanlp-restful</artifactId>
  <version>0.0.15</version>
</dependency>

Create a client with our API endpoint and your auth.

HanLPClient HanLP = new HanLPClient("https://hanlp.hankcs.com/api", null, "mul"); // Support en, ja, zh, mul

Quick Start

No matter which language you use, the same interface can be used to parse a document.

HanLP.parse(
    "In 2021, HanLPv2.1 delivers state-of-the-art multilingual NLP techniques to production environments. 2021年、HanLPv2.1は次世代の最先端多言語NLP技術を本番環境に導入します。2021年 HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。")

See docs for visualization, annotation guidelines and more details.

Native APIs

pip install hanlp

HanLP requires Python 3.6 or higher. While GPU or TPU acceleration is recommended, it is not mandatory.

Quick Start

import hanlp

HanLP = hanlp.load(hanlp.pretrained.mtl.UD_ONTONOTES_TOK_POS_LEM_FEA_NER_SRL_DEP_SDP_CON_XLMR_BASE)
print(HanLP(['In 2021, HanLPv2.1 delivers state-of-the-art multilingual NLP techniques to production environments.',
             '2021年、HanLPv2.1は次世代の最先端多言語NLP技術を本番環境に導入します。',
             '2021年 HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。']))

In particular, the Python HanLPClient can also be used as a callable function following the same semantics. See docs for visualization, annotation guidelines and more details.
To process English, Chinese or Japanese, HanLP provides mono-lingual models in each language which significantly outperform the multilingual model. See docs for the list of models.

Train Your Own Models

To write DL models is not hard, the real hard thing is to write a model able to reproduce the scores in papers. The snippet below shows how to surpass the state-of-the-art tokenizer in 6 minutes.

tokenizer = TransformerTaggingTokenizer()
save_dir = 'data/model/cws/sighan2005_pku_bert_base_96.7'
tokenizer.fit(
    SIGHAN2005_PKU_TRAIN_ALL,
    SIGHAN2005_PKU_TEST,  # Conventionally, no devset is used. See Tian et al. (2020).
    save_dir,
    'bert-base-chinese',
    max_seq_len=300,
    char_level=True,
    hard_constraint=True,
    sampler_builder=SortingSamplerBuilder(batch_size=32),
    epochs=3,
    adam_epsilon=1e-6,
    warmup_steps=0.1,
    weight_decay=0.01,
    word_dropout=0.1,
    seed=1660853059,
)
tokenizer.evaluate(SIGHAN2005_PKU_TEST, save_dir)

The result is guaranteed to be 96.73 as the random seed is fixed. Different from some overclaiming papers and projects, HanLP promises every single digit in our scores is reproducible. Any issues on reproducibility will be treated and solved as a top-priority fatal bug.

Performance

The performance of multi-task learning models is shown in the following table.

lang	corpora	model	tok	pos	ner	dep	con	srl	sdp	lem	fea	amr
fine	coarse	ctb	pku	863	ud	pku	msra	ontonotes	SemEval16	DM	PAS	PSD
mul	UD2.7 OntoNotes5	small	98.62	-	-	-	-	93.23	-	-	74.42	79.10	76.85	70.63	-	91.19	93.67	85.34	87.71	84.51	-
mul	UD2.7 OntoNotes5	base	98.97	-	-	-	-	90.32	-	-	80.32	78.74	71.23	73.63	-	92.60	96.04	81.19	85.08	82.13	-
zh	open	small	97.25	-	96.66	-	-	-	-	-	95.00	84.57	87.62	73.40	84.57	-	-	-	-	-	-
	open	base	97.50	-	97.07	-	-	-	-	-	96.04	87.11	89.84	77.78	87.11	-	-	-	-	-	-
	close	small	96.70	95.93	96.87	97.56	95.05	-	96.22	95.74	76.79	84.44	88.13	75.81	74.28	-	-	-	-	-	-
		base	97.52	96.44	96.99	97.59	95.29	-	96.48	95.72	77.77	85.29	88.57	76.52	73.76	-	-	-	-	-	-
		ernie	96.95	97.29	96.76	97.64	95.22	-	97.31	96.47	77.95	85.67	89.17	78.51	74.10	-	-	-	-	-	-

Multi-task learning models often under-perform their single-task learning counterparts according to our latest research. Similarly, mono-lingual models often outperform multi-lingual models. Therefore, we strongly recommend the use of a single-task mono-lingual model if you are targeting at high accuracy instead of faster speed.
A state-of-the-art AMR model has been released.

Citing

If you use HanLP in your research, please cite our EMNLP paper:

@inproceedings{he-choi-2021-stem,
    title = "The Stem Cell Hypothesis: Dilemma behind Multi-Task Learning with Transformer Encoders",
    author = "He, Han and Choi, Jinho D.",
    booktitle = "Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing",
    month = nov,
    year = "2021",
    address = "Online and Punta Cana, Dominican Republic",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2021.emnlp-main.451",
    pages = "5555--5577",
    abstract = "Multi-task learning with transformer encoders (MTL) has emerged as a powerful technique to improve performance on closely-related tasks for both accuracy and efficiency while a question still remains whether or not it would perform as well on tasks that are distinct in nature. We first present MTL results on five NLP tasks, POS, NER, DEP, CON, and SRL, and depict its deficiency over single-task learning. We then conduct an extensive pruning analysis to show that a certain set of attention heads get claimed by most tasks during MTL, who interfere with one another to fine-tune those heads for their own objectives. Based on this finding, we propose the Stem Cell Hypothesis to reveal the existence of attention heads naturally talented for many tasks that cannot be jointly trained to create adequate embeddings for all of those tasks. Finally, we design novel parameter-free probes to justify our hypothesis and demonstrate how attention heads are transformed across the five tasks during MTL through label analysis.",
}

License

Codes

HanLP is licensed under Apache License 2.0. You can use HanLP in your commercial products for free. We would appreciate it if you add a link to HanLP on your website.

Models

Unless otherwise specified, all models in HanLP are licensed under CC BY-NC-SA 4.0.

References

https://hanlp.hankcs.com/docs/references.html

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

This version

2.1.3

Oct 19, 2025

2.1.2

Sep 11, 2025

2.1.1

Jan 13, 2025

2.1.0

Dec 29, 2024

2.1.0b64 pre-release

Dec 7, 2024

2.1.0b63 pre-release

Dec 2, 2024

2.1.0b62 pre-release

Oct 8, 2024

2.1.0b61 pre-release

Sep 8, 2024

2.1.0b60 pre-release

Aug 22, 2024

2.1.0b59 pre-release

Aug 18, 2024

2.1.0b58 pre-release

Jul 11, 2024

2.1.0b57 pre-release

Mar 23, 2024

2.1.0b56 pre-release

Feb 24, 2024

2.1.0b55 pre-release

Dec 22, 2023

2.1.0b54 pre-release

Nov 28, 2023

2.1.0b53 pre-release

Nov 28, 2023

2.1.0b52 pre-release

Oct 19, 2023

2.1.0b51 pre-release

Oct 14, 2023

2.1.0b50 pre-release

May 23, 2023

2.1.0b49 pre-release

Apr 14, 2023

2.1.0b48 pre-release

Apr 8, 2023

2.1.0b47 pre-release

Mar 25, 2023

2.1.0b46 pre-release

Mar 10, 2023

2.1.0b45 pre-release

Dec 7, 2022

2.1.0b44 pre-release

Nov 4, 2022

2.1.0b43 pre-release

Nov 4, 2022

2.1.0b42 pre-release

Sep 29, 2022

2.1.0b41 pre-release

Aug 27, 2022

2.1.0b40 pre-release

Aug 26, 2022

2.1.0b39 pre-release

Aug 11, 2022

2.1.0b38 pre-release

Aug 7, 2022

2.1.0b37 pre-release

Jul 19, 2022

2.1.0b36 pre-release

Jul 7, 2022

2.1.0b35 pre-release

Jul 6, 2022

2.1.0b34 pre-release

Jun 19, 2022

2.1.0b33 pre-release

Jun 16, 2022

2.1.0b32 pre-release

Jun 15, 2022

2.1.0b31 pre-release

Jun 12, 2022

2.1.0b30 pre-release

Jun 10, 2022

2.1.0b29 pre-release

Jun 8, 2022

2.1.0b28 pre-release

Jun 7, 2022

2.1.0b27 pre-release

Apr 20, 2022

2.1.0b26 pre-release

Apr 18, 2022

2.1.0b25 pre-release

Apr 16, 2022

2.1.0b24 pre-release

Apr 15, 2022

2.1.0b23 pre-release

Apr 14, 2022

2.1.0b22 pre-release

Apr 14, 2022

2.1.0b21 pre-release

Apr 13, 2022

2.1.0b20 pre-release

Apr 12, 2022

2.1.0b19 pre-release

Mar 22, 2022

2.1.0b18 pre-release

Mar 22, 2022

2.1.0b17 pre-release

Feb 23, 2022

2.1.0b16 pre-release

Feb 18, 2022

2.1.0b15 pre-release

Feb 8, 2022

2.1.0b14 pre-release

Feb 7, 2022

2.1.0b13 pre-release

Feb 5, 2022

2.1.0b12 pre-release

Feb 5, 2022

2.1.0b11 pre-release

Feb 5, 2022

2.1.0b10 pre-release

Feb 5, 2022

2.1.0b9 pre-release

Feb 2, 2022

2.1.0b8 pre-release

Feb 2, 2022

2.1.0b7 pre-release

Jan 31, 2022

2.1.0b6 pre-release

Jan 30, 2022

2.1.0b5 pre-release

Jan 27, 2022

2.1.0b4 pre-release

Jan 27, 2022

2.1.0b3 pre-release

Jan 26, 2022

2.1.0b2 pre-release

Jan 19, 2022

2.1.0b1 pre-release

Jan 15, 2022

2.1.0b0 pre-release

Dec 29, 2021

2.1.0a65 pre-release

Dec 8, 2021

2.1.0a64 pre-release

Nov 7, 2021

2.1.0a63 pre-release

Nov 4, 2021

2.1.0a62 pre-release

Oct 28, 2021

2.1.0a61 pre-release

Sep 14, 2021

2.1.0a60 pre-release

Sep 4, 2021

2.1.0a59 pre-release

Sep 4, 2021

2.1.0a58 pre-release

Sep 4, 2021

2.1.0a57 pre-release

Sep 2, 2021

2.1.0a56 pre-release

Aug 28, 2021

2.1.0a55 pre-release

Aug 17, 2021

2.1.0a54 pre-release

Jul 29, 2021

2.1.0a53 pre-release

Jul 6, 2021

2.1.0a52 pre-release

Jun 30, 2021

2.1.0a51 pre-release

Jun 29, 2021

2.1.0a50 pre-release

Jun 9, 2021

2.1.0a48 pre-release

Jun 3, 2021

2.1.0a47 pre-release

May 26, 2021

2.1.0a46 pre-release

May 24, 2021

2.1.0a45 pre-release

May 24, 2021

2.1.0a44 pre-release

May 21, 2021

2.1.0a43 pre-release

May 20, 2021

2.1.0a42 pre-release

May 18, 2021

2.1.0a41 pre-release

May 17, 2021

2.1.0a40 pre-release yanked

May 17, 2021

2.1.0a39 pre-release yanked

May 17, 2021

2.1.0a38 pre-release

Apr 29, 2021

2.1.0a37 pre-release

Apr 29, 2021

2.1.0a36 pre-release

Mar 7, 2021

2.1.0a35 pre-release

Mar 6, 2021

2.1.0a34 pre-release

Mar 5, 2021

2.1.0a33 pre-release

Mar 5, 2021

2.1.0a32 pre-release

Mar 5, 2021

2.1.0a31 pre-release

Mar 4, 2021

2.1.0a30 pre-release

Feb 28, 2021

2.1.0a29 pre-release

Feb 28, 2021

2.1.0a28 pre-release

Feb 28, 2021

2.1.0a27 pre-release

Feb 27, 2021

2.1.0a26 pre-release

Feb 27, 2021

2.1.0a25 pre-release

Feb 25, 2021

2.1.0a24 pre-release

Feb 25, 2021

2.1.0a23 pre-release

Feb 24, 2021

2.1.0a22 pre-release

Feb 22, 2021

2.1.0a21 pre-release

Feb 22, 2021

2.1.0a20 pre-release

Feb 13, 2021

2.1.0a19 pre-release

Feb 11, 2021

2.1.0a18 pre-release

Feb 11, 2021

2.1.0a17 pre-release

Feb 11, 2021

2.1.0a16 pre-release

Feb 8, 2021

2.1.0a15 pre-release

Feb 8, 2021

2.1.0a14 pre-release

Feb 5, 2021

2.1.0a13 pre-release

Feb 5, 2021

2.1.0a12 pre-release

Jan 22, 2021

2.1.0a11 pre-release

Jan 20, 2021

2.1.0a10 pre-release

Jan 14, 2021

2.1.0a9 pre-release

Jan 13, 2021

2.1.0a8 pre-release

Jan 11, 2021

2.1.0a7 pre-release

Jan 6, 2021

2.1.0a6 pre-release

Jan 6, 2021

2.1.0a5 pre-release

Jan 4, 2021

2.1.0a4 pre-release

Jan 3, 2021

2.1.0a3 pre-release

Jan 1, 2021

2.1.0a2 pre-release

Jan 1, 2021

2.1.0a1 pre-release

Jan 1, 2021

2.1.0a0 pre-release

Jan 1, 2021

2.0.0a69 pre-release

Dec 25, 2020

2.0.0a68 pre-release

Dec 12, 2020

2.0.0a67 pre-release

Nov 11, 2020

2.0.0a66 pre-release

Oct 23, 2020

2.0.0a65 pre-release

Oct 23, 2020

2.0.0a64 pre-release

Oct 11, 2020

2.0.0a63 pre-release

Oct 10, 2020

2.0.0a62 pre-release

Oct 9, 2020

2.0.0a61 pre-release

Sep 14, 2020

2.0.0a60 pre-release

Sep 3, 2020

2.0.0a59 pre-release

Sep 3, 2020

2.0.0a58 pre-release

Sep 2, 2020

2.0.0a57 pre-release

Sep 2, 2020

2.0.0a56 pre-release

Sep 1, 2020

2.0.0a55 pre-release

Aug 31, 2020

2.0.0a54 pre-release

Aug 27, 2020

2.0.0a53 pre-release

Aug 27, 2020

2.0.0a52 pre-release

Aug 23, 2020

2.0.0a51 pre-release

Aug 22, 2020

2.0.0a50 pre-release

Aug 22, 2020

2.0.0a49 pre-release

Aug 22, 2020

2.0.0a48 pre-release

Aug 22, 2020

2.0.0a47 pre-release

Aug 21, 2020

2.0.0a46 pre-release

Jul 3, 2020

2.0.0a45 pre-release

Jun 30, 2020

2.0.0a44 pre-release

May 13, 2020

2.0.0a43 pre-release

May 8, 2020

2.0.0a42 pre-release

Apr 8, 2020

2.0.0a41 pre-release

Apr 7, 2020

2.0.0a40 pre-release

Apr 4, 2020

2.0.0a39 pre-release

Mar 6, 2020

2.0.0a38 pre-release

Feb 11, 2020

2.0.0a37 pre-release

Feb 10, 2020

2.0.0a36 pre-release

Feb 7, 2020

2.0.0a35 pre-release

Feb 3, 2020

2.0.0a34 pre-release

Jan 30, 2020

2.0.0a33 pre-release

Jan 29, 2020

2.0.0a32 pre-release

Jan 26, 2020

2.0.0a31 pre-release

Jan 25, 2020

2.0.0a30 pre-release

Jan 24, 2020

2.0.0a29 pre-release

Jan 23, 2020

2.0.0a28 pre-release

Jan 23, 2020

2.0.0a27 pre-release

Jan 21, 2020

2.0.0a26 pre-release

Jan 14, 2020

2.0.0a25 pre-release

Jan 13, 2020

2.0.0a24 pre-release

Jan 12, 2020

2.0.0a22 pre-release

Jan 11, 2020

2.0.0a21 pre-release

Jan 11, 2020

2.0.0a20 pre-release

Jan 11, 2020

2.0.0a19 pre-release

Jan 10, 2020

2.0.0a18 pre-release

Jan 10, 2020

2.0.0a17 pre-release

Jan 10, 2020

2.0.0a16 pre-release

Jan 10, 2020

2.0.0a15 pre-release

Jan 10, 2020

2.0.0a14 pre-release

Jan 10, 2020

2.0.0a13 pre-release

Jan 9, 2020

2.0.0a12 pre-release

Jan 9, 2020

2.0.0a11 pre-release

Jan 9, 2020

2.0.0a10 pre-release

Jan 7, 2020

2.0.0a9 pre-release

Jan 6, 2020

2.0.0a8 pre-release

Jan 5, 2020

2.0.0a6 pre-release

Jan 5, 2020

2.0.0a5 pre-release

Jan 4, 2020

2.0.0a4 pre-release

Jan 3, 2020

2.0.0a3 pre-release

Jan 2, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

hanlp-2.1.3.tar.gz (503.8 kB view details)

Uploaded Oct 19, 2025 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

hanlp-2.1.3-py3-none-any.whl (654.1 kB view details)

Uploaded Oct 19, 2025 Python 3

File details

Details for the file hanlp-2.1.3.tar.gz.

File metadata

Download URL: hanlp-2.1.3.tar.gz
Upload date: Oct 19, 2025
Size: 503.8 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for hanlp-2.1.3.tar.gz
Algorithm	Hash digest
SHA256	`12d0c391065cf87db8854b41277b99ae4651ddaf407a95987fa1f057a50d1772`
MD5	`42cee070e3875ebdd3ac9ae6f9cc9549`
BLAKE2b-256	`0d03f91915b2f16f3334179f5b9ea0413c64172f4634c842c474809a9062f63e`

See more details on using hashes here.

File details

Details for the file hanlp-2.1.3-py3-none-any.whl.

File metadata

Download URL: hanlp-2.1.3-py3-none-any.whl
Upload date: Oct 19, 2025
Size: 654.1 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.12.3

File hashes

Hashes for hanlp-2.1.3-py3-none-any.whl
Algorithm	Hash digest
SHA256	`07aaeec6740416857e2bad3c342633fe9d3bbe1793d29d3e2b2070a8cad970e7`
MD5	`48774b4a1b90df3b1b0a344372959623`
BLAKE2b-256	`b92d197bdfcc4b6b99045060a23edd8864c3a72a86718fb305a84ad55e5a4bcf`

See more details on using hashes here.

hanlp 2.1.3

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

HanLP: Han Language Processing

中文 | 日本語 | Docs | Forum

RESTful APIs

Python

Java

Quick Start

Native APIs

Quick Start

Train Your Own Models

Performance

Citing

License

Codes

Models

References

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes