tools for using huggingface/transformers more easily

These details have not been verified by PyPI

Project links

Project description

Transformersx

##介绍
🤗 Transformers 是一个非常好用的专门针对基于Pytorch的Transformer相关NLP深度学习模型的工具库。它管理和归类了当前几乎所有的最好的基于的Transformer的自然语言模型以及公开的预训练模型，并都转换成了Pytorch。（1）使用它你可以很方便的做Bert/Albert/GPT2/XLNET等当前最好的自然语言预训练模型训练以及下游任务的模型开发和训练。（2）使用Pytorch实现的模型有更清晰的代码机构，对学习者来说，学习和理解这些自然语言更为容易。（3）提供了一个地方收集和存放公开的自然语言预训练模型，供研究人员使用。研究人员也可以把自己愿意公开的预训练模型放到Transformer上供别人研究使用。

但是Transformers也有一些问题：（1）根据当前的Transformers的实现看，所有的公开的Transformer的预训练模型都是存放在AWS的S3上。对国外的研究人员那没有什么问题。中国的研究人员需要下载这些模型就有点费周折了。当前Transformers的模型下载方式有两种：（1）通过代码调用指定模型时，自动去相应的S3上下载。（2）直接到Transformers的网上流量相应的模型文件通过浏览器下载。反正不管那种方式，想顺利的下载下来，自己想办法吧～。不多说。（2）尽管Transformers已经提供了一种比较方便的方式来使用各种Transformer相关模型了。但是还是不够好。首先，从设计上，各种模型的实现很不错，但是因为模型的实现与模型的存储和下载深度绑定。这个设计应该是有问题的。从职责上说，模型的实现和模型的存储下载应该分离。（3）Transformers增加了一个Trainer以方便研究人员训练Transformer模型使用。同样，这个Trainer的设计和实现水平跟模型的设计和实现也一样有不少的差距。

目的

本项目的目的是想针对Transformers的一些问题，对Transformers做进一步的扩展，让研究人员使用Transformers更方便。当然也没有解决上面提到的所有问题。

（1）首先，针对下载这个问题。

本项目的解决方法是，在docker目录中提供了几种用于Transformers相关模型的训练和运行环境的Docker定义，利用阿里云的Docker海外构建机器，在构建Docker是顺便把指定的预训练模型下载下来。当前主要是中文语言模型，包括bert、albert、robert、electra。可以直接从阿里云镜像库获取。相关模型放在镜像的/app/models目录下面。

docker pull registry.cn-beijing.aliyuncs.com/modoso/transformersx-bert
docker pull registry.cn-beijing.aliyuncs.com/modoso/transformersx-albert
docker pull registry.cn-beijing.aliyuncs.com/modoso/transformersx-robert
docker pull registry.cn-beijing.aliyuncs.com/modoso/transformersx-electra

最好使用脚本download-models.sh 下载并从镜像中把模型copy出来的脚本。

sh download-models.sh [指定模型存放目录]

（2）为了更方便的使用，(当然，你得先参照上面的模型下载方式下载docker镜像或者模型)

首先，你可以简单的像examples.task.sentiment.sentiment_task那样实现情感识别，只需要实现一个DataProcessor和一个Task

from ai_transformersx import DataProcessor,DataArguments,join_path,InputExample,log,TaskArguments
from ai_transformersx.examples import ExampleTaskBase
import pandas as pd
class SentimentDataProcessor(DataProcessor):
    def __init__(self, config: DataArguments):
        self._config = config

    def _get_example(self, file_name, type):
        pd_all = pd.read_csv(join_path(self._config.data_dir, file_name))

        log.info("Read data from {}, length={}".format(join_path(self._config.data_dir, file_name), len(pd_all)))
        examples = []
        for i, d in enumerate(pd_all.values):
            examples.append(InputExample(guid=type + '_' + str(i),
                                         text_a=d[1],
                                         label=str(d[0])))

        return examples

    def get_train_examples(self):
        return self._get_example('train.csv', 'train')

    def get_dev_examples(self):
        return self._get_example('dev.csv', 'dev')

    def get_labels(self):
        return ['0', '1', '2', '3']

    def data_dir(self):
        return self._config.data_dir


class SentimentTask(ExampleTaskBase):
    def __init__(self, taskArgs: TaskArguments = None):
        super().__init__('sentiment', taskArgs)
        self.task_args.model_args.num_labels = 4

    def _data_processor(self):
        return SentimentDataProcessor(self.task_args.data_args)

然后，像examples.task.main那样实现启动方法：

from ai_transformersx.examples import ExampleManagement
from ai_transformersx.examples.tasks import SentimentTask
task_manager = ExampleManagement()
task_manager.register_tasks([
    ('sentiment', SentimentTask)
])

if __name__ == "__main__":
    task_manager.start_example_task()

接着，你就可以训练你的情感识别的模型了。你应该在下载的镜像模型中进行。

查看所有sentiment任务参数

    python main.py sentiment -h

训练模型（可以参考上面的帮助列表设置相关的参数）

    python main.py sentiment

(3) 常见的中文的自然语言任务的例子

TODO:

使用 pytorchlightning和fastai来实现trainer
增加更多的自然语言任务的例子

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

This version

0.6.17

Jul 16, 2020

0.6.16

Jul 9, 2020

0.6.15

Jul 9, 2020

0.6.14

Jul 9, 2020

0.6.13

Jul 8, 2020

0.6.12

Jul 8, 2020

0.6.11

Jul 8, 2020

0.6.10

Jul 8, 2020

0.6.9

Jul 8, 2020

0.6.8

Jul 8, 2020

0.6.7

Jul 7, 2020

0.6.6

Jul 7, 2020

0.6.5

Jul 7, 2020

0.6.4

Jul 7, 2020

0.6.3

Jul 7, 2020

0.6.2

Jul 7, 2020

0.6.1

Jul 7, 2020

0.6.0

Jul 7, 2020

0.5.39

Jun 29, 2020

0.5.38

Jun 29, 2020

0.5.37

Jun 29, 2020

0.5.36

Jun 29, 2020

0.5.35

Jun 23, 2020

0.5.33

Jun 23, 2020

0.5.32

Jun 23, 2020

0.5.31

Jun 23, 2020

0.5.30

Jun 23, 2020

0.5.29

Jun 23, 2020

0.5.28

Jun 23, 2020

0.5.27

Jun 23, 2020

0.5.26

Jun 23, 2020

0.5.25

Jun 23, 2020

0.5.24

Jun 23, 2020

0.5.23

Jun 21, 2020

0.5.22

Jun 21, 2020

0.5.21

Jun 21, 2020

0.5.20

Jun 21, 2020

0.5.19

Jun 21, 2020

0.5.18

Jun 21, 2020

0.5.17

Jun 21, 2020

0.5.16

Jun 21, 2020

0.5.15

Jun 21, 2020

0.5.14

Jun 21, 2020

0.5.13

Jun 21, 2020

0.5.12

Jun 21, 2020

0.5.11

Jun 21, 2020

0.5.9

Jun 19, 2020

0.5.8

Jun 19, 2020

0.5.7

Jun 19, 2020

0.5.6

Jun 19, 2020

0.5.5

Jun 19, 2020

0.5.4

Jun 19, 2020

0.5.3

Jun 19, 2020

0.5.2

Jun 18, 2020

0.5.1

Jun 18, 2020

0.5.0

Jun 17, 2020

0.4.48

Jun 17, 2020

0.4.47

Jun 9, 2020

0.4.46

Jun 9, 2020

0.4.45

Jun 9, 2020

0.4.44

Jun 9, 2020

0.4.43

Jun 9, 2020

0.4.42

Jun 8, 2020

0.4.41

Jun 8, 2020

0.4.40

Jun 8, 2020

0.4.39

Jun 8, 2020

0.4.38

Jun 8, 2020

0.4.37

Jun 8, 2020

0.4.36

Jun 8, 2020

0.4.35

Jun 8, 2020

0.4.34

Jun 7, 2020

0.4.33

Jun 6, 2020

0.4.32

Jun 6, 2020

0.4.31

Jun 6, 2020

0.4.30

Jun 6, 2020

0.4.29

Jun 6, 2020

0.4.28

Jun 6, 2020

0.4.27

Jun 6, 2020

0.4.26

Jun 6, 2020

0.4.25

Jun 5, 2020

0.4.24

Jun 4, 2020

0.4.23

Jun 4, 2020

0.4.22

Jun 4, 2020

0.4.21

Jun 4, 2020

0.4.20

Jun 3, 2020

0.4.19

Jun 3, 2020

0.4.17

Jun 2, 2020

0.4.16

Jun 2, 2020

0.4.15

Jun 2, 2020

0.4.14

Jun 2, 2020

0.4.13

Jun 2, 2020

0.4.12

Jun 2, 2020

0.4.11

Jun 2, 2020

0.4.10

Jun 2, 2020

0.4.9

Jun 2, 2020

0.4.8

Jun 2, 2020

0.4.7

Jun 2, 2020

0.4.6

Jun 2, 2020

0.4.5

Jun 2, 2020

0.4.4

Jun 1, 2020

0.4.2

Jun 1, 2020

0.4.1

Jun 1, 2020

0.4.0

Jun 1, 2020

0.3.29

Jun 1, 2020

0.3.28

Jun 1, 2020

0.3.27

Jun 1, 2020

0.3.25

May 27, 2020

0.3.24

May 27, 2020

0.3.23

May 27, 2020

0.3.22

May 27, 2020

0.3.21

May 27, 2020

0.3.20

May 26, 2020

0.3.19

May 26, 2020

0.3.18

May 26, 2020

0.3.17

May 26, 2020

0.3.16

May 26, 2020

0.3.15

May 26, 2020

0.3.14

May 26, 2020

0.3.13

May 26, 2020

0.3.12

May 26, 2020

0.3.11

May 26, 2020

0.3.9

May 26, 2020

0.3.8

May 26, 2020

0.3.7

May 26, 2020

0.3.6

May 25, 2020

0.3.5

May 25, 2020

0.3.4

May 25, 2020

0.3.3

May 25, 2020

0.3.2

May 25, 2020

0.3.1

May 25, 2020

0.3.0

May 25, 2020

0.2.28

May 22, 2020

0.2.27

May 22, 2020

0.2.26

May 22, 2020

0.2.25

May 22, 2020

0.2.24

May 22, 2020

0.2.23

May 22, 2020

0.2.22

May 22, 2020

0.2.21

May 22, 2020

0.2.20

May 22, 2020

0.2.19

May 22, 2020

0.2.18

May 22, 2020

0.2.17

May 22, 2020

0.2.16

May 22, 2020

0.2.15

May 22, 2020

0.2.14

May 22, 2020

0.2.13

May 22, 2020

0.2.12

May 21, 2020

0.2.11

May 21, 2020

0.2.10

May 21, 2020

0.2.9

May 21, 2020

0.2.8

May 21, 2020

0.2.7

May 19, 2020

0.2.6

May 18, 2020

0.2.5

May 18, 2020

0.2.4

May 18, 2020

0.2.3

May 15, 2020

0.2.2

May 15, 2020

0.2.1

May 14, 2020

0.2.0

May 13, 2020

0.1.11

May 13, 2020

0.1.10

May 13, 2020

0.1.9

May 12, 2020

0.1.8

May 12, 2020

0.1.7

May 12, 2020

0.1.6

May 12, 2020

0.1.5

May 9, 2020

0.1.4

May 9, 2020

0.1.3

May 9, 2020

0.1.2

May 9, 2020

0.1.1

May 9, 2020

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ai-transformersx-0.6.17.tar.gz (81.8 kB view details)

Uploaded Jul 16, 2020 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

ai_transformersx-0.6.17-py2.py3-none-any.whl (184.3 kB view details)

Uploaded Jul 16, 2020 Python 2Python 3

File details

Details for the file ai-transformersx-0.6.17.tar.gz.

File metadata

Download URL: ai-transformersx-0.6.17.tar.gz
Upload date: Jul 16, 2020
Size: 81.8 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.4.0.post20200518 requests-toolbelt/0.9.1 tqdm/4.15.0 CPython/3.6.9

File hashes

Hashes for ai-transformersx-0.6.17.tar.gz
Algorithm	Hash digest
SHA256	`be9843f67fa7f0ace766d84ec92c5142a1699805e241e4cac64ce65078440b6b`
MD5	`690bee7c8e0d5fd21191fe61e9546e87`
BLAKE2b-256	`41a4366f3c571904b939bdd5c4ca2d23c41286559ff6cf57f6053172dfa9c1dc`

See more details on using hashes here.

File details

Details for the file ai_transformersx-0.6.17-py2.py3-none-any.whl.

File metadata

Download URL: ai_transformersx-0.6.17-py2.py3-none-any.whl
Upload date: Jul 16, 2020
Size: 184.3 kB
Tags: Python 2, Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/3.1.1 pkginfo/1.5.0.1 requests/2.23.0 setuptools/46.4.0.post20200518 requests-toolbelt/0.9.1 tqdm/4.15.0 CPython/3.6.9

File hashes

Hashes for ai_transformersx-0.6.17-py2.py3-none-any.whl
Algorithm	Hash digest
SHA256	`fc54679d05ebb0571f085f041c02f04741f2e7e687a5abd2a5d0b2d5b95989b9`
MD5	`c45dafc6658b08adb7a52e2afeda53a3`
BLAKE2b-256	`5aa2477b511f4021d5841d61f0568d54ac662e82ddca8f8992818a2a8436f495`

See more details on using hashes here.

ai-transformersx 0.6.17

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Transformersx

目的

（1）首先，针对下载这个问题。

（2）为了更方便的使用，(当然，你得先参照上面的模型下载方式下载docker镜像或者模型)

(3) 常见的中文的自然语言任务的例子

TODO:

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes