thinc

Practical Machine Learning for NLP

None

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

Thinc is the machine learning library powering spaCy. It features a battle-tested linear model designed for large sparse learning problems, and a flexible neural network model under development for spaCy v2.0.

Thinc is a practical toolkit for implementing models that follow the “Embed, encode, attend, predict” architecture. It’s designed to be easy to install, efficient for CPU usage and optimised for NLP and deep learning with text – in particular, hierarchically structured input and variable-length sequences.

🔮 Version 6.0 out now! Read the release notes here.

Quickstart

If you have Fabric installed, you can use the shortcut:

git clone https://github.com/explosion/thinc
cd thinc
fab clean env make test

You can then run the examples as follows:

fab eg.mnist
fab eg.basic_tagger

Otherwise, you can build and test explicitly with:

git clone https://github.com/explosion/thinc
cd thinc

virtualenv .env
source .env/bin/activate

pip install -r requirements.txt
python setup.py build_ext --inplace
py.test thinc/

And then run the examples as follows:

python examples/mnist.py
python examples/basic_tagger.py

Design

Thinc is implemented in pure Python at the moment, using Chainer’s cupy for GPU and numpy for CPU computations. Thinc doesn’t use autodifferentiation. Instead, we just use callbacks.

Let’s say you have a batch of data, of shape (B, I). You want to use this to update a model. To do that, you need to compute the model’s output for that input, and also the gradient with respect to that output. Like so:

x__BO, finish_update = model.begin_update(x__BI)
dx__BO = compute_gradient(dx__BO, y__B)
dx__BI = finish_update(dx__BO)

To backprop through multiple layers, we simply accumulate the callbacks:

class Chain(list):
    def predict(self, X):
        for layer in self:
            X = layer(X)
        return X

    def begin_update(self, X, dropout=0.0):
        callbacks = []
        for layer in self.layers:
            X, callback = layer.begin_update(X, dropout=dropout)
        callbacks.append(callback)

        def finish_update(gradient, optimizer):
            for backprop in reversed(callbacks):
                gradient = backprop(gradient, optimizer)
            return gradient
        return X, finish_update

The differentiation rules are pretty easy to work with, so long as every layer is a good citizen.

Adding layers

To add layers, you usually implement a subclass of base.Model or base.Network. Use Network for layers which don’t own weights data directly, but instead, chain together a sequence of models.

class ReLuMLP(Network):
    Hidden = ReLu
    Output = Softmax
    width = 128
    depth = 3

    def setup(self, nr_out, nr_in, **kwargs):
        for i in range(self.depth):
            self.layers.append(self.Hidden(nr_out=self.width, nr_in=nr_in,
                name='hidden-%d' % i))
            nr_in = self.width
        self.layers.append(self.Output(nr_out=nr_out, nr_in=nr_in))
        self.set_weights(initialize=True)
        self.set_gradient()

When you implement a layer, there are two simple rules to follow to make sure it’s well-behaved:

Don’t add side-effects to begin_update. Aside from the obvious concurrency problems, it’s not nice to make the API silently produce incorrect results if the user calls the functions out of order.
Keep the interfaces to begin_update and finish_update uniform. We want to write generic functions to sum, concatenate, average, etc different layers. If your layer has a special interface, those generic functions won’t work.

Project details

None

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

9.0.0

Apr 19, 2024

9.0.0.dev5 pre-release

Apr 8, 2024

9.0.0.dev4 pre-release

Jan 16, 2024

9.0.0.dev3 pre-release

Mar 23, 2023

9.0.0.dev2 pre-release

Jan 13, 2023

9.0.0.dev1 pre-release

Dec 23, 2022

9.0.0.dev0 pre-release

Dec 9, 2022

8.2.3

Feb 7, 2024

8.2.2

Dec 14, 2023

8.2.1

Sep 22, 2023

8.2.0

Aug 11, 2023

8.1.12

Aug 11, 2023

8.1.11

Aug 7, 2023

8.1.10

May 3, 2023

8.1.9

Mar 7, 2023

8.1.8

Mar 2, 2023

8.1.7

Jan 13, 2023

8.1.6

Dec 20, 2022

8.1.5

Oct 19, 2022

8.1.4

Oct 12, 2022

8.1.3

Oct 7, 2022

8.1.2

Sep 27, 2022

8.1.1

Sep 9, 2022

8.1.0

Jul 8, 2022

8.1.0.dev3 pre-release

Jun 22, 2022

8.1.0.dev2 pre-release

Jun 16, 2022

8.1.0.dev1 pre-release

Jun 14, 2022

8.1.0.dev0 pre-release

May 20, 2022

8.0.17

Jun 2, 2022

8.0.16

May 19, 2022

8.0.15

Mar 15, 2022

8.0.14

Mar 14, 2022

8.0.14.dev0 pre-release

Dec 17, 2021

8.0.13

Nov 5, 2021

8.0.12

Oct 28, 2021

8.0.11

Oct 20, 2021

8.0.10

Sep 7, 2021

8.0.9

Sep 3, 2021

8.0.8

Jul 19, 2021

8.0.7

Jul 1, 2021

8.0.6

Jun 21, 2021

8.0.5

Jun 16, 2021

8.0.4

Jun 11, 2021

8.0.3

Apr 19, 2021

8.0.2

Mar 9, 2021

8.0.1

Jan 24, 2021

8.0.0

Jan 21, 2021

8.0.0rc6 pre-release

Jan 21, 2021

8.0.0rc6.dev0 pre-release

Jan 21, 2021

8.0.0rc5 pre-release

Jan 21, 2021

8.0.0rc4 pre-release

Jan 18, 2021

8.0.0rc3 pre-release

Dec 16, 2020

8.0.0rc2 pre-release

Nov 3, 2020

8.0.0rc1 pre-release

Oct 26, 2020

8.0.0rc0 pre-release

Oct 14, 2020

8.0.0a44 pre-release

Oct 10, 2020

8.0.0a43 pre-release

Oct 1, 2020

8.0.0a42 pre-release

Sep 29, 2020

8.0.0a41 pre-release

Sep 27, 2020

8.0.0a40 pre-release

Sep 27, 2020

8.0.0a36 pre-release

Sep 26, 2020

8.0.0a35 pre-release

Sep 24, 2020

8.0.0a34 pre-release

Sep 18, 2020

8.0.0a33 pre-release

Sep 17, 2020

8.0.0a32 pre-release

Sep 8, 2020

8.0.0a31 pre-release

Sep 6, 2020

8.0.0a30 pre-release

Aug 24, 2020

8.0.0a29 pre-release

Aug 23, 2020

8.0.0a28 pre-release

Aug 19, 2020

8.0.0a27 pre-release

Aug 14, 2020

8.0.0a26 pre-release

Aug 14, 2020

8.0.0a25 pre-release

Aug 13, 2020

8.0.0a24 pre-release

Aug 12, 2020

8.0.0a23 pre-release

Aug 7, 2020

8.0.0a22 pre-release

Aug 5, 2020

8.0.0a21 pre-release

Aug 3, 2020

8.0.0a20 pre-release

Jul 29, 2020

8.0.0a19 pre-release

Jul 21, 2020

8.0.0a18 pre-release

Jul 19, 2020

8.0.0a17 pre-release

Jul 11, 2020

8.0.0a16 pre-release

Jul 10, 2020

8.0.0a14 pre-release

Jul 10, 2020

8.0.0a13 pre-release

Jul 9, 2020

8.0.0a12 pre-release

Jul 3, 2020

8.0.0a11 pre-release

Jun 26, 2020

8.0.0a9 pre-release

May 19, 2020

8.0.0a8 pre-release

May 16, 2020

8.0.0a6 pre-release

May 11, 2020

8.0.0a3 pre-release

Mar 24, 2020

8.0.0a2 pre-release

Mar 13, 2020

8.0.0a1 pre-release

Feb 12, 2020

8.0.0a0 pre-release

Jan 28, 2020

8.0.0.dev4 pre-release

Jan 27, 2020

8.0.0.dev2 pre-release

Jan 23, 2020

8.0.0.dev0 pre-release

Jan 19, 2020

7.4.6

Oct 18, 2022

7.4.5

Dec 11, 2020

7.4.4 yanked

Dec 8, 2020

7.4.3

Nov 23, 2020

7.4.2

Nov 4, 2020

7.4.1

May 24, 2020

7.4.0

Feb 25, 2020

7.4.0.dev2 pre-release

Feb 16, 2020

7.4.0.dev1 pre-release

Dec 21, 2019

7.4.0.dev0 pre-release

Dec 9, 2019

7.3.1

Oct 30, 2019

7.3.0

Oct 28, 2019

7.3.0.dev0 pre-release

Oct 28, 2019

7.2.0

Oct 20, 2019

7.2.0.dev3 pre-release

Oct 20, 2019

7.1.1

Sep 10, 2019

7.1.0

Aug 23, 2019

7.1.0.dev0 pre-release

Aug 23, 2019

7.0.8

Jul 11, 2019

7.0.7

Jul 11, 2019

7.0.6

Jul 11, 2019

7.0.5

Jul 10, 2019

7.0.5.dev0 pre-release

Jul 10, 2019

7.0.4

Mar 19, 2019

7.0.4.dev0 pre-release

Mar 19, 2019

7.0.3

Mar 14, 2019

7.0.2

Feb 23, 2019

7.0.1

Feb 16, 2019

7.0.1.dev2 pre-release

Feb 16, 2019

7.0.1.dev1 pre-release

Feb 16, 2019

7.0.1.dev0 pre-release

Feb 16, 2019

7.0.0

Feb 15, 2019

7.0.0.dev8 pre-release

Feb 13, 2019

7.0.0.dev6 pre-release

Dec 3, 2018

7.0.0.dev5 pre-release

Dec 3, 2018

7.0.0.dev4 pre-release

Dec 2, 2018

7.0.0.dev3 pre-release

Nov 30, 2018

7.0.0.dev2 pre-release

Nov 29, 2018

7.0.0.dev1 pre-release

Nov 27, 2018

7.0.0.dev0 pre-release

Nov 26, 2018

6.12.1

Nov 30, 2018

6.12.0

Oct 14, 2018

6.11.3.dev2 pre-release

Nov 26, 2018

6.11.3.dev1 pre-release

Sep 12, 2018

6.11.2

May 21, 2018

6.11.2.dev0 pre-release

May 21, 2018

6.11.1

May 20, 2018

6.11.1.dev20 pre-release

May 19, 2018

6.11.1.dev19 pre-release

May 19, 2018

6.11.1.dev18 pre-release

May 19, 2018

6.11.1.dev17 pre-release

May 15, 2018

6.11.1.dev16 pre-release

May 15, 2018

6.11.1.dev15 pre-release

May 15, 2018

6.11.1.dev13 pre-release

May 1, 2018

6.11.1.dev12 pre-release

Apr 9, 2018

6.11.1.dev11 pre-release

Mar 26, 2018

6.11.1.dev10 pre-release

Mar 25, 2018

6.11.1.dev7 pre-release

Mar 18, 2018

6.11.1.dev6 pre-release

Mar 18, 2018

6.11.1.dev4 pre-release

Mar 16, 2018

6.11.1.dev3 pre-release

Mar 16, 2018

6.11.1.dev2 pre-release

Mar 16, 2018

6.11.1.dev1 pre-release

Mar 16, 2018

6.11.1.dev0 pre-release

Mar 16, 2018

6.11.0.dev2 pre-release

Mar 14, 2018

6.10.4.dev0 pre-release

Oct 14, 2018

6.10.3

Jul 21, 2018

6.10.3.dev1 pre-release

Jul 20, 2018

6.10.3.dev0 pre-release

Jul 20, 2018

6.10.2

Dec 6, 2017

6.10.2.dev1 pre-release

Dec 5, 2017

6.10.2.dev0 pre-release

Dec 4, 2017

6.10.1

Nov 15, 2017

6.10.1.dev0 pre-release

Nov 15, 2017

6.10.0

Oct 28, 2017

6.9.0

Oct 3, 2017

6.8.2

Sep 26, 2017

6.8.1

Sep 15, 2017

6.8.0

Jul 25, 2017

6.7.3

Jun 5, 2017

6.7.2

Jun 3, 2017

6.7.1

Jun 2, 2017

6.7.0

Jun 1, 2017

6.6.0

May 13, 2017

6.5.2

Mar 20, 2017

6.5.0

Mar 11, 2017

6.4.0

Feb 15, 2017

6.3.0

Jan 25, 2017

6.2.0

Jan 15, 2017

6.1.3

Jan 9, 2017

6.1.2

Jan 9, 2017

This version

6.1.1

Jan 9, 2017

6.1.0

Jan 9, 2017

6.0.0

Dec 31, 2016

5.0.8

Apr 30, 2016

5.0.7

Mar 25, 2016

5.0.6

Mar 2, 2016

5.0.5

Feb 19, 2016

5.0.4

Feb 7, 2016

5.0.3

Feb 7, 2016

5.0.2

Feb 5, 2016

5.0.1

Feb 5, 2016

5.0.0

Feb 5, 2016

4.2.0

Dec 31, 2015

4.1.0

Dec 22, 2015

4.0.0

Nov 7, 2015

3.4.1

Nov 2, 2015

3.3

Jul 24, 2015

3.2

Jun 29, 2015

3.1

Jun 29, 2015

3.0

Jun 28, 2015

2.0

Jun 24, 2015

1.76

Jun 7, 2015

1.75

Mar 6, 2015

1.74

Feb 23, 2015

1.73

Jan 8, 2015

1.72

Jan 8, 2015

1.71

Jan 4, 2015

1.70

Jan 4, 2015

1.69

Jan 4, 2015

1.68

Jan 4, 2015

1.67

Jan 3, 2015

1.66

Jan 3, 2015

1.65

Jan 3, 2015

1.64

Jan 3, 2015

1.63

Jan 3, 2015

1.62

Jan 3, 2015

1.61

Jan 3, 2015

1.60

Jan 2, 2015

1.42

Feb 18, 2015

1.41

Feb 18, 2015

1.5

Jan 2, 2015

1.4

Nov 18, 2014

1.3

Nov 16, 2014

1.2

Oct 2, 2014

1.1

Oct 2, 2014

1.0

Oct 2, 2014

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

thinc-6.1.1.tar.gz (729.9 kB view hashes)

Uploaded Jan 9, 2017 Source

Hashes for thinc-6.1.1.tar.gz

Hashes for thinc-6.1.1.tar.gz
Algorithm	Hash digest
SHA256	`2f222818c5ab37f50f446a6872314a385e77548f255fed30c9ab22383a79e528`
MD5	`e0e8b6653d84fa07936e4f2abad600ce`
BLAKE2b-256	`1af1e45826e44b9326c52bf49459cd34ab277695dff3ce8c11eea136800e2b74`