Skip to main content

Shallow elasticsearch wrapper on Django

Project description

django-elasticindex
~~~~~~~~~~~~~~~~~~~

Django用 Elasticsearch の薄いラッパー


できること
=====

・Django モデルと対応させ、Elasticsearch にデータを流し込むことができます。

(モデルとの対応は必須ではありません)

・Djangoクエリセットに少し近い形式で、クエリを発行することができます。

クエリには Elasticsearch のクエリに用いるための辞書をそのまま用いる、
あまり分厚くない(お節介の少ない)インターフェイスとなっています。



Install
=======
::

$ pip install django-elasticindex


サンプルコード
=======

リポジトリ内の、tests ディレクトリに動作するコードがあります。

1. Djangoのモデルの定義
----------------

models.py
::

from django.db import models

class DummyModel(models.Model):
key = models.CharField(max_length=20, primary_key=True)
value = models.TextField()


2. ElasticDocument クラスの定義
-------------------------

::

from elasticindex.models import ElasticDocument, ElasticDocumentField as F

class DummyESDocument(ElasticDocument):
INDEX = "elasticindex_test"
DOC_TYPE = "elasticindex_test_doc"
ALLOW_KUROMOJI = False

source_model = DummyModel

key = F(mapping={"type": "string", "index": "not_analized"})
value = F(mapping={"type": "string"})


3. データ流し込みバッチ
-------------

::

DummyESDocument.rebuild_index()

rebuild_index() を実行すると、Elasticsearch 上にインデックスを作成し(存在しない場合)、
対応するDjango モデル ( DummyModel ) の全データを DB から読み出し、Elasticsearch に入れます。


3-1. 特定のモデルインスタンスのデータを入れる

::

i = DummyModel.objects.get(key="xxx")
DummyESDocument.rebuild_index_by_source_model(i)

これで、1レコードの更新ができます


4. 検索
-----

4-1. シンプルな検索

::

results = DummyESDocument.objects.query({"match": {"key": "jumps"}})

results は、ElasticQuerySet のインスタンスです。

::

result = list(results)[0]

検索を行い、result には DummyESDocument のインスタンスが入ります。


4-2. OR検索

::

qs = DummyESDocument.objects.query(
{"bool": {
"should": [
{"match": {"value": "dogs"}},
{"match": {"value": "fox"}},

]}})

query は Elasticsearch の query をそのまま使います。


4-3. ソート順変更

::

qs = DummyESDocument.objects.query({...})
qs = qs.order_by({"key": "desc"})

Django のクエリセットのように、order_by をメソッドチェーンしてください。


4-4. 結果のスライシング

::

qs = DummyESDocument.objects.query({...})
results = qs[:100]

こちらも、Djangoのクエリセットのように、Python のスライシングを行うと範囲指定できます。
実行したタイミングでクエリが評価され、HTTPリクエストが発行されます。

また、.limit(), .offset() というメソッドもあり、メソッドチェーンで使えます。

::

qs = DummyESDocument.objects.query({...})
qs = qs.limit(20).offset(40).order_by({"created_at": "desc"})


4-5. パジネーション

Django のクエリセットのように、

::

from django.core.paginator import Paginator

qs = DummyESDocument.objects.query({...})
paginator = Paginator(qs, 100)

page = paginator.page(1)

page.object_list...

Django の Paginator を用いてのパジネーションができます。


5. 設定
-----

5-1. ローカルエリアの ES を指定する場合

settings.py

::

ELASTICINDEX_HOSTS = [{'host': '127.0.0.1', 'port': 9200}]

ELASTICINDEX_HOSTS を指定してください。


5-2. Amazon Elasticsearch Service を使う場合

::

ELASTICINDEX_HOSTS = [
{'host': 'xxxxxx.ap-northeast-1.es.amazonaws.com',
'port': 443}]
ELASTICINDEX_AWS_IAM = {
'access_id': 'AWSACCESSID',
'secret_key': 'AwsSecretKey******',
'region': 'ap-northeast-1',
}

Amazon ES へのアクセスを許可した IAM のクレデンシャルを settings に書いてください。

Amazon ES へのアクセス許可方法(IAMの作成方法)は Qiita に書きました

Amazon Elasticsearch Service を Python クライアントで、IAM アカウントを作ってセキュアにアクセスする - Qiita

http://qiita.com/ytyng/items/7c90c0b141aad9a12b38


6. テスト
------

クローンしたリポジトリで

::

$ pip install -r requirements.txt
$ ./runtest.py

実際に ES にアクセスを行う。
ESがローカルの 9200 ポートで動作していない場合は、local_settings.py を作成

local_settings.py
::

ELASTICINDEX_HOSTS = [{'host': 'my-elasticsearch-host', 'port': 9200}]

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

django-elasticindex-0.1.5.tar.gz (9.5 kB view details)

Uploaded Source

File details

Details for the file django-elasticindex-0.1.5.tar.gz.

File metadata

File hashes

Hashes for django-elasticindex-0.1.5.tar.gz
Algorithm Hash digest
SHA256 f49f5b7d7f472991d5d7487830181ee80264074a18784a1d909a9c24c9ac3fa7
MD5 e802ad390026bd97040bc07b1ae5d28a
BLAKE2b-256 b8895ed8a6f080942bca26c394a7e3586bb028a2d41daeedbae8ae6960dd6e5d

See more details on using hashes here.

Supported by

AWS AWS Cloud computing and Security Sponsor Datadog Datadog Monitoring Fastly Fastly CDN Google Google Download Analytics Microsoft Microsoft PSF Sponsor Pingdom Pingdom Monitoring Sentry Sentry Error logging StatusPage StatusPage Status page