th2_data_services

These details have not been verified by PyPI

Project links

Homepage

Project description

Table of Contents
1. Introduction
2. Getting started
3. Best practices
4. Official DataSource implementations
5. API
6. Examples

1. Introduction

This repository is a library for creating th2-data-services applications. Data Services allows you to manipulate the stream data processing workflow using pipelining.

The library's features:

Provides core interface for developing data source implementations
Work with iterable objects (list, tuple, etc including files) via Data object using its features
Manipulate the workflow to make some analysis by Data object methods
Use timestamp converter implementations or use base class to create custom converters
Build Event Trees (EventTree, EventTreeCollection and ParentEventTreeCollection classes)

Workflow manipulation tools allows you:

Filtering stream data (Data.filter method)
Transforming stream data (Data.map method)
Limiting the number of processed streaming data (Data.limit method)

There is also another part of data services

th2-data-services-utils. It's a set of tools to perform the most common analysis tasks.

2. Getting started

2.1. Installation

Core

From PyPI (pip) This package can be found on PyPI.
```
pip install th2-data-services
```

From Source

git clone https://github.com/th2-net/th2-data-services
pip install th2-data-services/

Data sources (providers)

Since v1.3.0, the library doesn't provide data source dependencies.

You should provide it manually during installation. You just need to add square brackets after library name and put dependency name.

pip install th2-data-services[dependency_name]

Dependencies list

dependency name	provider version
lwdp	latest version of lwdp
lwdp2	latest version of lwdp v2
lwdp3	latest version of lwdp v3
utils-rpt-viewer	latest version of utils-rpt-viewer
utils-rpt-viewer5	latest version of utils-rpt-viewer v5
utils-advanced	latest version of ds-utils

Example

pip install th2-data-services[lwdp1]

2.2. Example

A good, short example is worth a thousand words.

This example shows basic usage of library's features.

The following example as a file.

from typing import Tuple, List, Optional, Generator from datetime import datetime

from th2_data_services.data import Data from th2_data_services.dummy import DummyDataSource from th2_data_services.event_tree import ( EventTree, EventTreeCollection, ParentEventTreeCollection, IETCDriver, ) from th2_data_services.interfaces import IDataSource from th2_data_services.utils.converters import ( DatetimeConverter, DatetimeStringConverter, ProtobufTimestampConverter, Th2TimestampConverter, )

######################################

[0] Lib configuration

######################################

[0.1] Interactive or Script mode

If you use the lib in interactive mode (jupyter, ipython) it's recommended to set the special

global parameter to True. It'll keep cache files if something went wrong.

from th2_data_services.config import options

options.INTERACTIVE_MODE = True

Some example data

events = Data( [ { "eventId": "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1", "batchId": None, "isBatched": False, "eventName": "Set of auto-generated events for ds lib testing", "eventType": "ds-lib-test-event", "endTimestamp": {"epochSecond": 1672927025, "nano": 561751000}, "startTimestamp": {"epochSecond": 1672927025, "nano": 560873000}, "parentEventId": None, "successful": True, "bookId": "demo_book_1", "scope": "th2-scope", "attachedMessageIds": [], "body": [], }, { "eventId": "demo_book_1:th2-scope:20230105135705563522000:9adbb3e0-5f8b-4c28-a2ac-7361e8fa704c>demo_book_1:th2-scope:20230105135705563522000:d61e930a-8d00-11ed-aa1a-d34a6155152d_2", "batchId": "demo_book_1:th2-scope:20230105135705563522000:9adbb3e0-5f8b-4c28-a2ac-7361e8fa704c", "isBatched": True, "eventName": "Plain event 1", "eventType": "ds-lib-test-event", "endTimestamp": {"epochSecond": 1672927025, "nano": 563640000}, "startTimestamp": {"epochSecond": 1672927025, "nano": 563522000}, "parentEventId": "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1", "successful": True, "bookId": "demo_book_1", "scope": "th2-scope", "attachedMessageIds": [], "body": {"type": "message", "data": "ds-lib test body"}, }, { "eventId": "demo_book_1:th2-scope:20230105135705563522000:9adbb3e0-5f8b-4c28-a2ac-7361e8fa704c>demo_book_1:th2-scope:20230105135705563757000:d61e930a-8d00-11ed-aa1a-d34a6155152d_3", "batchId": "demo_book_1:th2-scope:20230105135705563522000:9adbb3e0-5f8b-4c28-a2ac-7361e8fa704c", "isBatched": True, "eventName": "Plain event 2", "eventType": "ds-lib-test-event", "endTimestamp": {"epochSecond": 1672927025, "nano": 563791000}, "startTimestamp": {"epochSecond": 1672927025, "nano": 563757000}, "parentEventId": "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1", "successful": True, "bookId": "demo_book_1", "scope": "th2-scope", "attachedMessageIds": [], "body": {"type": "message", "data": "ds-lib test body"}, }, { "eventId": "fake-eventId", "batchId": "fake-batchId", "isBatched": True, "eventName": "Fake event", "eventType": "ds-lib-test-event", "endTimestamp": {"epochSecond": 1672927035, "nano": 563791000}, "startTimestamp": {"epochSecond": 1672927325, "nano": 563757000}, "parentEventId": "not_exists_in_the_events_stream", "successful": False, "bookId": "demo_book_1", "scope": "th2-scope", "attachedMessageIds": [], "body": {"type": "message", "data": "ds-lib test body"}, }, ] )

######################################

[1] Working with a Data object.

######################################

[1.1] Filter.

filtered_events: Data = events.filter(lambda e: e["body"] != []) # Filter events with empty body.

[1.2] Map.

def transform_function(record): return {"eventName": record["eventName"], "successful": record["successful"]}

filtered_and_mapped_events = filtered_events.map(transform_function)

[1.3] Data pipeline.

Instead of doing data transformations step by step you can do it in one line.

filtered_and_mapped_events_by_pipeline = events.filter(lambda e: e["body"] != []).map( transform_function )

Content of these two Data objects should be equal.

assert list(filtered_and_mapped_events) == list(filtered_and_mapped_events_by_pipeline)

[1.4] Sift. Skip the first few items or limit them.

data = Data([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15]) items_from_11_to_end: Generator = data.sift(skip=10) only_first_10_items: Generator = data.sift(limit=10)

[1.5] Changing cache status.

events.use_cache(True)

or just

events.use_cache() # If you want to activate cache.

[1.6] Walk through data.

for event in events: # Do something with event (event is a dict). print(event)

After first iteration the events has a cache file.

Now they will be used in the cache in the next iteration.

[1.7] Get number of the elements in the Data object.

number_of_events = events.len

[1.8] Check that Data object isn't empty.

The data source should be not empty.

assert events.is_empty is False

[1.9] Convert Data object to the list of elements(events or messages).

Be careful, this can take too much memory.

events_list = list(events)

[1.10] The cache inheritance.

Creates a new Data object that will use cache from the events Data object.

events_filtered: Data = events.filter(lambda record: record.get("batchId"))

New Data objects don't use their own cache by default but use the cache of the parent Data object.

Use use_cache method to activate caching.

After that, the Data object will create its own cache file.

events_filtered.use_cache()

list(events_filtered) # Just to iterate Data object (cache file will be created).

filtered_events_types = events_filtered.map(lambda record: {"eventType": record.get("eventType")})

events_without_types_with_batch = filtered_events_types.filter( lambda record: not record.get("eventType") ) events_without_types_with_batch.use_cache()

[1.11] Data objects joining.

You have the following 3 Data objects.

d1 = Data([1, 2, 3]) d2 = Data(["a", {"id": 123}, "c"]) d3 = Data([7, 8, 9])

You can join Data objects in following ways.

Please note, new Data object will have cache status == False.

data_via_init = Data([d1, d2, d3]) data_via_add = d1 + d2 + d3 data_with_non_data_obj_via_init = Data([d1, ["a", {"id": 123}, "c"], d3]) data_with_non_data_obj_via_add = d1 + ["a", {"id": 123}, "c"] + d3

You can join current Data object on place using +=.

It will keep cache status.

d1 += d3 # d1 will become Data([1,2,3,7,8,9])

[1.12] Build and read Data object cache files.

events.build_cache("cache_filename_or_path") data_obj_from_cache = Data.from_cache_file("cache_filename_or_path")

[1.13] Check if Data is sorted.

That will return an object `is_sorted` that contains information

1. status -- sorted or not

2. first_unsorted -- the index of the first unsorted element

is_sorted = events.is_sorted(lambda e: e["startTimestamp"]["epochSecond"])

You can use this object as usual bool variable.

if is_sorted: print("events Data obj is sorted!")

[1.14] Use `Data.show()` to look at the first N messages in the stream.

data_with_non_data_obj_via_add.show(n=6)

Will print

------------- Printed first 6 records -------------

[1] ------

1 [2] ------

2 [3] ------

3 [4] ------

'a'

[5] ------

{'id': 123}

[6] ------

'c'

[1.15] You can remove the cache file of the Data object, if required.

data_obj_from_cache.clear_cache()

[1.16] Get the message by its ID from the Data object in one line.

msg = next(data_obj_from_cache.find_by(record_field="MessageId", field_values=["msg-id"]))

[1.17] Update metadata for Data objects.

d1.metadata - {}

d1.update_metadata({"a": 1, "b": [10], "c": {"a": 100}})

d1.metadata - {'a': 1, 'b': [10], 'c': {'a': 100}}

d1.update_metadata({"a": 2, "b": 20, "c": {"a": 200, "b": 300}})

d1.metadata - {'a': 2, 'b': [10, 20], 'c': {'a': 200, 'b': 300}}

d1.update_metadata({"a": {}}) - This throws AttributeError: 'int' object has no attribute 'update'.

To set key whose value is of non-dict type to dict we can use change_type="change" argument.

d1.update_metadata({"a": {}}, change_type="change")

d1.metadata - {'a': {}, 'b': [10, 20], 'c': {'a': 200, 'b': 300}}

change_type can be either 'update' (default) or 'change' - overwrite existing value or create a new one if it

doesn't exist.

######################################

[2] Working with converters.

######################################

There are currently three implementations of ITimestampConverter class: DatetimeConverte, DatetimeStringConverter and ProtobufTimestampConverter.

They all implement same methods from base class.

Note that some accuracy may be lost during conversion.

If for example you use to_microseconds nanoseconds will be cut off instead of rounding.

[2.1] DatetimeConverter.

DatetimeConverter takes datetime.datetime object as input.

datetime_obj = datetime(year=2023, month=1, day=5, hour=14, minute=38, second=25, microsecond=1460)

It has methods that return the datetime in different formas:

date_ms = DatetimeConverter.to_milliseconds(datetime_obj) date_us = DatetimeConverter.to_microseconds(datetime_obj)

Converting to nanoseconds justs adds three trailing zeros as datetime object doesn't have nanoseconds.

date_ns = DatetimeConverter.to_nanoseconds(datetime_obj)

[2.2] DatetimeStringConverter

DatetimeStringConverter takes string in "yyyy-MM-ddTHH:mm:ss[.SSSSSSSSS]Z" format.

date_string = "2023-01-05T14:38:25.00146Z"

We have same methods as in DatetimeConverter

date_ms_from_string = DatetimeStringConverter.to_milliseconds(date_string) date_us_from_string = DatetimeStringConverter.to_microseconds(date_string) date_ns_from_string = DatetimeStringConverter.to_nanoseconds(date_string)

We can also get datetime object from string

datetime_from_string = DatetimeStringConverter.to_datetime(date_string)

[2.3] ProtobufTimestampConverter

Protobuf timestamps must be in form {"epochSecond": seconds, "nano": nanoseconds}

protobuf_timestamp = {"epochSecond": 1672929505, "nano": 1_460_000}

date_ms_from_timestamp = ProtobufTimestampConverter.to_milliseconds(protobuf_timestamp) date_us_from_timestamp = ProtobufTimestampConverter.to_microseconds(protobuf_timestamp) date_ns_from_timestamp = ProtobufTimestampConverter.to_nanoseconds(protobuf_timestamp) datetime_from_timestamp = ProtobufTimestampConverter.to_datetime(protobuf_timestamp)

######################################

[3] Working with EventTree and EventTreeCollection.

######################################

Can be useful if you have data-stream with < 100k elements, otherwise it

takes too much RAM.

[3.1] Build a custom EventTree

To create an EventTree object you need to provide name, id and data of the root event.

tree = EventTree(event_name="root event", event_id="root_id", data={"data": [1, 2, 3, 4, 5]})

To add new node use append_event. parent_id is necessary, data is optional.

tree.append_event(event_name="A", event_id="A_id", data=None, parent_id="root_id")

[3.3] Building the EventTreeCollection.

data_source: IDataSource # You should init DataSource object. E.g. from LwDP module. data_source = DummyDataSource() # Note! We use fake DS here.

ETCDriver here is a stub, actually the lib doesn't have such a class.

You can take it in LwDP module or create yourself class if you have some special events structure.

from th2_data_services.data_source.lwdp.event_tree import HttpETCDriver as ETCDriver

If you don't specify data_source for the driver then it won't recover detached events.

driver: IETCDriver # You should init ETCDriver object. E.g. from LwDP module or your custom class. driver = ETCDriver(data_source=data_source, use_stub=True)

etc = EventTreeCollection(driver) etc.build(events) etc.show()

It'll print the following:

Set of auto-generated events for ds lib testing

├── Plain event 1

└── Plain event 2

print(etc)

EventTreeCollection(trees=1, events=3[trees=3, detached=0])

Detached events isn't empty.

assert etc.get_detached_events() # returns list of detached_events.

recover_unknown_events -- used to recover some events parents.

That won't work with DummyDataSource, so was commented

etc.recover_unknown_events()

After that the detached events should be empty because they were recovered.

assert not etc.get_detached_events()

-----

The collection has EventTrees each with a tree of events.

Using Collection and EventTrees, you can work flexibly with events.

[3.3.1] Get leaves of all trees.

leaves: Tuple[dict] = etc.get_leaves() # Returns a tuple of leaves events

[3.3.2] Get roots ids of all trees.

roots: List[str] = etc.get_roots_ids()

Returns the list of root Ids:

['demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1']

[3.3.3] Find an event in all trees.

find_event: Optional[dict] = etc.find(lambda event: "Send message" in event["eventType"])

[3.3.4] Find all events in all trees. There is also iterable version 'findall_iter'.

find_events: List[dict] = etc.findall(lambda event: event["successful"] is True)

[3.3.5] Find an ancestor of the event.

ancestor: Optional[dict] = etc.find_ancestor( "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1", filter=lambda event: "RootEvent" in event["eventName"], )

[3.3.6] Get children of the event. There is also iterable version 'get_children_iter'.

children: Tuple[dict] = etc.get_children( "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1" )

[3.3.7] Get subtree for specified event.

subtree: EventTree = etc.get_subtree( "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1" )

[3.3.8] Get full path to the event.

Looks like [ancestor_root, ancestor_level1, ancestor_level2, event]

event_path: List[dict] = etc.get_full_path( "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1" )

[3.3.9] Get parent of the event.

parent = etc.get_parent( "demo_book_1:th2-scope:20230105135705560873000:d61e930a-8d00-11ed-aa1a-d34a6155152d_1" )

[3.3.10] Append new event to the collection.

etc.append_event( event={ "eventId": "a20f5ef4-c3fe-bb10-a29c-dd3d784909eb", "parentEventId": "8e2524fa-cf59-11eb-a3f7-094f904c3a62", "eventName": "StubEvent", } )

[3.3.11] Show the entire collection.

etc.show()

It'll print the following:

Set of auto-generated events for ds lib testing

├── Plain event 1

└── Plain event 2

As you can see, nothing was changed, but we added the new event!

let's look at the summary.

print(etc.summary()) # the same as just print(etc)

EventTreeCollection(trees=1, events=5[trees=3, detached=2])

You can see that it was added to detached. That's why you don't see the event

via `show()`. `show()` prints only Trees!

Use `etc.get_parentless_trees()` to convert detached events to trees.

More information below in the corresponding section.

--------------

[3.4] Working with the EventTree.

EventTree has the same methods as EventTreeCollection, but only for its own tree.

[3.4.1] Get a collection of trees.

trees: List[EventTree] = etc.get_trees() tree: EventTree = trees[0]

But EventTree provides a work with the tree, but does not modify it.

If you want to modify the tree, use EventTreeCollections.

[3.5] Working with ParentlessTree.

ParentlessTree is an EventTree that has detached events with stubs.

parentless_trees: List[EventTree] = etc.get_parentless_trees() print("parentless_trees contains:") print(parentless_trees)

[EventTree(name='', root_id='not_exists_in_the_events_stream', events=2),

EventTree(name='', root_id='8e2524fa-cf59-11eb-a3f7-094f904c3a62', events=2)]

print("\n" "etc after get_parentless_trees:") print(etc.summary())

EventTreeCollection(trees=3[regular=1, parentless=2], events=7[trees=7, detached=0])'

etc.show()

Set of auto-generated events for ds lib testing

├── Plain event 1

└── Plain event 2

└── Fake event

└── StubEvent <--- the event that was added above

[3.6] Working with ParentEventTreeCollection.

ParentEventTreeCollection is a tree collection like EventTreeCollection,

but it has only events that have references.

data_source: IDataSource # You should init DataSource object. E.g. from LwDP module. data_source = DummyDataSource() # Note! We use fake DS here.

ETCDriver here is a stub, actually the lib doesn't have such a class.

You can take it in LwDP module or create yourself class if you have some special events structure.

from th2_data_services.data_source.lwdp.event_tree import HttpETCDriver as ETCDriver

driver = ETCDriver(data_source=data_source) petc = ParentEventTreeCollection(driver) petc.build(events)

petc.show() petc.summary()

######################################

[4] Field Resolvers

######################################

Please read `Field Resolvers` block in readme first.

[4.1] Usage example from client code

from th2_data_services.data_source import ( lwdp, ) # lwdp data_source initialize th2_data_services.config during import. from th2_data_services.config import options as o_ from th2_data_services.data_source.lwdp.stub_builder import http_message_stub_builder

fake_data = [ http_message_stub_builder.build({"messageId": "a", "messageType": "Root"}), http_message_stub_builder.build({"messageId": "b", "messageType": "New"}), http_message_stub_builder.build({"messageId": "c", "messageType": "Amend"}), http_message_stub_builder.build({"messageId": "d", "messageType": "Cancel"}), ] fake_data_obj = Data(fake_data)

for m in fake_data_obj: o_.mfr.expand_message(m) # mfr - stands for MessageFieldResolver

or

for m in fake_data_obj.map(o_.mfr.expand_message): pass

[4.2] Libraries usage.

Don't import exact resolvers implementation in your code, please.

Allow your client to do it instead.

Just import `options` from `th2_data_services.config` and use it.

from th2_data_services.config import options as o_

for m in fake_data_obj: o_.mfr.expand_message(m)

or

for m in fake_data_obj.map(o_.mfr.expand_message): pass

More tech details:

In this case, there is no line `from th2_data_services.data_source import lwdp`

because we should not choose for the user which a data source to use.

We do not know what he will choose, therefore, we must simply access

the interface, which will be initialized by the user.

######################################

[5] Using utility functions.

###################################### from th2_data_services.utils.event_utils.frequencies import get_category_frequencies2 from th2_data_services.utils.event_utils.totals import get_category_totals2 from th2_data_services.utils.category import Category from th2_data_services.utils.event_utils.event_utils import is_sorted

[5.1] Get the quantities of events for different categories.

metrics = [ Category("date", lambda m: Th2TimestampConverter.to_datetime(m["startTimestamp"]).date()), Category("status", lambda m: m["successful"]), ] category_totals = get_category_totals2(events, metrics) print(category_totals) """ +--------+------------+----------+---------+ | | date | status | count | +========+============+==========+=========+ | | 2023-01-05 | True | 3 | +--------+------------+----------+---------+ | | 2023-01-05 | False | 1 | +--------+------------+----------+---------+ | count | | | 2 | +--------+------------+----------+---------+ | totals | | 1/1 | 4 | +--------+------------+----------+---------+ """

[5.2] Get the number of events with status successful.

category = Category("status", lambda m: m["successful"]) category_frequencies = get_category_frequencies2(events, category) print(category_frequencies) """ +--------+---------------------+---------------------+---------+--------+ | | timestamp_start | timestamp_end | False | True | +========+=====================+=====================+=========+========+ | | 2023-01-05T13:57:05 | 2023-01-05T13:57:06 | 0 | 3 | +--------+---------------------+---------------------+---------+--------+ | | 2023-01-05T14:02:05 | 2023-01-05T14:02:06 | 1 | 0 | +--------+---------------------+---------------------+---------+--------+ | count | | | | 2 | +--------+---------------------+---------------------+---------+--------+ | totals | | | 1 | 3 | +--------+---------------------+---------------------+---------+--------+ """

[5.3] Check if events are sorted.

result = is_sorted(events) print(result)

<!-- end get_started_example.py -->

## 2.3. Short theory

The library provides tools for handling stream data. What's a stream? It's a sequence of elements from a source that
supports aggregate operations.

### Terms

- **Data object**: An instance of `Data` class which is wrapper under stream.
- **Sequence of elements**:
  A _Data object_ provides an interface to a sequenced set of values of a specific element type. Stream inside the _Data
  object_ **dont actually store** elements; they are computed on demand.
- **data source** (exactly in small letters):
  Any source of data. E.g. [Lightweight Data Provider](https://github.com/th2-net/th2-lw-data-provider), collections,
  arrays, or I/O resources.
- **DataSource**:
  A class that is an intermediate link between the SourceAPI and Commands.
- **SourceAPI**:
  Each source has its own API to retrieve data. SourceAPI is a class that provide API for some data source.
- **Commands**:
  Classes that provide user-friendly interfaces for getting some data from DataSource. Commands use _SourceAPI_ to
  achieve it.
- **Adapters**:
  It's similar to function for `Data.map` method. Adoptable commands used it to update the data stream.
- **Aggregate operations**:
  Common operations such as filter, map, limit and so on.
- **Workflow**: An ordered set of _Aggregate operations_.

### Concept

The library describes the high-level interfaces `ISourceAPI`, `IDataSource`, `ICommand`, `IAdapter`.

Any data source must be described by the `IDataSource` abstract class. These can be _FileDataSource_,
_CSVDataSource_, _DBDataSource_ and other.

Usually, data sources have some kind of API. Databases - provide SQL language, when working with a file, you can read
line by line, etc. This API is described by the `ISourceAPI` class. Because different versions of the same data source
may have different API, it is better to create a class for each version.

Generally, data source APIs are hidden behind convenient interfaces. The role of these interfaces is played
by `ICommand` classes.

`IAdapter` classes transform data stream like functions for `Data.map` method. Essentially it's the same thing but more
flexible.

For example, LwDP DataSource(https://github.com/th2-net/th2-ds-source-lwdp) uses these abstract classes to build its implementation.You can easily create your own unique commands for _LwDP DataSource_, as well as entire
_DataSource_ classes. [Here is a documentation](documentation/datasource.md) on how to implement these interfaces.

![Data stream pipeline](documentation/img/concept.png)

### Stream operations

Furthermore, stream operations have two fundamental characteristics that make them very different from collection
operations: _Pipelining_ and _Internal iteration_.

#### Pipelining

Many stream operations return a stream themselves. This allows operations to be chained to form a larger pipeline.

![Data stream pipeline](documentation/img/data_stream_pipeline.png)

#### Internal iteration

In contrast to collections, which are iterated explicitly (external iteration), stream operations do the iteration
behind the scenes for you. Note, it doesn't mean you cannot iterate the _Data object_.


### Data iteration

The Data object constructor method takes in as argument either an iterator over objects or a generator function.
The Data object iterator handles each item in this iterator or generator as they are, meaning it doesn't try to read the content of item or return them modified in any way, instead returns the item itself.
The only exception to this is when Data object is built using iterator or generator over other Data objects. Note that this iterator or generator must only be yielding Data objects and nothing else. If we build from a mix of Data objects and some other types, Data objects' content won't be read and instead it will be returned as Data object itself.

Small example to demonstrate:

```python
from th2_data_services.data import Data

d1 = Data([1,2,3])
d2 = Data([4,5,6])

only_data_objects = Data([d1,d2]) # Will iterate as 1,2,3,4,5,6
data_and_list = Data([d1,[4,5,6]]) # Will iterate as d1, [4,5,6]
data_and_numbers = Data([d1,4,5,6]) # Will iterate as d1,4,5,6
lists_only = Data([1,2,3],[4,5,6]) # Will iterate as [1,2,3],[4,5,6]

# If we want to iterate over content of list of lists, we should first create Data objects from them,
# then use them to construct new Data object as in case of d1 and d2, creating 'only_data_objects' in this example.

Data caching

The Data object provides the ability to use the cache. The cache works for each Data object, that is, you choose which Data object you want to save. The Data object cache is saved after the first iteration, but the iteration source may be different.

If you don't use the cache, your source will be the data source you have in the Data Object. But if you use the cache, your source can be the data source, the parent cache, or own cache:

The data source: If the Data Object doesn't have a parent cache and its cache.
The parent cache: If the Data Object has a parent cache. It doesn't matter what position the parent cache has in inheritance. Data Object understands whose cache it is and executes the part of the workflow that was not executed.
The own cache: If it is not the first iteration of this Data object.

Note that the cache state of the Data object is not inherited.

Forced caching

You can tell DS to cache data to specific cache file, which won't be deleted after script end. You can see example in 1.12 section of get_started_example.

EventTree and collections

EventTree

EventTree is a tree-based data structure of events. It allows you get children and parents of event, display tree, get full path to event etc.

Details:

EventTree contains all events in memory.
Tree has some important terms:
1. Ancestor is any relative of the event up the tree (grandparent, parent etc.).
2. Parent is only the first relative of the event up the tree.
3. Child is the first relative of the event down the tree.

Take a look at the following HTML tree to understand them.

 <body> <!-- ancestor (grandparent), but not parent -->
     <div> <!-- parent & ancestor -->
         <p>Hello, world!</p> <!-- child -->
         <p>Goodbye!</p> <!-- sibling -->
     </div>
 </body>

Collections

EventTreeCollection is a collection of EventTrees. The collection builds a few EventTree by passed Data object. Although you can change the tree directly, it's better to do it through collections because they are aware of detached_events and can solve some events dependencies. The collection has similar features like a single EventTree but applying them for all EventTrees.

ParentEventTreeCollection is a collection similar to EventTreeCollection but containing only parent events that are referenced in the data stream. The collection has features similar to EventTreeCollection.

Details:

To use ET collections you need to initialize them by ETCDriver. Data sources usually provide them. You can create it by yourself depending on your data structure.
The collection has a feature to recover events. All events that are not in the received data stream, but which are referenced will be loaded from the data source.
You can take detached_events to see which events are missing.
If you want, you can build parentless trees where the missing events are stubbed instead. Just use get_parentless_trees().

Requirements:

Events provided to ETC have to have event_name, event_id, parent_event_id fields. They can have another names (it resolves in the driver).

Hints

Remove all unnecessary fields from events before passing to a collection to reduce memory usage.
Use show() method to print the tree in tree-like view.
Note that the get_x methods will raise an exception if you pass an unknown event id, unlike the find_x methods ( they return None).
If you want to know that specified event exists, use the python in keyword (e.g. 'event-id' in events_tree).
Use the python len keyword to get events number in the tree.

Field Resolvers

Interface can be found in th2_data_services/interfaces/utils/resolver.py.
All data-sources should implement them.

The idea of using resolvers: It solves the problem of having a few DataSources with similar data, but with different ways to get it.

These classes provide you getter methods. Using these classes allows you to freely switch between different data formats and don't change your code.

Resolvers solve the problem of data-format migration.

fields place can be changed
fields names can be changed

Resolvers can work only with one event/message. It means, if your message has sub-messages (like th2-messages in lwdp) it won't work, because resolver will not know with which sub-message should it work.

Workaround

Expand all your messages -> new_d = your_data.map(MessageFieldResolver.expand_message)
Use ExpandedMessageFieldResolver instead of usual MessageFieldResolver when you take fields for expanded messages.

Implementation advice:

raise NotImplementedError -- if your Implementation doesn't support this getter.

Performance impact:

It a bit slower than using naked field access dict['key'].

2.4. Links

3. Best practices

Depending on how you work with Data object, it can be slow of fast. As with a relational database, you can write a query that will return data slowly or quickly, the same when working with a Data object.

Follow the rules to make your work with Data object fast:

Use Data.use_cache() if you iterate data more than one time.
Try to don't iterate one Data object inside the other one. If you should to do it, use short Data object first and long Data object inside the loop. It'll allow you open the cache file or create a request to Data source less number of times.

4. Official DataSource implementations

Lightweight Data Provider Data Source

5. API

If you are looking for classes description see the API Documentation.

6. Examples

get_started_example.py

Project details

These details have not been verified by PyPI

Project links

Homepage

Release history Release notifications | RSS feed

This version

2.0.1

Oct 21, 2025

2.0.1.dev18681587745 pre-release

Oct 21, 2025

2.0.1.dev16755720794 pre-release

Aug 5, 2025

2.0.1.dev15531542322 pre-release

Jun 9, 2025

2.0.1.dev13762665223 pre-release

Mar 10, 2025

2.0.1.dev13710274025 pre-release

Mar 6, 2025

2.0.0

Feb 7, 2025

2.0.0.dev18679003822 pre-release

Oct 21, 2025

2.0.0.dev18678192728 pre-release

Oct 21, 2025

2.0.0.dev13200925041 pre-release

Feb 7, 2025

2.0.0.dev13197446531 pre-release

Feb 7, 2025

2.0.0.dev13195791914 pre-release

Feb 7, 2025

2.0.0.dev11777337875 pre-release

Nov 11, 2024

2.0.0.dev11776671491 pre-release

Nov 11, 2024

2.0.0.dev11439924676 pre-release

Oct 21, 2024

2.0.0.dev11438864415 pre-release

Oct 21, 2024

2.0.0.dev10897554626 pre-release

Sep 17, 2024

2.0.0.dev10883735128 pre-release

Sep 16, 2024

2.0.0.dev10880576536 pre-release

Sep 16, 2024

2.0.0.dev10677634171 pre-release

Sep 3, 2024

2.0.0.dev10613433257 pre-release

Aug 29, 2024

2.0.0.dev10613176709 pre-release

Aug 29, 2024

2.0.0.dev10574929178 pre-release

Aug 27, 2024

2.0.0.dev10574442641 pre-release

Aug 27, 2024

2.0.0.dev10504036712 pre-release

Aug 22, 2024

2.0.0.dev10503933120 pre-release

Aug 22, 2024

2.0.0.dev10383106430 pre-release

Aug 14, 2024

2.0.0.dev10383094071 pre-release

Aug 14, 2024

2.0.0.dev10371698364 pre-release

Aug 13, 2024

2.0.0.dev10366768879 pre-release

Aug 13, 2024

2.0.0.dev10319724211 pre-release

Aug 9, 2024

2.0.0.dev10317709227 pre-release

Aug 9, 2024

2.0.0.dev10300284351 pre-release

Aug 8, 2024

2.0.0.dev10246543659 pre-release

Aug 5, 2024

2.0.0.dev10194049049 pre-release

Aug 1, 2024

2.0.0.dev9969341505 pre-release

Jul 17, 2024

2.0.0.dev9955523303 pre-release

Jul 16, 2024

2.0.0.dev9952955371 pre-release

Jul 16, 2024

2.0.0.dev9952446258 pre-release

Jul 16, 2024

2.0.0.dev9944716954 pre-release

Jul 15, 2024

2.0.0.dev9944456724 pre-release

Jul 15, 2024

2.0.0.dev9944405812 pre-release

Jul 15, 2024

2.0.0.dev9944382673 pre-release

Jul 15, 2024

2.0.0.dev9938612628 pre-release

Jul 15, 2024

2.0.0.dev9938520500 pre-release

Jul 15, 2024

2.0.0.dev9938393848 pre-release

Jul 15, 2024

2.0.0.dev9938313543 pre-release

Jul 15, 2024

2.0.0.dev9938174897 pre-release

Jul 15, 2024

2.0.0.dev9938089624 pre-release

Jul 15, 2024

2.0.0.dev9938009864 pre-release

Jul 15, 2024

2.0.0.dev9937989958 pre-release

Jul 15, 2024

2.0.0.dev9937963546 pre-release

Jul 15, 2024

2.0.0.dev9937936726 pre-release

Jul 15, 2024

2.0.0.dev9937884794 pre-release

Jul 15, 2024

2.0.0.dev9937840497 pre-release

Jul 15, 2024

2.0.0.dev9907074556 pre-release

Jul 12, 2024

2.0.0.dev9836552945 pre-release

Jul 8, 2024

2.0.0.dev9646618767 pre-release

Jun 24, 2024

2.0.0.dev9583077230 pre-release

Jun 19, 2024

2.0.0.dev9544284584 pre-release

Jun 17, 2024

2.0.0.dev9543472600 pre-release

Jun 17, 2024

2.0.0.dev9159288528 pre-release

May 20, 2024

2.0.0.dev9158118525 pre-release

May 20, 2024

2.0.0.dev9113174303 pre-release

May 16, 2024

2.0.0.dev9018014082 pre-release

May 9, 2024

2.0.0.dev9014376771 pre-release

May 9, 2024

2.0.0.dev8981619855 pre-release

May 7, 2024

2.0.0.dev8969866469 pre-release

May 6, 2024

2.0.0.dev8964414125 pre-release

May 6, 2024

2.0.0.dev8935749405 pre-release

May 3, 2024

2.0.0.dev8934901680 pre-release

May 3, 2024

2.0.0.dev8934542107 pre-release

May 3, 2024

2.0.0.dev8831728420 pre-release

Apr 25, 2024

2.0.0.dev8831123099 pre-release

Apr 25, 2024

2.0.0.dev8779326749 pre-release

Apr 22, 2024

2.0.0.dev8703091686 pre-release

Apr 16, 2024

2.0.0.dev8702438320 pre-release

Apr 16, 2024

2.0.0.dev8702324290 pre-release

Apr 16, 2024

2.0.0.dev8662586819 pre-release

Apr 12, 2024

2.0.0.dev8344817329 pre-release

Mar 19, 2024

2.0.0.dev8230629709 pre-release

Mar 11, 2024

2.0.0.dev8154571688 pre-release

Mar 5, 2024

2.0.0.dev8154123929 pre-release

Mar 5, 2024

2.0.0.dev8137105964 pre-release

Mar 4, 2024

2.0.0.dev8004433390 pre-release

Feb 22, 2024

2.0.0.dev8002191955 pre-release

Feb 22, 2024

2.0.0.dev8000974447 pre-release

Feb 22, 2024

2.0.0.dev7974041395 pre-release

Feb 20, 2024

2.0.0.dev7969559609 pre-release

Feb 20, 2024

2.0.0.dev7932152089 pre-release

Feb 16, 2024

2.0.0.dev7932144938 pre-release

Feb 16, 2024

2.0.0.dev7568997298 pre-release

Jan 18, 2024

2.0.0.dev7501880915 pre-release

Jan 12, 2024

2.0.0.dev6667307474 pre-release

Oct 27, 2023

2.0.0.dev6584821430 pre-release

Oct 20, 2023

2.0.0.dev6545125931 pre-release

Oct 17, 2023

2.0.0.dev6510103087 pre-release

Oct 13, 2023

2.0.0.dev6481338266 pre-release

Oct 11, 2023

2.0.0.dev6481029629 pre-release

Oct 11, 2023

2.0.0.dev6480645833 pre-release

Oct 11, 2023

2.0.0.dev6480529589 pre-release

Oct 11, 2023

2.0.0.dev6479909290 pre-release

Oct 11, 2023

2.0.0.dev6478938612 pre-release

Oct 11, 2023

2.0.0.dev6260445890 pre-release

Sep 21, 2023

2.0.0.dev6258036842 pre-release

Sep 21, 2023

2.0.0.dev6046777923 pre-release

Sep 1, 2023

2.0.0.dev6046654552 pre-release

Sep 1, 2023

2.0.0.dev6046421368 pre-release

Sep 1, 2023

2.0.0.dev6045985648 pre-release

Sep 1, 2023

2.0.0.dev6040866218 pre-release

Aug 31, 2023

2.0.0.dev6022917985 pre-release

Aug 30, 2023

2.0.0.dev6009390485 pre-release

Aug 29, 2023

2.0.0.dev6001434023 pre-release

Aug 28, 2023

2.0.0.dev5997303806 pre-release

Aug 28, 2023

2.0.0.dev5976117099 pre-release

Aug 25, 2023

2.0.0.dev5974619814 pre-release

Aug 25, 2023

2.0.0.dev5974388707 pre-release

Aug 25, 2023

2.0.0.dev5972496766 pre-release

Aug 25, 2023

2.0.0.dev5962947913 pre-release

Aug 24, 2023

2.0.0.dev5962907120 pre-release

Aug 24, 2023

2.0.0.dev5961771090 pre-release

Aug 24, 2023

2.0.0.dev5940947295 pre-release

Aug 22, 2023

2.0.0.dev5940672571 pre-release

Aug 22, 2023

2.0.0.dev5939885619 pre-release

Aug 22, 2023

2.0.0.dev5939663288 pre-release

Aug 22, 2023

2.0.0.dev5939574713 pre-release

Aug 22, 2023

2.0.0.dev5929888762 pre-release

Aug 21, 2023

2.0.0.dev5900664720 pre-release

Aug 18, 2023

2.0.0.dev5899031402 pre-release

Aug 18, 2023

2.0.0.dev5894854654 pre-release

Aug 17, 2023

2.0.0.dev5894124871 pre-release

Aug 17, 2023

2.0.0.dev5807043852 pre-release

Aug 9, 2023

2.0.0.dev5782405498 pre-release

Aug 7, 2023

2.0.0.dev5762536547 pre-release

Aug 4, 2023

2.0.0.dev5738245039 pre-release

Aug 2, 2023

2.0.0.dev5738217622 pre-release

Aug 2, 2023

2.0.0.dev5585651073 pre-release

Jul 18, 2023

2.0.0.dev5504842108 pre-release

Jul 10, 2023

2.0.0.dev5410321437 pre-release

Jun 29, 2023

2.0.0.dev5408870379 pre-release

Jun 29, 2023

2.0.0.dev5331757596 pre-release

Jun 21, 2023

2.0.0.dev5320534839 pre-release

Jun 20, 2023

2.0.0.dev5320308217 pre-release

Jun 20, 2023

2.0.0.dev5319788736 pre-release

Jun 20, 2023

2.0.0.dev5310669895 pre-release

Jun 19, 2023

2.0.0.dev5308660964 pre-release

Jun 19, 2023

2.0.0.dev5291196287 pre-release

Jun 16, 2023

2.0.0.dev5291165177 pre-release

Jun 16, 2023

2.0.0.dev5291095936 pre-release

Jun 16, 2023

2.0.0.dev5290914761 pre-release

Jun 16, 2023

2.0.0.dev5290873151 pre-release

Jun 16, 2023

2.0.0.dev5280132551 pre-release

Jun 15, 2023

2.0.0.dev5279433375 pre-release

Jun 15, 2023

2.0.0.dev5219029506 pre-release

Jun 9, 2023

2.0.0.dev5218798347 pre-release

Jun 9, 2023

2.0.0.dev5133539304 pre-release

May 31, 2023

2.0.0.dev5131986477 pre-release

May 31, 2023

2.0.0.dev5129283461 pre-release

May 31, 2023

2.0.0.dev5122037338 pre-release

May 30, 2023

2.0.0.dev5088926286 pre-release

May 26, 2023

2.0.0.dev5077390732 pre-release

May 25, 2023

2.0.0.dev5066341549 pre-release

May 24, 2023

2.0.0.dev4991731144 pre-release

May 16, 2023

2.0.0.dev4991615086 pre-release

May 16, 2023

2.0.0.dev4990685388 pre-release

May 16, 2023

2.0.0.dev4926901978 pre-release

May 9, 2023

2.0.0.dev4926049061 pre-release

May 9, 2023

2.0.0.dev4925844112 pre-release

May 9, 2023

2.0.0.dev4892029505 pre-release

May 5, 2023

2.0.0.dev4783695011 pre-release

Apr 24, 2023

2.0.0.dev4763134463 pre-release

Apr 21, 2023

2.0.0.dev4658417405 pre-release

Apr 10, 2023

2.0.0.dev4630072464 pre-release

Apr 6, 2023

2.0.0.dev4628129290 pre-release

Apr 6, 2023

2.0.0.dev4597437064 pre-release

Apr 3, 2023

2.0.0.dev4595139261 pre-release

Apr 3, 2023

2.0.0.dev4572402044 pre-release

Mar 31, 2023

2.0.0.dev4571884545 pre-release

Mar 31, 2023

2.0.0.dev4566133671 pre-release

Mar 30, 2023

2.0.0.dev4565691154 pre-release

Mar 30, 2023

2.0.0.dev4565438115 pre-release

Mar 30, 2023

2.0.0.dev4562944887 pre-release

Mar 30, 2023

2.0.0.dev4561148877 pre-release

Mar 30, 2023

2.0.0.dev4553903192 pre-release

Mar 29, 2023

2.0.0.dev4435710615 pre-release

Mar 16, 2023

2.0.0.dev4416630873 pre-release

Mar 14, 2023

2.0.0.dev4261934928 pre-release

Feb 24, 2023

2.0.0.dev4181698311 pre-release

Feb 15, 2023

2.0.0.dev4181235074 pre-release

Feb 15, 2023

2.0.0.dev4164036231 pre-release

Feb 13, 2023

2.0.0.dev4163493874 pre-release

Feb 13, 2023

2.0.0.dev4132891098 pre-release

Feb 9, 2023

2.0.0.dev4131471207 pre-release

Feb 9, 2023

2.0.0.dev4113028152 pre-release

Feb 7, 2023

2.0.0.dev4102392289 pre-release

Feb 6, 2023

2.0.0.dev4101836831 pre-release

Feb 6, 2023

2.0.0.dev4013426129 pre-release

Jan 26, 2023

2.0.0.dev4008742339 pre-release

Jan 25, 2023

2.0.0.dev4008702363 pre-release

Jan 25, 2023

2.0.0.dev3993611444 pre-release

Jan 24, 2023

2.0.0.dev3985757424 pre-release

Jan 23, 2023

2.0.0.dev3968056678 pre-release

Jan 20, 2023

2.0.0.dev3966487910 pre-release

Jan 20, 2023

2.0.0.dev3959431158 pre-release

Jan 19, 2023

2.0.0.dev3959361645 pre-release

Jan 19, 2023

2.0.0.dev3959340773 pre-release

Jan 19, 2023

2.0.0.dev3959315865 pre-release

Jan 19, 2023

2.0.0.dev3956997254 pre-release

Jan 19, 2023

2.0.0.dev3956026987 pre-release

Jan 19, 2023

2.0.0.dev3949340687 pre-release

Jan 18, 2023

2.0.0.dev3927942066 pre-release

Jan 16, 2023

2.0.0.dev3910219125 pre-release

Jan 13, 2023

2.0.0.dev3873164105 pre-release

Jan 9, 2023

2.0.0.dev3838359072 pre-release

Jan 4, 2023

2.0.0.dev3835644398 pre-release

Jan 4, 2023

2.0.0.dev3828509656 pre-release

Jan 3, 2023

2.0.0.dev3805638310 pre-release

Dec 30, 2022

2.0.0.dev3805567948 pre-release

Dec 30, 2022

2.0.0.dev3657329839 pre-release

Dec 9, 2022

2.0.0.dev3628444941 pre-release

Dec 6, 2022

2.0.0.dev3602150655 pre-release

Dec 2, 2022

2.0.0.dev3592968116 pre-release

Dec 1, 2022

2.0.0.dev3548798313 pre-release

Nov 25, 2022

2.0.0.dev3443421730 pre-release

Nov 11, 2022

2.0.0.dev3367092857 pre-release

Nov 1, 2022

2.0.0.dev3329133396 pre-release

Oct 26, 2022

2.0.0.dev3329056446 pre-release

Oct 26, 2022

2.0.0.dev3321604776 pre-release

Oct 25, 2022

2.0.0.dev3179863104 pre-release

Oct 4, 2022

2.0.0.dev3105115316 pre-release

Sep 22, 2022

2.0.0.dev3058869024 pre-release

Sep 15, 2022

2.0.0.dev3051111742 pre-release

Sep 14, 2022

2.0.0.dev3043143456 pre-release

Sep 13, 2022

2.0.0.dev2992964592 pre-release

Sep 5, 2022

1.4.999.dev4594857713 pre-release

Apr 3, 2023

1.4.999.dev4571885854 pre-release

Mar 31, 2023

1.4.999.dev4564037370 pre-release

Mar 30, 2023

1.4.999.dev4563000114 pre-release

Mar 30, 2023

1.4.999.dev4553958886 pre-release

Mar 29, 2023

1.4.999.dev4552903419 pre-release

Mar 29, 2023

1.4.999.dev4504346847 pre-release

Mar 23, 2023

1.4.999.dev4500274063 pre-release

Mar 23, 2023

1.4.999.dev4493685566 pre-release

Mar 22, 2023

1.4.999.dev4477354718 pre-release

Mar 21, 2023

1.4.999.dev4476844722 pre-release

Mar 21, 2023

1.4.999.dev4476743646 pre-release

Mar 21, 2023

1.4.999.dev4451352204 pre-release

Mar 17, 2023

1.4.999.dev4450696788 pre-release

Mar 17, 2023

1.4.999.dev4448660446 pre-release

Mar 17, 2023

1.4.999.dev4448065894 pre-release

Mar 17, 2023

1.4.999.dev4445599560 pre-release

Mar 17, 2023

1.4.0.dev4658476615 pre-release

Apr 10, 2023

1.4.0.dev4439259925 pre-release

Mar 16, 2023

1.4.0.dev4428234264 pre-release

Mar 15, 2023

1.4.0.dev4427949684 pre-release

Mar 15, 2023

1.4.0.dev4426464343 pre-release

Mar 15, 2023

1.4.0.dev4425265123 pre-release

Mar 15, 2023

1.4.0.dev4425120279 pre-release

Mar 15, 2023

1.4.0.dev4424477620 pre-release

Mar 15, 2023

1.4.0.dev4424203830 pre-release

Mar 15, 2023

1.4.0.dev4418973359 pre-release

Mar 14, 2023

1.4.0.dev4418620166 pre-release

Mar 14, 2023

1.4.0.dev4418321947 pre-release

Mar 14, 2023

1.4.0.dev4418281033 pre-release

Mar 14, 2023

1.4.0.dev4417613879 pre-release

Mar 14, 2023

1.4.0.dev4417113604 pre-release

Mar 14, 2023

1.4.0.dev4413421005 pre-release

Mar 14, 2023

1.4.0.dev4413154298 pre-release

Mar 14, 2023

1.4.0.dev4406069494 pre-release

Mar 13, 2023

1.4.0.dev4373094247 pre-release

Mar 9, 2023

1.4.0.dev4260785385 pre-release

Feb 24, 2023

1.4.0.dev4239763001 pre-release

Feb 22, 2023

1.4.0.dev4222983108 pre-release

Feb 20, 2023

1.4.0.dev4222534940 pre-release

Feb 20, 2023

1.4.0.dev3800238509 pre-release

Dec 29, 2022

1.4.0.dev3800082937 pre-release

Dec 29, 2022

1.4.0.dev3799877300 pre-release

Dec 29, 2022

1.4.0.dev3794242326 pre-release

Dec 28, 2022

1.3.1

Feb 27, 2023

1.3.1.dev4259710398 pre-release

Feb 24, 2023

1.3.0

Nov 24, 2022

1.3.0.dev4259605009 pre-release

Feb 24, 2023

1.3.0.dev3532453924 pre-release

Nov 23, 2022

1.3.0.dev3532340560 pre-release

Nov 23, 2022

1.3.0.dev3525193300 pre-release

Nov 22, 2022

1.3.0.dev3521462712 pre-release

Nov 22, 2022

1.3.0.dev3515507180 pre-release

Nov 21, 2022

1.3.0.dev3479101591 pre-release

Nov 16, 2022

1.3.0.dev3459134175 pre-release

Nov 14, 2022

1.3.0.dev3434330860 pre-release

Nov 10, 2022

1.3.0.dev3420200954 pre-release

Nov 8, 2022

1.3.0.dev3408782256 pre-release

Nov 7, 2022

1.3.0.dev3408232161 pre-release

Nov 7, 2022

1.3.0.dev3394358539 pre-release

Nov 4, 2022

1.3.0.dev3391796603 pre-release

Nov 4, 2022

1.3.0.dev3391786256 pre-release

Nov 4, 2022

1.3.0.dev3391777853 pre-release

Nov 4, 2022

1.3.0.dev3391767984 pre-release

Nov 4, 2022

1.3.0.dev3386235197 pre-release

Nov 3, 2022

1.3.0.dev3386173138 pre-release

Nov 3, 2022

1.3.0.dev3386168428 pre-release

Nov 3, 2022

1.3.0.dev3385078780 pre-release

Nov 3, 2022

1.3.0.dev3384624390 pre-release

Nov 3, 2022

1.3.0.dev3384584815 pre-release

Nov 3, 2022

1.3.0.dev3384554937 pre-release

Nov 3, 2022

1.3.0.dev3384210857 pre-release

Nov 3, 2022

1.3.0.dev3383484983 pre-release

Nov 3, 2022

1.3.0.dev3383265188 pre-release

Nov 3, 2022

1.3.0.dev3378483491 pre-release

Nov 2, 2022

1.3.0.dev3376777765 pre-release

Nov 2, 2022

1.3.0.dev3376703555 pre-release

Nov 2, 2022

1.3.0.dev3376617801 pre-release

Nov 2, 2022

1.3.0.dev3376008995 pre-release

Nov 2, 2022

1.3.0.dev3358937935 pre-release

Oct 31, 2022

1.2.3

Sep 22, 2022

1.2.3.dev3377711767 pre-release

Nov 2, 2022

1.2.3.dev3368501703 pre-release

Nov 1, 2022

1.2.3.dev3343198208 pre-release

Oct 28, 2022

1.2.3.dev3343171998 pre-release

Oct 28, 2022

1.2.3.dev3343119942 pre-release

Oct 28, 2022

1.2.3.dev3338204833 pre-release

Oct 27, 2022

1.2.3.dev3337802708 pre-release

Oct 27, 2022

1.2.3.dev3335611044 pre-release

Oct 27, 2022

1.2.3.dev3263338624 pre-release

Oct 17, 2022

1.2.3.dev3244764647 pre-release

Oct 13, 2022

1.2.3.dev3243380186 pre-release

Oct 13, 2022

1.2.3.dev3219848340 pre-release

Oct 10, 2022

1.2.3.dev3219266301 pre-release

Oct 10, 2022

1.2.3.dev3219026441 pre-release

Oct 10, 2022

1.2.3.dev3218992457 pre-release

Oct 10, 2022

1.2.3.dev3218762777 pre-release

Oct 10, 2022

1.2.3.dev3218544632 pre-release

Oct 10, 2022

1.2.3.dev3218334883 pre-release

Oct 10, 2022

1.2.2

Sep 13, 2022

1.2.1

Sep 5, 2022

1.2.1.dev2994739980 pre-release

Sep 5, 2022

1.2.0

Sep 5, 2022

1.2.0.dev2994667855 pre-release

Sep 5, 2022

1.2.0.dev2992961111 pre-release

Sep 5, 2022

1.2.0.dev2991306464 pre-release

Sep 5, 2022

1.2.0.dev2978596379 pre-release

Sep 2, 2022

1.2.0.dev2971793076 pre-release

Sep 1, 2022

1.2.0.dev2970596632 pre-release

Sep 1, 2022

1.2.0.dev2970588812 pre-release

Sep 1, 2022

1.2.0.dev2965088749 pre-release

Aug 31, 2022

1.1.1

Aug 3, 2022

1.1.1.dev2965069444 pre-release

Aug 31, 2022

1.1.1.dev2956739616 pre-release

Aug 30, 2022

1.1.1.dev2956339695 pre-release

Aug 30, 2022

1.1.1.dev2955023317 pre-release

Aug 30, 2022

1.1.1.dev2926496314 pre-release

Aug 25, 2022

1.1.1.dev2925809687 pre-release

Aug 25, 2022

1.1.1.dev2920072309 pre-release

Aug 24, 2022

1.1.1.dev2919265247 pre-release

Aug 24, 2022

1.1.1.dev2919164267 pre-release

Aug 24, 2022

1.1.1.dev2919015010 pre-release

Aug 24, 2022

1.1.0

Jul 20, 2022

1.1.0.dev2917178569 pre-release

Aug 24, 2022

1.1.0.dev2781491528 pre-release

Aug 2, 2022

1.1.0.dev2781473188 pre-release

Aug 2, 2022

1.1.0.dev2696498275 pre-release

Jul 19, 2022

1.1.0.dev2688797334 pre-release

Jul 18, 2022

1.1.0.dev2677584273 pre-release

Jul 15, 2022

1.1.0.dev2677132959 pre-release

Jul 15, 2022

1.1.0.dev2675538854 pre-release

Jul 15, 2022

1.1.0.dev2669586999 pre-release

Jul 14, 2022

1.1.0.dev2664014301 pre-release

Jul 13, 2022

1.1.0.dev2662365142 pre-release

Jul 13, 2022

1.1.0.dev2622506563 pre-release

Jul 6, 2022

1.1.0.dev2615531849 pre-release

Jul 5, 2022

1.1.0.dev2569683750 pre-release

Jun 27, 2022

1.1.0.dev2548115174 pre-release

Jun 23, 2022

1.1.0.dev2540890885 pre-release

Jun 22, 2022

1.1.0.dev2527227074 pre-release

Jun 20, 2022

1.1.0.dev2525570916 pre-release

Jun 19, 2022

1.1.0.dev2501452182 pre-release

Jun 15, 2022

1.1.0.dev2474864003 pre-release

Jun 10, 2022

1.1.0.dev2460722084 pre-release

Jun 8, 2022

1.1.0.dev2430583579 pre-release

Jun 2, 2022

1.1.0.dev2427616036 pre-release

Jun 2, 2022

1.1.0.dev2414118245 pre-release

May 31, 2022

1.1.0.dev2338604719 pre-release

May 17, 2022

1.1.0.dev2227603299 pre-release

Apr 26, 2022

1.1.0.dev2227053319 pre-release

Apr 26, 2022

1.1.0.dev2201958422 pre-release

Apr 21, 2022

1.1.0.dev2150011773 pre-release

Apr 11, 2022

1.1.0.dev2096349774 pre-release

Apr 5, 2022

1.1.0.dev2096295519 pre-release

Apr 5, 2022

1.1.0.dev2076486747 pre-release

Apr 1, 2022

1.1.0.dev2039353286 pre-release

Mar 25, 2022

1.0.3

Jul 5, 2022

1.0.2

May 17, 2022

1.0.2.dev2529837166 pre-release

Jun 20, 2022

1.0.1

Apr 26, 2022

1.0.0

Mar 24, 2022

1.0.0.dev2034359271 pre-release

Mar 24, 2022

1.0.0.dev2034352673 pre-release

Mar 24, 2022

1.0.0.dev2029286610 pre-release

Mar 23, 2022

1.0.0.dev2028939225 pre-release

Mar 23, 2022

1.0.0.dev2028373963 pre-release

Mar 23, 2022

1.0.0.dev2027795417 pre-release

Mar 23, 2022

1.0.0.dev2022662411 pre-release

Mar 22, 2022

1.0.0.dev2015125745 pre-release

Mar 21, 2022

1.0.0.dev2003801303 pre-release

Mar 18, 2022

1.0.0.dev2002854499 pre-release

Mar 18, 2022

1.0.0.dev1998722913 pre-release

Mar 17, 2022

1.0.0.dev1993893421 pre-release

Mar 16, 2022

1.0.0.dev1993712554 pre-release

Mar 16, 2022

1.0.0.dev1992751306 pre-release

Mar 16, 2022

1.0.0.dev1979819640 pre-release

Mar 14, 2022

1.0.0.dev1957027858 pre-release

Mar 9, 2022

1.0.0.dev1933006959 pre-release

Mar 4, 2022

1.0.0.dev1928524650 pre-release

Mar 3, 2022

1.0.0.dev1928358287 pre-release

Mar 3, 2022

1.0.0.dev1928255866 pre-release

Mar 3, 2022

1.0.0.dev1927678986 pre-release

Mar 3, 2022

1.0.0.dev1921650014 pre-release

Mar 2, 2022

1.0.0.dev1893468977 pre-release

Feb 24, 2022

1.0.0.dev1892525253 pre-release

Feb 24, 2022

1.0.0.dev1881870610 pre-release

Feb 22, 2022

1.0.0.dev1880719350 pre-release

Feb 22, 2022

1.0.0.dev1859750290 pre-release

Feb 17, 2022

1.0.0.dev1851492135 pre-release

Feb 16, 2022

1.0.0.dev1824243952 pre-release

Feb 10, 2022

1.0.0.dev1823497278 pre-release

Feb 10, 2022

1.0.0.dev1820811445 pre-release

Feb 9, 2022

1.0.0.dev1820774355 pre-release

Feb 9, 2022

1.0.0.dev1817977600 pre-release

Feb 9, 2022

1.0.0.dev1817916792 pre-release

Feb 9, 2022

1.0.0.dev1790281589 pre-release

Feb 3, 2022

1.0.0.dev1771490316 pre-release

Jan 31, 2022

1.0.0.dev1729471456 pre-release

Jan 21, 2022

1.0.0.dev1729142478 pre-release

Jan 21, 2022

1.0.0.dev1728106849 pre-release

Jan 21, 2022

1.0.0.dev1727523646 pre-release

Jan 21, 2022

1.0.0.dev1708756836 pre-release

Jan 17, 2022

1.0.0.dev1708029248 pre-release

Jan 17, 2022

0.7.0.dev1683366140 pre-release

Jan 11, 2022

0.7.0.dev1606781199 pre-release

Dec 21, 2021

0.7.0.dev1606770257 pre-release

Dec 21, 2021

0.7.0.dev1592459201 pre-release

Dec 17, 2021

0.6.3

Sep 14, 2022

0.6.2

Jan 11, 2022

0.6.2.dev2338598288 pre-release

May 17, 2022

0.6.2.dev2269979824 pre-release

May 4, 2022

0.6.1

Dec 21, 2021

0.6.1.dev1606132437 pre-release

Dec 21, 2021

0.6.0

Dec 15, 2021

0.6.0.dev1583474671 pre-release

Dec 15, 2021

0.6.0.dev1578030301 pre-release

Dec 14, 2021

0.6.0.dev1577885230 pre-release

Dec 14, 2021

0.6.0.dev1577649111 pre-release

Dec 14, 2021

0.6.0.dev1577362109 pre-release

Dec 14, 2021

0.6.0.dev1577336601 pre-release

Dec 14, 2021

0.6.0.dev1555126026 pre-release

Dec 8, 2021

0.6.0.dev1534799948 pre-release

Dec 3, 2021

0.6.0.dev1516850056 pre-release

Nov 29, 2021

0.6.0.dev1503026063 pre-release

Nov 25, 2021

0.6.0.dev1494549746 pre-release

Nov 23, 2021

0.6.0.dev1493764362 pre-release

Nov 23, 2021

0.5.3

Nov 29, 2021

0.5.2

Nov 25, 2021

0.5.1

Nov 23, 2021

0.5.0

Nov 19, 2021

0.5.0.dev1489678315 pre-release

Nov 22, 2021

0.5.0.dev1489454014 pre-release

Nov 22, 2021

0.5.0.dev1477466031 pre-release

Nov 18, 2021

0.5.0.dev1476058667 pre-release

Nov 18, 2021

0.5.0.dev1466202652 pre-release

Nov 16, 2021

0.5.0.dev1459489038 pre-release

Nov 14, 2021

0.5.0.dev1448000781 pre-release

Nov 11, 2021

0.5.0.dev1440473153 pre-release

Nov 9, 2021

0.5.0.dev1439436543 pre-release

Nov 9, 2021

0.5.0.dev1439174327 pre-release

Nov 9, 2021

0.5.0.dev1431474827 pre-release

Nov 7, 2021

0.5.0.dev1431445992 pre-release

Nov 7, 2021

0.5.0.dev1431392992 pre-release

Nov 7, 2021

0.5.0.dev1417701930 pre-release

Nov 3, 2021

0.5.0.dev1417535791 pre-release

Nov 3, 2021

0.5.0.dev1399136930 pre-release

Oct 29, 2021

0.5.0.dev1390639294 pre-release

Oct 27, 2021

0.5.0.dev1389042206 pre-release

Oct 27, 2021

0.5.0.dev1368156217 pre-release

Oct 21, 2021

0.5.0.dev1355451889 pre-release

Oct 18, 2021

0.5.0.dev1342318281 pre-release

Oct 14, 2021

0.5.0.dev1320638915 pre-release

Oct 8, 2021

0.5.0.dev1320456899 pre-release

Oct 8, 2021

0.5.0.dev1307912176 pre-release

Oct 5, 2021

0.5.0.dev1294968162 pre-release

Oct 1, 2021

0.5.0.dev1294951835 pre-release

Oct 1, 2021

0.5.0.dev1294885101 pre-release

Oct 1, 2021

0.5.0.dev1289896360 pre-release

Sep 30, 2021

0.5.0.dev1282424252 pre-release

Sep 28, 2021

0.5.0.dev1278736610 pre-release

Sep 27, 2021

0.5.0.dev1277616425 pre-release

Sep 27, 2021

0.5.0.dev1257154140 pre-release

Sep 21, 2021

0.4.1

Sep 21, 2021

0.4.0.1253254627

Sep 20, 2021

0.4.0

Sep 21, 2021

0.4.0.dev1257063846 pre-release

Sep 21, 2021

0.4.0.dev1253432657 pre-release

Sep 20, 2021

0.4.0.dev1253408704 pre-release

Sep 20, 2021

0.4.0.dev1217802787 pre-release

Sep 9, 2021

0.3.1

Sep 9, 2021

0.3.1.dev1216476654 pre-release

Sep 9, 2021

0.3.0

Sep 8, 2021

0.3.0.dev1212634713 pre-release

Sep 8, 2021

0.3.0.dev1212381793 pre-release

Sep 8, 2021

0.2.6.dev1185238448 pre-release

Aug 31, 2021

0.2.6.dev1182110074 pre-release

Aug 30, 2021

0.2.6.dev1143459221 pre-release

Aug 18, 2021

0.2.6.dev1143146806 pre-release

Aug 18, 2021

0.2.6.dev1143105521 pre-release

Aug 18, 2021

0.2.5

Aug 18, 2021

0.2.5.dev1124292707 pre-release

Aug 12, 2021

0.2.5.dev1119307178 pre-release

Aug 11, 2021

0.2.5.dev1119300390 pre-release

Aug 11, 2021

0.2.4

Jul 29, 2021

0.2.4.dev1078551664 pre-release

Jul 29, 2021

0.2.4.dev1077898528 pre-release

Jul 29, 2021

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

th2_data_services-2.0.1.tar.gz (109.4 kB view details)

Uploaded Oct 21, 2025 Source

File details

Details for the file th2_data_services-2.0.1.tar.gz.

File metadata

Download URL: th2_data_services-2.0.1.tar.gz
Upload date: Oct 21, 2025
Size: 109.4 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.9.24

File hashes

Hashes for th2_data_services-2.0.1.tar.gz
Algorithm	Hash digest
SHA256	`106706e07579d8852975c0f85cd6e7c58d477a6340a165e9e37e70e0ac1e0507`
MD5	`ec46b506c3db3d7bbb98b0633c6f1d06`
BLAKE2b-256	`58ca91609ff8d9d3cb2afd7651252bdfc584248dc360e8d6958973c3a0175a77`

See more details on using hashes here.

th2-data-services 2.0.1

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Project description

Table of Contents

1. Introduction

2. Getting started

2.1. Installation

Core

Data sources (providers)

2.2. Example

[0] Lib configuration

[0.1] Interactive or Script mode

If you use the lib in interactive mode (jupyter, ipython) it's recommended to set the special

global parameter to True. It'll keep cache files if something went wrong.

Some example data

[1] Working with a Data object.

[1.1] Filter.

[1.2] Map.

[1.3] Data pipeline.

Instead of doing data transformations step by step you can do it in one line.

Content of these two Data objects should be equal.

[1.4] Sift. Skip the first few items or limit them.

[1.5] Changing cache status.

or just

[1.6] Walk through data.

After first iteration the events has a cache file.

Now they will be used in the cache in the next iteration.

[1.7] Get number of the elements in the Data object.

[1.8] Check that Data object isn't empty.

The data source should be not empty.

[1.9] Convert Data object to the list of elements(events or messages).

Be careful, this can take too much memory.

[1.10] The cache inheritance.

Creates a new Data object that will use cache from the events Data object.

New Data objects don't use their own cache by default but use the cache of the parent Data object.

Use use_cache method to activate caching.

After that, the Data object will create its own cache file.

[1.11] Data objects joining.

You have the following 3 Data objects.

You can join Data objects in following ways.

Please note, new Data object will have cache status == False.

You can join current Data object on place using +=.

It will keep cache status.

[1.12] Build and read Data object cache files.

[1.13] Check if Data is sorted.

That will return an object is_sorted that contains information

1. status -- sorted or not

2. first_unsorted -- the index of the first unsorted element

You can use this object as usual bool variable.

[1.14] Use Data.show() to look at the first N messages in the stream.

Will print

------------- Printed first 6 records -------------

[1] ------

1

[2] ------

2

[3] ------

3

[4] ------

'a'

[5] ------

{'id': 123}

[6] ------

'c'

[1.15] You can remove the cache file of the Data object, if required.

[1.16] Get the message by its ID from the Data object in one line.

[1.17] Update metadata for Data objects.

d1.metadata - {}

d1.metadata - {'a': 1, 'b': [10], 'c': {'a': 100}}

d1.metadata - {'a': 2, 'b': [10, 20], 'c': {'a': 200, 'b': 300}}

d1.update_metadata({"a": {}}) - This throws AttributeError: 'int' object has no attribute 'update'.

To set key whose value is of non-dict type to dict we can use change_type="change" argument.

d1.metadata - {'a': {}, 'b': [10, 20], 'c': {'a': 200, 'b': 300}}

change_type can be either 'update' (default) or 'change' - overwrite existing value or create a new one if it

doesn't exist.

That will return an object `is_sorted` that contains information

[1.14] Use `Data.show()` to look at the first N messages in the stream.

via `show()`. `show()` prints only Trees!

Use `etc.get_parentless_trees()` to convert detached events to trees.