Kafka-based distributed task processing SDK

These details have not been verified by PyPI

Project links

Project description

Ninja Kafka SDK

SDK for distributed task processing with Kafka messaging and automatic service isolation.

Send tasks to Ninja services and get results back with automatic message routing based on consumer groups. Each service only receives its own results!

🚀 Quick Start

1️⃣ Send a Task

import asyncio
from ninja_kafka_sdk import NinjaClient

async def send_task_example():
    # Create client with YOUR service's unique consumer group
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="my-service"  # Your service's unique identifier
    )

    # Send task to browser-ninja for processing
    correlation_id = await client.send_task(
        task="linkedin_verification",
        account_id=123,
        email="user@example.com",

        # Optional: Add task-specific parameters
        parameters={
            'max_retries': 3,
            'timeout': 60
        }
    )

    print(f"✅ Task sent!")
    print(f"📋 Correlation ID: {correlation_id}")
    # Note: correlation_id will be 'my-service:uuid-...'

    client.stop()
    return correlation_id

# Run it
asyncio.run(send_task_example())

2️⃣ Listen for Results

import asyncio
from ninja_kafka_sdk import NinjaClient

async def listen_for_results():
    # Use the SAME consumer group as when you sent the task
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="my-service"  # Same as sender!
    )

    print("👂 Listening for results...")

    # SDK automatically filters - you ONLY get results for YOUR service
    async for result in client.listen_results():
        print(f"\n📥 Received result:")
        print(f"   Task: {result.get('task')}")
        print(f"   Status: {result.get('status')}")
        print(f"   Account ID: {result.get('account_id')}")

        if result.get('status') == 'SUCCESS':
            data = result.get('data', {})
            print(f"   ✅ Success! Data: {data}")
        else:
            error = result.get('error', {})
            print(f"   ❌ Failed! Error: {error}")

# Run it
asyncio.run(listen_for_results())

📦 Installation

# Install latest version (recommended)
pip install --upgrade ninja-kafka-sdk

# Install from PyPI (gets latest if not installed)
pip install ninja-kafka-sdk

# Install specific version
pip install ninja-kafka-sdk==0.3.24

# Force reinstall to latest version
pip install --force-reinstall --upgrade ninja-kafka-sdk

📨 Complete Example: Send and Listen

Send a Task and Wait for Its Result

import asyncio
from ninja_kafka_sdk import NinjaClient

async def send_and_wait_example():
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="my-service"
    )

    # Step 1: Send task
    correlation_id = await client.send_task(
        task="linkedin_like",
        account_id=456,
        parameters={
            'post_url': 'https://linkedin.com/posts/example'
        }
    )
    print(f"📤 Task sent: {correlation_id}")

    # Step 2: Wait for this specific result
    async for result in client.listen_results(correlation_ids=[correlation_id]):
        if result.get('correlation_id') == correlation_id:
            print(f"📥 Got result: {result.get('status')}")
            break

    client.stop()

asyncio.run(send_and_wait_example())

Listen Continuously for All Results

import asyncio
from ninja_kafka_sdk import NinjaClient

async def continuous_listener():
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="my-service"
    )

    print("🎧 Listening for all results for 'my-service'...")

    # This will run forever, processing results as they arrive
    async for result in client.listen_results():
        correlation_id = result.get('correlation_id')
        status = result.get('status')

        # Only receives results for tasks sent by 'my-service'
        print(f"Result {correlation_id}: {status}")

        # Process based on status
        if status == 'SUCCESS':
            # Handle success
            pass
        else:
            # Handle failure
            pass

asyncio.run(continuous_listener())

⚙️ Configuration

🔑 Key Concept: Consumer Groups

IMPORTANT: The consumer_group is your service's unique identity!

Each service MUST have a UNIQUE consumer group name
The SDK uses this to automatically route messages
You only receive results for tasks YOUR service sent
Consumer group names cannot contain ':' (reserved character)

from ninja_kafka_sdk import NinjaClient

# ✅ Good - Unique consumer groups
client1 = NinjaClient(
    kafka_servers="localhost:9092",
    consumer_group="auto-login"  # Service 1
)

client2 = NinjaClient(
    kafka_servers="localhost:9092",
    consumer_group="like-service"  # Service 2
)

# ❌ Bad - Consumer group with colon
client = NinjaClient(
    kafka_servers="localhost:9092",
    consumer_group="my:service"  # Will raise ValueError!
)

Configuration from Config Object

from ninja_kafka_sdk import NinjaClient
from your_app.config import config  # Your application's config

client = NinjaClient(
    kafka_servers=config.KAFKA_SERVERS,
    consumer_group=config.KAFKA_CONSUMER_GROUP
)

Configuration with Config Object

from ninja_kafka_sdk import NinjaClient, NinjaKafkaConfig

# Create configuration object
config = NinjaKafkaConfig(
    kafka_servers="b-1.msk-cluster.amazonaws.com:9092,b-2.msk-cluster.amazonaws.com:9092",
    consumer_group="my-service",
    environment="stage",
    tasks_topic="ninja-tasks",
    results_topic="ninja-results"
)

# Use with client
client = NinjaClient(config=config)

🆕 Version 0.4.0: Ordered Multi-Topic Consumer Support

For consumers that need to subscribe to multiple topics in priority order (e.g., Browser Ninja draining ninja-tasks before ninja-tasks-low), pass task_topics when constructing the client:

client = NinjaClient(
    kafka_servers="broker:9092",
    consumer_group="browser-ninja",
    task_topics=["ninja-tasks", "ninja-tasks-low"],  # consumer drains in order
)

The consumer processes topics in list order — task_topics[0] is always drained first. When task_topics is not provided, the consumer subscribes to [tasks_topic] for backward compatibility.

The producer API (send_task()) is unchanged — it always publishes to the configured tasks_topic. For multi-topic producing, create separate client instances per topic.

🆕 Version 0.3.23+ Parameters Field Update

✅ IMPROVEMENT: The parameters field is now properly handled in send_task():

# After v0.3.23+, parameters go to the correct field
await client.send_task(
    task="linkedin_like",
    account_id=123,

    # These go to their proper fields (not nested in metadata!)
    parameters={'post_url': 'https://...'},  # → request.parameters
    api_endpoints={'callback': 'https://...'}  # → request.api_endpoints
)

🆕 Version 0.2.0 Breaking Changes

⚠️ BREAKING CHANGE: kafka_servers and consumer_group are now REQUIRED parameters.

Migration from v0.1.x

# OLD (v0.1.x) - Had auto-detection and localhost fallbacks
client = NinjaClient()  # ❌ This no longer works

# NEW (v0.2.0+) - Explicit configuration required  
client = NinjaClient(
    kafka_servers="your-kafka-servers:9092",  # ✅ Required
    consumer_group="your-service-name"        # ✅ Required
)

Why This Change?

Production Safety: Prevents localhost fallbacks in production environments
Explicit Configuration: No more guessing what environment you're connecting to
Debugging: Clear errors when configuration is missing
Environment Agnostic: Same code works everywhere with different config

💡 How to Send Tasks

Basic Task Execution

from ninja_kafka_sdk import NinjaClient

async def verify_linkedin_account():
    # Explicit configuration for production
    client = NinjaClient(
        kafka_servers="b-1.msk-cluster.amazonaws.com:9092,b-2.msk-cluster.amazonaws.com:9092",
        consumer_group="auto-login-service",
        environment="prod"
    )
    
    try:
        # Send task and wait for result (one method call)
        result = await client.execute_task(
            task="linkedin_verification",
            account_id=12345,
            email="user@example.com",
            timeout=300  # 5 minutes
        )
        
        if result.is_success:
            print("✅ Verification successful!")
            return result.cookies
        else:
            print(f"❌ Failed: {result.error_message}")
            return None
            
    finally:
        client.stop()

Advanced Usage Patterns

Fire and Forget

async def send_multiple_tasks():
    # Must provide explicit configuration
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="task-sender"
    )
    
    # Send task without waiting for result
    correlation_id = await client.send_task(
        task="linkedin_verification", 
        account_id=123
    )
    print(f"Task sent: {correlation_id}")
    client.stop()

Batch Processing

async def process_multiple_accounts():
    client = NinjaClient(
        kafka_servers="your-kafka-servers:9092",
        consumer_group="batch-processor"
    )
    accounts = [123, 456, 789]

    try:
        # Send all tasks
        task_ids = []
        for account_id in accounts:
            task_id = await client.send_task("linkedin_verification", account_id=account_id)
            task_ids.append(task_id)

        # Listen for all results
        completed = 0
        async for result in client.listen_results(correlation_ids=task_ids):
            completed += 1
            print(f"Account {result.account_id}: {result.status}")
            if completed >= len(accounts):
                break
                
    finally:
        client.stop()

Different Environment Examples

# Local development
async def local_verification():
    client = NinjaClient(
        kafka_servers="localhost:9092",
        consumer_group="local-test",
        environment="local"  # Optional: for logging only
    )
    result = await client.execute_task("linkedin_verification", account_id=123)
    client.stop()
    return result

# Production environment
async def production_verification():
    client = NinjaClient(
        kafka_servers="b-1.msk-cluster.amazonaws.com:9092,b-2.msk-cluster.amazonaws.com:9092",
        consumer_group="auto-login-prod",
        environment="production"
    )
    result = await client.execute_task("linkedin_verification", account_id=123)
    client.stop()
    return result

# Using config object  
async def config_based_verification():
    from your_app.config import config
    
    client = NinjaClient(
        kafka_servers=config.KAFKA_SERVERS,
        consumer_group=config.KAFKA_CONSUMER_GROUP
    )
    result = await client.execute_task("linkedin_verification", account_id=123)
    client.stop()
    return result

🏗️ Available Tasks

LinkedIn Verification

result = await client.execute_task(
    task="linkedin_verification",
    account_id=123,
    email="user@example.com",  # Optional but highly recommended
    timeout=300  # 5 minutes
)

Future Tasks

More task types will be added for different platforms:

twitter_verification
instagram_verification
facebook_verification

📝 Message Models

Task Request

@dataclass
class NinjaTaskRequest:
    task: str              # "linkedin_verification"
    account_id: int        # Account ID
    correlation_id: str    # Auto-generated UUID
    email: Optional[str]   # Account email
    user_id: Optional[int] # User ID
    metadata: Dict[str, Any]  # Additional parameters

Task Result

@dataclass 
class NinjaTaskResult:
    correlation_id: str    # Matches request
    task: str             # Task type
    status: str           # "VERIFIED", "FAILED", etc.
    success: bool         # True if successful
    account_id: int       # Account ID
    cookies: Optional[str] # Extracted cookies
    data: Optional[Dict]   # Additional result data
    error: Optional[Dict]  # Error details if failed
    
    @property
    def is_success(self) -> bool:
        return self.success or self.status == 'VERIFIED'

🚨 Error Handling

from ninja_kafka_sdk import (
    NinjaClient, NinjaTaskTimeoutError, 
    NinjaTaskError, NinjaKafkaConnectionError
)

try:
    result = await client.execute_task("linkedin_verification", account_id=123)
    
except NinjaTaskTimeoutError:
    print("Task took too long")
    
except NinjaTaskError as e:
    print(f"Ninja couldn't complete task: {e.details}")
    
except NinjaKafkaConnectionError:
    print("Can't connect to Kafka")

🔌 Extending for New Services

# Add new task types easily
await client.send_task(
    task="twitter_scraping",
    account_id=123,
    parameters={"target_user": "@elonmusk"}
)

# SDK handles routing to appropriate Ninja service

🔧 Troubleshooting

Common Configuration Issues

Issue: "Can't connect to Kafka"

# Check your servers configuration
from ninja_kafka_sdk.config import NinjaKafkaConfig
config = NinjaKafkaConfig()
print(f"Environment: {config.environment}")
print(f"Kafka servers: {config.kafka_servers}")
print(f"Consumer group: {config.consumer_group}")

Solutions:

Local Development: Ensure Kafka is running on localhost:9092
Stage/Prod: Verify KAFKA_STAGE_SERVERS or KAFKA_PROD_SERVERS are set
Custom Provider: Use KAFKA_BOOTSTRAP_SERVERS for explicit override

Issue: "No messages received"

# Check consumer group conflicts
import os
print(f"Consumer group: {os.getenv('KAFKA_CONSUMER_GROUP', 'auto-detected')}")

# Force specific consumer group
os.environ['KAFKA_CONSUMER_GROUP'] = 'my-unique-group'
client = NinjaClient()

Issue: "Task timeout"

# Increase timeout for slow operations
client = NinjaClient(timeout=600)  # 10 minutes
result = await client.execute_task("linkedin_verification", account_id=123, timeout=300)

Environment Detection Debug

from ninja_kafka_sdk.config import NinjaKafkaConfig

# Debug environment detection
config = NinjaKafkaConfig()
print(f"Environment: {config.environment}")
print(f"Servers: {config.kafka_servers}")

# Force specific environment
config = NinjaKafkaConfig(environment='stage')
print(f"Forced stage servers: {config.kafka_servers}")

Quick Health Check

from ninja_kafka_sdk import NinjaClient
import asyncio

async def health_check():
    client = NinjaClient()
    try:
        # Test connection by sending a test message
        correlation_id = await client.send_task("health_check", account_id=0)
        print(f"✅ Connection OK - Test message sent: {correlation_id}")
        return True
    except Exception as e:
        print(f"❌ Connection failed: {e}")
        return False
    finally:
        client.stop()

# Run health check
asyncio.run(health_check())

📚 Appendix: For Service Implementers

This section contains information for developers implementing Ninja services (like browser-ninja) that process tasks and send results back.

Sending Task Results

If you're building a service that processes Ninja tasks, use these methods to send results:

from ninja_kafka_sdk import NinjaClient

async def send_verification_result():
    # Configure client for service that processes tasks
    client = NinjaClient(
        kafka_servers="your-kafka-servers:9092",
        consumer_group="browser-ninja",  # Service-specific consumer group
        environment="prod"
    )
    
    try:
        # Send success result
        await client.send_success_result(
            correlation_id="task-123-456",
            account_id=12345,
            email="user@example.com",
            cookies="extracted_cookies_data",
            screenshot="base64_screenshot"
        )
        
        # Or send error result
        await client.send_error_result(
            correlation_id="task-123-457",
            account_id=12346,
            email="user2@example.com",
            error_code="LOGIN_FAILED",
            error_message="Invalid credentials"
        )
        
    finally:
        client.stop()

Listening for Tasks (Future Feature)

from ninja_kafka_sdk import NinjaClient

async def process_ninja_tasks():
    client = NinjaClient(
        kafka_servers="your-kafka-servers:9092",
        consumer_group="browser-ninja"
    )
    
    try:
        # Listen for incoming tasks
        async for task in client.listen_tasks():
            print(f"📥 Received task: {task.task} for account {task.account_id}")
            
            # Process the task
            if task.task == "linkedin_verification":
                result = await process_linkedin_verification(task)
                
                # Send result back
                if result["success"]:
                    await client.send_success_result(
                        correlation_id=task.correlation_id,
                        account_id=task.account_id,
                        email=task.email,
                        cookies=result["cookies"]
                    )
                else:
                    await client.send_error_result(
                        correlation_id=task.correlation_id,
                        account_id=task.account_id,
                        email=task.email,
                        error_code=result["error_code"],
                        error_message=result["error_message"]
                    )
                    
    finally:
        client.stop()

The Ninja Kafka SDK simplifies task-based communication while maintaining enterprise-grade reliability.

Project details

These details have not been verified by PyPI

Project links

Release history Release notifications | RSS feed

0.6.0

May 4, 2026

0.5.0

Apr 2, 2026

This version

0.4.1

Mar 31, 2026

0.4.0

Mar 31, 2026

0.3.31

Oct 30, 2025

0.3.30

Oct 30, 2025

0.3.29

Oct 30, 2025

0.3.27

Oct 30, 2025

0.3.26

Oct 16, 2025

0.3.25

Sep 26, 2025

0.3.24

Sep 24, 2025

0.3.23

Sep 24, 2025

0.3.22

Sep 19, 2025

0.3.21

Sep 19, 2025

0.3.20

Sep 19, 2025

0.3.19

Sep 19, 2025

0.3.18

Sep 19, 2025

0.3.17

Sep 19, 2025

0.3.16

Sep 19, 2025

0.3.15

Sep 19, 2025

0.3.14

Sep 19, 2025

0.3.13

Sep 19, 2025

0.3.12

Sep 19, 2025

0.3.11

Sep 19, 2025

0.3.10

Sep 18, 2025

0.3.9

Sep 18, 2025

0.3.8

Sep 18, 2025

0.3.7

Sep 18, 2025

0.3.6

Sep 18, 2025

0.3.5

Sep 18, 2025

0.3.4

Sep 18, 2025

0.3.3

Sep 17, 2025

0.3.2

Sep 16, 2025

0.3.1

Sep 16, 2025

0.3.0

Sep 16, 2025

0.2.5

Sep 16, 2025

0.2.4

Sep 16, 2025

0.2.3

Sep 15, 2025

0.2.2

Sep 15, 2025

0.2.1

Sep 15, 2025

0.2.0

Sep 15, 2025

0.1.4

Sep 11, 2025

0.1.3

Sep 11, 2025

0.1.2

Sep 9, 2025

0.1.1

Sep 9, 2025

0.1.0

Sep 9, 2025

0.0.1

Sep 9, 2025

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

ninja_kafka_sdk-0.4.1.tar.gz (45.9 kB view details)

Uploaded Mar 31, 2026 Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

The dropdown lists show the available interpreters, ABIs, and platforms. Enable javascript to be able to filter the list of wheel files.

ninja_kafka_sdk-0.4.1-py3-none-any.whl (44.1 kB view details)

Uploaded Mar 31, 2026 Python 3

File details

Details for the file ninja_kafka_sdk-0.4.1.tar.gz.

File metadata

Download URL: ninja_kafka_sdk-0.4.1.tar.gz
Upload date: Mar 31, 2026
Size: 45.9 kB
Tags: Source
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.5

File hashes

Hashes for ninja_kafka_sdk-0.4.1.tar.gz
Algorithm	Hash digest
SHA256	`f4eee05a7594e3bdd8256481443fb9e707297953c5dbeea148227f972ccaec68`
MD5	`02841d98a9e74a94653454e9dba3214f`
BLAKE2b-256	`be29589a14ea35afb306934c55f5d801c970776b3135b8deb805ea9ef28148dd`

See more details on using hashes here.

File details

Details for the file ninja_kafka_sdk-0.4.1-py3-none-any.whl.

File metadata

Download URL: ninja_kafka_sdk-0.4.1-py3-none-any.whl
Upload date: Mar 31, 2026
Size: 44.1 kB
Tags: Python 3
Uploaded using Trusted Publishing? No
Uploaded via: twine/6.2.0 CPython/3.13.5

File hashes

Hashes for ninja_kafka_sdk-0.4.1-py3-none-any.whl
Algorithm	Hash digest
SHA256	`6f950ea4a0324f964de8f7d07ddd934cdb8130dbbbf35f3e11869affe3bb22fb`
MD5	`cd20fbf4a1dfed445d14b05a322ddf0b`
BLAKE2b-256	`2240b881d8f14fa890982f806856e1765d9c79a918aa439ab6f503db3fb99c04`

See more details on using hashes here.

ninja-kafka-sdk 0.4.1

Navigation

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Project description

Ninja Kafka SDK

🚀 Quick Start

1️⃣ Send a Task

2️⃣ Listen for Results

📦 Installation

📨 Complete Example: Send and Listen

Send a Task and Wait for Its Result

Listen Continuously for All Results

⚙️ Configuration

🔑 Key Concept: Consumer Groups

Configuration from Config Object

Configuration with Config Object

🆕 Version 0.4.0: Ordered Multi-Topic Consumer Support

🆕 Version 0.3.23+ Parameters Field Update

🆕 Version 0.2.0 Breaking Changes

Migration from v0.1.x

Why This Change?

💡 How to Send Tasks

Basic Task Execution

Advanced Usage Patterns

Fire and Forget

Batch Processing

Different Environment Examples

🏗️ Available Tasks

LinkedIn Verification

Future Tasks

📝 Message Models

Task Request

Task Result

🚨 Error Handling

🔌 Extending for New Services

🔧 Troubleshooting

Common Configuration Issues

Issue: "Can't connect to Kafka"

Issue: "No messages received"

Issue: "Task timeout"

Environment Detection Debug

Quick Health Check

📚 Appendix: For Service Implementers

Sending Task Results

Listening for Tasks (Future Feature)

Project details

Verified details

Maintainers

Unverified details

Project links

Meta

Classifiers

Release history Release notifications | RSS feed

Download files

Source Distribution

Built Distribution

File details

File metadata

File hashes

File details

File metadata

File hashes