libs for cameramonit, ocr, fin-officer, cfo, and other projects
Project description
movatalk
movatalk
Biblioteka Python do tworzenia bezpiecznych interfejsów głosowych AI dla dzieci, z przetwarzaniem na urządzeniu i kontrolą rodzicielską.
O projekcie
movatalk to biblioteka open source zaprojektowana do tworzenia bezpiecznych urządzeń głosowych dla dzieci, które wykorzystują technologie sztucznej inteligencji przy zachowaniu prywatności i kontroli rodzicielskiej. Inspirowana koncepcją urządzenia MovaPad, biblioteka umożliwia przetwarzanie mowy na tekst (STT) i tekstu na mowę (TTS) bezpośrednio na urządzeniu, zapewniając ochronę wrażliwych danych.
Kluczowe funkcje
- 🎤 Przetwarzanie audio - Nagrywanie, filtrowanie i przetwarzanie dźwięku
- 🗣️ Lokalne STT i TTS - Konwersja mowy na tekst i tekstu na mowę na urządzeniu
- 🔒 Kontrola rodzicielska - Filtrowanie treści, limity czasowe, bezpieczne połączenia
- 🔋 Zarządzanie energią - Optymalizacja zużycia baterii
- 🌐 Opcjonalne integracje z AI - Bezpieczne połączenia z API AI
- 📱 Interfejs sprzętowy - Wsparcie dla przycisków, diod LED i innych komponentów
Instalacja
Z PyPI
pip install movatalk
Z GitLab
pip install git+https://gitlab.com/movatalk/movatalk.git
Klonowanie repozytorium
git clone https://gitlab.com/movatalk/movatalk.git
cd movatalk
pip install -e .
Instalacja na Raspberry Pi Zero 2 W
Dla pełnej instalacji na Raspberry Pi Zero 2 W, zalecamy użycie naszych skryptów instalacyjnych:
git clone https://gitlab.com/movatalk/movatalk.git
cd movatalk
sudo bash scripts/install_dependencies.sh
bash scripts/install_models.sh
pip install -e .
sudo bash scripts/setup_service.sh
Szybki start
from movatalk.audio import AudioProcessor, WhisperSTT, PiperTTS
from movatalk.api import SafeAPIConnector
from movatalk.safety import ParentalControl
# Inicjalizacja komponentów
audio = AudioProcessor()
stt = WhisperSTT()
tts = PiperTTS()
api = SafeAPIConnector()
parental = ParentalControl()
# Nagrywanie i przetwarzanie
audio_file = audio.start_recording(duration=5)
transcript = stt.transcribe(audio_file)
print(f"Rozpoznany tekst: {transcript}")
# Filtrowanie i API
filtered_input, filter_message = parental.filter_input(transcript)
if filtered_input:
response = api.query_llm(filtered_input)
filtered_response = parental.filter_output(response)
tts.speak(filtered_response)
else:
tts.speak(filter_message)
Więcej przykładów znajdziesz w katalogu examples/.
Wymagania sprzętowe
Minimalne wymagania:
- Raspberry Pi Zero 2 W lub podobne urządzenie
- Mikrofon (np. ReSpeaker 2-Mic Pi HAT)
- Głośnik/wzmacniacz
- Przyciski i diody LED (opcjonalnie)
- Bateria (opcjonalnie)
Pełną listę wspieranych platform znajdziesz w docs/hardware_setup.md.
Dokumentacja
Pełna dokumentacja dostępna jest w katalogu docs/:
Współpraca nad projektem
Zachęcamy do współpracy nad rozwojem projektu movatalk! Aby dowiedzieć się więcej, przeczytaj CONTRIBUTING.md.
Licencja
Ten projekt jest dostępny na licencji MIT. Zobacz plik LICENSE dla szczegółów.
Autorzy
movatalk jest rozwijany przez społeczność Open Source, zainspirowany koncepcją urządzenia MovaPad.
Kontakt
- GitLab: https://gitlab.com/movatalk/movatalk
- Email: contact@example.com
System pipelinów movatalk
System pipelinów movatalk umożliwia tworzenie złożonych aplikacji głosowych za pomocą prostych plików konfiguracyjnych YAML, bez konieczności pisania kodu w Pythonie. Pipelines łączą gotowe komponenty i operacje w jeden spójny przepływ pracy.
Spis treści
- Wprowadzenie do pipelinów
- Struktura pliku YAML
- Komponenty pipelinów
- Zmienne i kontekst
- Kroki warunkowe i pętle
- Programistyczne użycie pipelinów
- Tworzenie własnych komponentów
- Kreator pipelinów
- Wizualizacja pipelinów
- Przykłady
Wprowadzenie do pipelinów
Pipeline to sekwencja kroków, które są wykonywane kolejno, aby osiągnąć określony cel. W kontekście movatalk, pipeline może reprezentować na przykład asystenta głosowego, który:
- Słucha pytania użytkownika
- Przetwarza mowę na tekst
- Wysyła zapytanie do modelu językowego
- Filtruje odpowiedź pod kątem bezpieczeństwa
- Zamienia tekst na mowę i odtwarza odpowiedź
Zamiast pisać kod w Pythonie, możesz zdefiniować taki przepływ pracy w pliku YAML, który jest łatwy do czytania i modyfikacji.
Struktura pliku YAML
Plik pipeline'u YAML składa się z następujących elementów:
name: "Nazwa pipeline'u"
description: "Opis działania pipeline'u"
version: "1.0.0"
variables:
zmienna1: "wartość1"
zmienna2: "wartość2"
steps:
- name: "k
Install
pip install movatalk
git clone https://github.com/movatalk/python.git movatalk
Contributing
python3 -m venv pytest-env
source pytest-env/bin/activate
pip install --upgrade pip
pip install pytest
run the test, execute the pytest command:
pytest
Tips
simple method to generate a requirements.txt file is to pipe them,
pip freeze > requirements.txt
pip freeze > requirements/runtime.txt
if push not possible
[remote rejected] (refusing to allow a Personal Access Token to create or update workflow `.github/workflows/python-app.yml` without `workflow` scope)
Problem z odrzuceniem tokena dostępu osobistego (Personal Access Token, PAT) podczas próby aktualizacji pliku workflow, musisz zaktualizować uprawnienia swojego tokena.
Oto kroki, które powinieneś podjąć:
-
Przejdź do ustawień GitHub:
- Kliknij na swój awatar w prawym górnym rogu GitHub
- Wybierz "Settings"
-
Przejdź do ustawień deweloperskich:
- W lewym menu wybierz "Developer settings"
-
Zarządzaj tokenami dostępu:
- Wybierz "Personal access tokens"
- Następnie "Tokens (classic)"
-
Utwórz nowy token lub zaktualizuj istniejący:
- Jeśli tworzysz nowy, kliknij "Generate new token"
- Jeśli aktualizujesz istniejący, znajdź odpowiedni token i kliknij "Edit"
-
Dodaj uprawnienie "workflow":
- Przewiń do sekcji "Select scopes"
- Zaznacz pole obok "workflow"
-
Zapisz zmiany:
- Przewiń na dół i kliknij "Generate token" (dla nowego) lub "Update token" (dla istniejącego)
-
Skopiuj nowy token:
- Upewnij się, że skopiowałeś nowy token, ponieważ nie będziesz mógł go zobaczyć ponownie
-
Zaktualizuj token w swoim lokalnym repozytorium:
- Jeśli używasz HTTPS, zaktualizuj swoje dane logowania
- Jeśli używasz SSH, upewnij się, że Twój klucz SSH jest poprawnie skonfigurowany
-
Spróbuj ponownie wykonać push:
- Użyj nowego tokena do autoryzacji
Pamiętaj, że tokeny dostępu osobistego są bardzo wrażliwe na bezpieczeństwo. Traktuj je jak hasła i nigdy nie udostępniaj ich publicznie. Jeśli przypadkowo ujawnisz swój token, natychmiast go usuń i wygeneruj nowy.
Po wykonaniu tych kroków, powinieneś być w stanie zaktualizować plik workflow bez problemów. Jeśli nadal napotkasz problemy, upewnij się, że masz odpowiednie uprawnienia w repozytorium i że workflow nie są zablokowane przez ustawienia organizacji lub repozytorium.
update PAT in repo
our local repo and want to push it to a remote repo.
create a PAT (personal access token): official doc here. Make sure to tick the box "workflow" when creating it. In the terminal, instead of the classic
git remote add origin https://github.com/<account>/<repo>.git
swap it by
git remote add origin https://<PAT>@github.com/<account>/<repo>.git
example
# check
git remote -v
PAT=...
git remote add origin https://$PAT@github.com/movatalk/python.git
# OR update:
git remote set-url origin https://$PAT@github.com/movatalk/python.git
# check
git remote -v
git push
Follow-up with the classic git branch -M main and git push -u origin main
That worked for me. Hopefully for you too.
pypi publishing
Creating a PyPI Project with a Trusted Publisher - PyPI Docs
Creating tags from the command line
To create a tag on your current branch, run this:
git tag <tagname>
If you want to include a description with your tag, add -a to create an annotated tag:
git tag <tagname> -a
This will create a local tag with the current state of the branch you are on. When pushing to your remote repo, tags are NOT included by default. You will need to explicitly say that you want to push your tags to your remote repo:
git push origin --tags
example:
git tag 0.1.12
git push origin --tags
test
pip install build
pip install build hatchling
py -m build
Quick Start
Local Development
- Create virtual environment
rm -rf venv
python -m venv venv
source venv/bin/activate
pip install --upgrade pip
pip install -r requirements.txt
I see a persistent issue with your package publication process. Let me help you resolve these problems:
- Version Detection Problem The error messages show that the version is not being correctly detected:
❌ Could not find version in src/movatalk/__init__.py
❌ Could not find version in ./src/movatalk/_version.py
❌ Could not find version in ./pyproject.toml
-
License Classifier Issue There's an ongoing problem with the license classifier in the
pyproject.toml. -
Replace your existing
pyproject.tomlwith the new version -
Create
src/movatalk/_version.pywith the content I provided -
Remove any existing
setup.pyif it exists -
Use
python -m buildto create distribution -
Use
twine upload dist/*to publish
Recommended workflow:
# Ensure you're in your project root
python -m pip install --upgrade build twine
python -m build
python -m twine upload dist/*
Project details
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file movatalk-0.1.43.tar.gz.
File metadata
- Download URL: movatalk-0.1.43.tar.gz
- Upload date:
- Size: 27.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
249a1516cce54643fc6ce86312facc61bcbcec05610b9ecf3984f4a3c3b31ee5
|
|
| MD5 |
e38090e2022fb0485d40d319f3cafae2
|
|
| BLAKE2b-256 |
4a4b89f9a9c3c6c6c5418f4f74a790f8fea01b2ddd145e20a832728da3fd7d08
|
File details
Details for the file movatalk-0.1.43-py3-none-any.whl.
File metadata
- Download URL: movatalk-0.1.43-py3-none-any.whl
- Upload date:
- Size: 10.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.12.9
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
c91d892fe402c78da87bb492ea1dec682accf072bdcac3d8548d0a2dcb6b33fb
|
|
| MD5 |
896f128fc52b82f7fd97e2c82b3326ff
|
|
| BLAKE2b-256 |
3395e8f4cceeb0a67fae66b0d32c007a0d3fe375efe5462ff32d8dc0188e6c29
|