A Python package for Gemini Text-to-Speech using the official API.
Project description
Gemini TTS (немесе Gemini Parrot TTS) - Қарапайым мәтіннен сөйлеуге айналдыру кітапханасы
Бұл кітапхана Google Gemini API арқылы мәтінді сөйлеуге айналдыруға арналған креативті шешім. Ол Gemini моделін тек берілген мәтінді қайталауға ("тотықұс" режимі) бағыттауға тырысады, бірақ модельдің сұхбаттасуға бейімділігіне байланысты бұл әрдайым толық орындалмауы мүмкін.
Орнату (Installation)
Pip арқылы орнату (болашақта)
# Негізгі функционалдылық
pip install gemini-tts
# Аудио ойнату қолдауымен (ұсынылады)
pip install gemini-tts[audio]
Кодтан орнату
git clone https://github.com/dauitsuragan002/gemini-tts.git
cd gemini-tts
pip install -e .
# Аудио ойнату үшін
pip install -e .[audio]
Қажетті компоненттер
- Python 3.7+
- websockets
- wave
- pygame (опционалды, аудио ойнату үшін)
Қолдану (Usage)
1. Класс арқылы қолдану (ұсынылған әдіс)
from gemini_tts import GeminiTTS
# Клиент жасау
client = GeminiTTS(api_key="your_api_key_here", default_voice="Puck")
# Сөйлеуге айналдыру және аудио файлын сақтау
client.say("Бұл класс арқылы жасалған мысал")
# Дауыс түрін өзгерту
client.say("Бұл басқа дауыс", voice="Kore")
# Аудионы ойнатпау
client.say("Тек файлға сақтау", play_audio=False)
3. Аудионы тікелей ойнату
from gemini_tts import GeminiTTS
client = GeminiTTS(api_key="your_api_key_here")
# Мәтінді сөйлеуге айналдыру және бірден ойнату
client.say("Бұл дыбыс автоматты түрде ойнатылады", play_audio=True)
4. Синхронды түрде файл генерациялау (ойнатпау)
from gemini_tts import GeminiTTS
client = GeminiTTS(api_key="your_api_key_here")
# Мәтінді сөйлеуге айналдыру, бірақ ойнатпау
file_path = client.text_to_speech("Бұл тек файлға сақталады", output_file="sync_output.wav")
print(f"Аудио файл синхронды түрде сақталды: {file_path}")
Ескерту: Gemini TTS (кейде "Gemini Parrot TTS" деп те атауға болады) арқылы төмендегі дауыстар әрдайым дәлме-дәл дыбысталмауы мүмкін. Себебі, бұл кітапхана Gemini моделін тек мәтінді қайталауға ("тотықұс" режимі) "мәжбүрлеуге" тырысады, бірақ модель кейде бәрібір сұхбаттасуға көшіп, енгізілген мәтінге жауап беруі ықтимал. Бұл – осы креативті әдістің белгілі бір шектеуі.
Толық мысалдар
example.py- негізгі функцияларды көрсетеді/voice_example- әр түрлі дауыспен аудиоға түрлендірген аудиолар
Дауыс түрлері
Gemini API ұсынатын кейбір дауыс түрлері:
- Ерлер дауыстары:
- Charon (жуан)
- Puck
- Fenrir
- Әйелдер дауыстары:
- Kore
- Aoede
Нұсқа тарихы
v0.1.1
- Тікелей аудио ойнату қосылды
- Дауыс параметрлерін оңтайландыру (жуан ерлер дауыстары үшін)
- Дауыстарды категориялар бойынша ұйымдастыру
- Тотықұс ЖИ
v0.1.0
- Алғашқы нұсқа
Авторлар
- Әзірлеуші: David Suragan
- AI көмекші: Claude (Anthropic)
Алғыс білдіру
Бұл жоба agituts/gemini-2-tts репозиторийінен шабыт алды. Осы жобаның авторына шексіз алғысымызды білдіреміз.
Лицензия
MIT
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file gemini_tts-0.1.2.tar.gz.
File metadata
- Download URL: gemini_tts-0.1.2.tar.gz
- Upload date:
- Size: 7.4 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.11.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
77925a4ea87b258f0b7d08e0e4a9144a081d24c86b304ca1e268044bb6c9fb9d
|
|
| MD5 |
a3c147775b63830a28cca368465dfcd3
|
|
| BLAKE2b-256 |
05d6d38ea2ea5cb767d64df317d0beb21f985aed4d3c21e50a429742e17efd38
|
File details
Details for the file gemini_tts-0.1.2-py3-none-any.whl.
File metadata
- Download URL: gemini_tts-0.1.2-py3-none-any.whl
- Upload date:
- Size: 7.2 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: twine/6.1.0 CPython/3.11.4
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
10a4f60849995b2084176f8847763e21fd98a9a65123ad0207ae1e033c561f89
|
|
| MD5 |
8acab0e214ccedc4fa39e183cf87f1a8
|
|
| BLAKE2b-256 |
ed4b330d5e1f1989a06560248af984fce768cdd73fed2683ce715805aa90652c
|