Skip to main content

A Python package for Gemini Text-to-Speech using the official API.

Project description

Gemini TTS (немесе Gemini Parrot TTS) - Қарапайым мәтіннен сөйлеуге айналдыру кітапханасы

Бұл кітапхана Google Gemini API арқылы мәтінді сөйлеуге айналдыруға арналған креативті шешім. Ол Gemini моделін тек берілген мәтінді қайталауға ("тотықұс" режимі) бағыттауға тырысады, бірақ модельдің сұхбаттасуға бейімділігіне байланысты бұл әрдайым толық орындалмауы мүмкін.

Орнату (Installation)

Pip арқылы орнату (болашақта)

# Негізгі функционалдылық
pip install gemini-tts

# Аудио ойнату қолдауымен (ұсынылады)
pip install gemini-tts[audio]

Кодтан орнату

git clone https://github.com/dauitsuragan002/gemini-tts.git
cd gemini-tts
pip install -e .
# Аудио ойнату үшін
pip install -e .[audio]

Қажетті компоненттер

  • Python 3.7+
  • websockets
  • wave
  • pygame (опционалды, аудио ойнату үшін)

Қолдану (Usage)

1. Класс арқылы қолдану (ұсынылған әдіс)

from gemini_tts import GeminiTTS

# Клиент жасау
client = GeminiTTS(api_key="your_api_key_here", default_voice="Puck")

# Сөйлеуге айналдыру және аудио файлын сақтау
client.say("Бұл класс арқылы жасалған мысал")

# Дауыс түрін өзгерту
client.say("Бұл басқа дауыс", voice="Kore")

# Аудионы ойнатпау
client.say("Тек файлға сақтау", play_audio=False)

3. Аудионы тікелей ойнату

from gemini_tts import GeminiTTS

client = GeminiTTS(api_key="your_api_key_here")

# Мәтінді сөйлеуге айналдыру және бірден ойнату
client.say("Бұл дыбыс автоматты түрде ойнатылады", play_audio=True)

4. Синхронды түрде файл генерациялау (ойнатпау)

from gemini_tts import GeminiTTS

client = GeminiTTS(api_key="your_api_key_here")

# Мәтінді сөйлеуге айналдыру, бірақ ойнатпау
file_path = client.text_to_speech("Бұл тек файлға сақталады", output_file="sync_output.wav")
print(f"Аудио файл синхронды түрде сақталды: {file_path}")

Ескерту: Gemini TTS (кейде "Gemini Parrot TTS" деп те атауға болады) арқылы төмендегі дауыстар әрдайым дәлме-дәл дыбысталмауы мүмкін. Себебі, бұл кітапхана Gemini моделін тек мәтінді қайталауға ("тотықұс" режимі) "мәжбүрлеуге" тырысады, бірақ модель кейде бәрібір сұхбаттасуға көшіп, енгізілген мәтінге жауап беруі ықтимал. Бұл – осы креативті әдістің белгілі бір шектеуі.

Толық мысалдар

  • example.py - негізгі функцияларды көрсетеді
  • /voice_example - әр түрлі дауыспен аудиоға түрлендірген аудиолар

Дауыс түрлері

Gemini API ұсынатын кейбір дауыс түрлері:

  • Ерлер дауыстары:
    • Charon (жуан)
    • Puck
    • Fenrir
  • Әйелдер дауыстары:
    • Kore
    • Aoede

Нұсқа тарихы

v0.1.1

  • Тікелей аудио ойнату қосылды
  • Дауыс параметрлерін оңтайландыру (жуан ерлер дауыстары үшін)
  • Дауыстарды категориялар бойынша ұйымдастыру
  • Тотықұс ЖИ

v0.1.0

  • Алғашқы нұсқа

Авторлар

  • Әзірлеуші: David Suragan
  • AI көмекші: Claude (Anthropic)

Алғыс білдіру

Бұл жоба agituts/gemini-2-tts репозиторийінен шабыт алды. Осы жобаның авторына шексіз алғысымызды білдіреміз.

Лицензия

MIT

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

gemini_tts-0.1.2.tar.gz (7.4 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

gemini_tts-0.1.2-py3-none-any.whl (7.2 kB view details)

Uploaded Python 3

File details

Details for the file gemini_tts-0.1.2.tar.gz.

File metadata

  • Download URL: gemini_tts-0.1.2.tar.gz
  • Upload date:
  • Size: 7.4 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.11.4

File hashes

Hashes for gemini_tts-0.1.2.tar.gz
Algorithm Hash digest
SHA256 77925a4ea87b258f0b7d08e0e4a9144a081d24c86b304ca1e268044bb6c9fb9d
MD5 a3c147775b63830a28cca368465dfcd3
BLAKE2b-256 05d6d38ea2ea5cb767d64df317d0beb21f985aed4d3c21e50a429742e17efd38

See more details on using hashes here.

File details

Details for the file gemini_tts-0.1.2-py3-none-any.whl.

File metadata

  • Download URL: gemini_tts-0.1.2-py3-none-any.whl
  • Upload date:
  • Size: 7.2 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.1.0 CPython/3.11.4

File hashes

Hashes for gemini_tts-0.1.2-py3-none-any.whl
Algorithm Hash digest
SHA256 10a4f60849995b2084176f8847763e21fd98a9a65123ad0207ae1e033c561f89
MD5 8acab0e214ccedc4fa39e183cf87f1a8
BLAKE2b-256 ed4b330d5e1f1989a06560248af984fce768cdd73fed2683ce715805aa90652c

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page