visionFusion é um conjunto de ferramentas de ocr para facilitar o processo de extração de texto em diferentes cenarios
Project description
Visão Geral
Este projeto fornece um conjunto de ferramentas para capturar regiões da tela e detectar texto dentro de imagens usando dois métodos diferentes de OCR (Reconhecimento Óptico de Caracteres): Google Cloud Vision API e Tesseract.
Uso
screenGrabber
Esta classe inicializa um aplicativo simples de captura de tela usando Tkinter. Exemplo:
from visionFusion import ScreenGrabber
grabber = screenGrabber()
visionai
Esta classe usa a API Google Cloud Vision para detectar texto em imagens de diferentes fontes. Inicialização
from pathlib import Path
from visionFusion import visionai
# Inicialize com credenciais do Google Cloud e proxy opcional
vision = visionai(creds=Path('caminho/para/creds.json'), proxy='http://seu.proxy:porta')
Métodos:
-
detect_text_from_file(path: Path) -> Union[List, None]
Detecta texto em um arquivo de imagem.
textos = vision.detect_text_from_file(Path('caminho/para/imagem.png'))
-
detect_text_from_url(url: str) -> Union[List, None]
Detecta texto em uma imagem a partir de uma URL.
textos = vision.detect_text_from_url('https://exemplo.com/imagem.png')
-
detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[List, None]
Detecta texto em uma região específica da tela.
textos = vision.detect_text_from_screen_region((0, 0, 100, 100))
tesseract
Esta classe usa Tesseract OCR para detectar texto em imagens de diferentes fontes. Inicialização
from pathlib import Path
from visionFusion import tesseract
Inicialize com o caminho do executável do Tesseract
tess = tesseract(tesseract_executable=Path('caminho/para/tesseract'))
Métodos:
-
detect_text_from_file(path: Path) -> Union[str, None]
Detecta texto em um arquivo de imagem.
texto = tess.detect_text_from_file(Path('caminho/para/imagem.png'))
-
detect_text_from_url(url: str) -> Union[str, None]
Detecta texto em uma imagem a partir de uma URL.
texto = tess.detect_text_from_url('https://exemplo.com/imagem.png')
-
detect_text_from_screen_region(coordenadas: Tuple[int]) -> Union[str, None]
Detecta texto em uma região específica da tela.
texto = tess.detect_text_from_screen_region((0, 0, 100, 100))
Licença
Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE para mais detalhes.
Autor
Desenvolvido por Guilherme Eduardo Poças.
Sinta-se à vontade para entrar em contato com qualquer dúvida ou feedback!
Project details
Release history Release notifications | RSS feed
Download files
Download the file for your platform. If you're not sure which to choose, learn more about installing packages.
Source Distribution
Built Distribution
Filter files by name, interpreter, ABI, and platform.
If you're not sure about the file name format, learn more about wheel file names.
Copy a direct link to the current filters
File details
Details for the file visionfusion-0.1.8.tar.gz.
File metadata
- Download URL: visionfusion-0.1.8.tar.gz
- Upload date:
- Size: 5.9 kB
- Tags: Source
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.7.1 CPython/3.11.8 Windows/10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
dfb028da3bf9bacf94a2cba30d2295417ef7357e34d109868ee22ebd832e14a2
|
|
| MD5 |
3e07f5bc2abc04c2f17bc486baa42569
|
|
| BLAKE2b-256 |
b23944f47c5ce927d38413c5efc3ac06ce608412e16a07ec2a9bac9630256fc4
|
File details
Details for the file visionfusion-0.1.8-py3-none-any.whl.
File metadata
- Download URL: visionfusion-0.1.8-py3-none-any.whl
- Upload date:
- Size: 6.5 kB
- Tags: Python 3
- Uploaded using Trusted Publishing? No
- Uploaded via: poetry/1.7.1 CPython/3.11.8 Windows/10
File hashes
| Algorithm | Hash digest | |
|---|---|---|
| SHA256 |
e552e444bfa1280199fcf91c6d2af1c1150089e10015f0c7e3c2cd3f8a8bd847
|
|
| MD5 |
12882e23b14b3223bbda72a0a68c83cf
|
|
| BLAKE2b-256 |
5a9db58aedb695c167984dfd55b8598f32e8384b0ef23f8f237703681ac2e0cc
|