Skip to main content

macOS screen activity logger with OCR using Vision Framework

Project description

screen-times

PyPI version Python Version CI Build License: MIT Platform

macOS screen activity logger with OCR using Vision Framework

概要

screen-times は、macOS上で自動的にスクリーンショットを取得し、OCR処理してアクティビティログを記録するツールです。Vision Frameworkを使用した高精度なOCRで、作業内容を自動的にログ化します。

主な機能:

  • 🖼️ 30秒ごとの自動スクリーンショット取得
  • 🔍 Vision FrameworkによるネイティブOCR処理
  • 📝 JSONL形式での軽量ログ保存
  • 🏷️ タスクベースのログ分割機能
  • 🔄 launchdによるバックグラウンド実行
  • 🗑️ 処理後の画像自動削除

用途例:

  • 作業時間の可視化・分析
  • 生産性の自己観察
  • プロジェクトごとの作業ログ管理

システム要件

  • macOS 10.15+ (Catalina以上)
  • Apple Silicon または Intel Mac(Vision Framework対応)
  • Python 3.9+
  • 管理者権限(launchd登録時)

インストール

pip install screen-times

必要な権限

初回実行時、以下の権限が必要です:

  1. 画面収録権限

    • システム設定 → プライバシーとセキュリティ → 画面収録
    • ターミナル(または実行環境)を許可
  2. アクセシビリティ権限(アクティブウィンドウ名の取得に必要)

    • システム設定 → プライバシーとセキュリティ → アクセシビリティ
    • ターミナル(または実行環境)を許可

クイックスタート

1. 画面収録権限を付与

重要: システム環境設定 → セキュリティとプライバシー → 画面収録 で、ターミナルにチェックを入れてください。

2. ScreenOCR Logger を起動

screenocr start

これで毎分自動的にスクリーンショットを取得し、OCR処理してログを記録します。

基本的な使い方

エージェントの操作

# 現在の状態を確認
screenocr status

# エージェントを起動(自動ログ記録を開始)
screenocr start

# エージェンインストール

```bash
pip install screen-times

2. 権限を付与

システム設定 → プライバシーとセキュリティ で以下を許可:

  • 画面収録
  • アクセシビリティ

3. 起動

# エージェントを開始(バックグラウンドで自動ログ記録)
screenocr start

# 状態確認
screenocr status

# 停止
screenocr stop

これで30秒ごとに自動的にスクリーンショットを取得し、OCR処理してログを記録します。

ログは ~/.screenocr_logs/ に保存され

別のタスクを開始(前のタスクから切り替え)

screenocr split "バグ修正: ログイン画面"

タスク管理をやめて、日付ベースのログに戻す

screenocr split --clear


タスクを指定すると、そのタスク専用のログファイルが作成され、以降のログはそこに記録されます。日付が変わる(朝5時)と自動的に日付ベースに戻ります。

### ログの確認

```bash
# ログディレクトリを確認
ls -lh ~/.screenocr_logs/

# 今日のログを表示(朝5時基準)
cat ~/.screenocr_logs/$(date +%Y-%m-%d).jsonl | head -10

# ログをリアルタイムで監視
tail -f ~/.screenocr_logs/$(date +%Y-%m-%d).jsonl

開発

テストの実行

プロジェクトには統合テストが含まれています:

# 全テストを実行
pytest tests/ -v

# カバレッジレポートを生成
pytest tests/ --cov=src/screen_times --cov-report=term --cov-report=html

# HTMLカバレッジレポートを表示
open htmlcov/index.html

テストの種類

  • tests/test_ocr.py: OCR処理の統合テスト
    • 簡単なテキスト認識
    • 日本語テキスト認識
    • エラーハンドリング
  • tests/test_screenshot.py: スクリーンショット取得のテスト
    • 画像取得
    • ディレクトリ作成
    • エラーハンドリング
  • tests/test_jsonl.py: JSONL操作のテスト
    • 書き込み/読み込み
    • UTF-8エンコーディング
    • 追記操作
  • tests/test_jsonl_manager.py: JSONLファイル管理のテスト
    • 日付判定ロジック(朝5時基準)
    • 自動・手動分割
    • メタデータ書き込み

ログフォーマット

JSONL形式でログが記録されます。各行が1つのログエントリです。

通常のログ

{"timestamp": "2025-12-28T14:31:00.123456", "window": "VS Code", "text": "def screenshot_ocr():\n    ...", "text_length": 245}
{"timestamp": "2025-12-28T14:32:00.456789", "window": "Slack", "text": "@akira Hey, how's the project?", "text_length": 28}

タスク付きログ(1行目にメタデータ)

{"type": "task_metadata", "timestamp": "2025-12-28T14:30:45", "description": "機能実装: ユーザー認証", "effective_date": "2025-12-28"}
{"timestamp": "2025-12-28T14:31:00", "window": "VS Code", "text": "...", "text_length": 245}

ファイル名規則

  • 日付ベース: 2025-12-28.jsonl
  • タスクベース: 2025-12-28_--_143045.jsonl

注意: 日付は朝5時を基準に判定されます(5時より前は前日扱い)。

トラブルシューティング

画面収録権限がない

システム環境設定 → セキュリティとプライバシー → 画面収録 で、ターミナルにチェックを入れてください。

エージェントが起動しない

# 状態を確認
screenocr status

# 手動で確認
launchctl list | grep screenocr

ログが記録されない

# ログディレクトリを確認
ls -la ~/.screenocr_logs/

# エージェントの状態を確認
screenocr status

# エージェントを再起動
screenocr stop
screenocr start

詳細設のドキュメント

ライセンス

MIT License - 詳細は LICENSE を参照してください。

貢献

プルリクエスト・Issueを歓迎します!

  1. このリポジトリをフォーク
  2. フィーチャーブランチを作成 (git checkout -b feat/amazing-feature)
  3. 変更をコミット (git commit -m 'feat: add amazing feature')
  4. ブランチにプッシュ (git push origin feat/amazing-feature)
  5. Pull Requestを作成

リンク

その他

詳細は ARCHITECTURE.md を参照。

ライセンス

MIT

貢献

プルリクエストを歓迎します。

Project details


Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

screen_times-0.3.0.tar.gz (29.2 kB view details)

Uploaded Source

Built Distribution

If you're not sure about the file name format, learn more about wheel file names.

screen_times-0.3.0-py3-none-any.whl (23.6 kB view details)

Uploaded Python 3

File details

Details for the file screen_times-0.3.0.tar.gz.

File metadata

  • Download URL: screen_times-0.3.0.tar.gz
  • Upload date:
  • Size: 29.2 kB
  • Tags: Source
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.12

File hashes

Hashes for screen_times-0.3.0.tar.gz
Algorithm Hash digest
SHA256 36d61876e53ecb69f96cefcfb72c56d27a30bf8f7a1fdfb04c79b5dc81d555da
MD5 1c15c7ee39895549c10616b67be715d8
BLAKE2b-256 2765177bbf32799704f5ac599f287b54a4bbec47e9de5609c1dd4171c144ac1e

See more details on using hashes here.

File details

Details for the file screen_times-0.3.0-py3-none-any.whl.

File metadata

  • Download URL: screen_times-0.3.0-py3-none-any.whl
  • Upload date:
  • Size: 23.6 kB
  • Tags: Python 3
  • Uploaded using Trusted Publishing? No
  • Uploaded via: twine/6.2.0 CPython/3.12.12

File hashes

Hashes for screen_times-0.3.0-py3-none-any.whl
Algorithm Hash digest
SHA256 9bc92c4f6be612464040e2c12928b1f66ba583e3fc8c1ab719948eacfb85311c
MD5 c55f33c26d878e90a0fc8c3aebf519a9
BLAKE2b-256 b0f89fef2ab419279770750c49e7c255ad6b39a0f0fca601a4e7b1dd3c64e268

See more details on using hashes here.

Supported by

AWS Cloud computing and Security Sponsor Datadog Monitoring Depot Continuous Integration Fastly CDN Google Download Analytics Pingdom Monitoring Sentry Error logging StatusPage Status page