Profile of rosscyking

Some features may not work without JavaScript. Please try enabling it if you encounter problems.

2 projects

redteam-foundry

Last released Jul 2, 2026

An adversarial benchmark foundry for LLM safety: audit attack corpora, score benchmark staleness, compare defences (ASR + false-refusal), test multilingual over-refusal, and export safe challenge packs.

agent-release-gates

Last released Jul 2, 2026

Release-readiness gates for AI agents: replay known incidents, apply policy-as-code gates, and produce ship/warn/block evidence before an agent, prompt, model, or tool-policy change ships.