Article-Arxiv

TITAN: Graph-Executable Reasoning for Cyber Threat Intelligence

TITAN (Threat Intelligence Through Automated Navigation) is a framework that connects natural-language cyber threat queries with executable reasoning over a structured knowledge …

marco-simoni

• Jan 1, 2025 • 1 min read

Improving LLM Reasoning for Vulnerability Detection via Group Relative Policy Optimization

Improving and understanding the training dynamics and reasoning of Large Language Models (LLMs) has become essential for their deployment in AI-based security tools, such as …

marco-simoni

• Jan 1, 2025 • 1 min read

GTPO: Stabilizing Group Relative Policy Optimization via Gradient and Entropy Control

Group Relative Policy Optimization (GRPO) is a promising policy-based approach for Large Language Model alignment, yet its performance is often limited by training instability and …

marco-simoni

• Jan 1, 2025 • 1 min read

No results found

Article-Arxiv

TITAN: Graph-Executable Reasoning for Cyber Threat Intelligence

Improving LLM Reasoning for Vulnerability Detection via Group Relative Policy Optimization

GTPO: Stabilizing Group Relative Policy Optimization via Gradient and Entropy Control