LogiBreak

This repository contains an official implement of LogiBreak accepted by ACL'26 on language models across multiple languages. The framework consists of three main components: reformulation, jailbreak, and evaluation.

Overview

The project implements a systematic approach to:

Reformulate potentially harmful requests into formal logical forms
Attempt jailbreaks using the reformulated requests
Evaluate the success of jailbreak attempts using multiple judges

Components

1. Reformulation (`reformulate_*.py`)

Reformulates potentially harmful requests into formal logical forms
Available for multiple languages:
- English (reformulate_en.py)
- Chinese (reformulate_zh.py)
- Dutch (reformulate_du.py)
Uses GPT-3.5-turbo by default for reformulation
Supports multiple restarts for each request

2. Jailbreak (`jailbreak_*.py`)

Attempts to jailbreak target models using reformulated requests
Available for multiple languages:
- English (jailbreak_en.py)
- Chinese (jailbreak_zh.py)
- Dutch (jailbreak_du.py)
Uses a formal semantics approach to generate jailbreak attempts
Supports parallel processing with multiple restarts

3. Evaluation (`evaluate_*.py`)

Evaluates jailbreak attempts using multiple judges:
- Rule-based evaluation
- GPT-4 evaluation
- Llama3-70b evaluation
Available for multiple languages:
- English (evaluate_en.py)
- Chinese (evaluate_zh.py)
- Dutch (evaluate_du.py)
Generates comprehensive evaluation results

Usage

Running the Pipeline

Reformulation:

python reformulate_en.py --reformulate_model gpt-3.5-turbo --n_restarts 5

Jailbreak:

python jailbreak_en.py --target_model gpt-3.5-turbo --input_path <path_to_reformulated_queries> --n_restarts 5

Evaluation:

python evaluate_en.py --evaluate_llama3 False --evaluate_gpt True --input_path <path_to_jailbreak_output> --n_restarts 5

Output Files

Reformulated queries are saved in ./output/reformulated_queries/
Jailbreak attempts are saved in ./output/jailbreak_output/
Evaluation results are saved alongside the input files with an -evaluation_result.json suffix

Project Structure

.
├── api.py                 # API interface for language models
├── judges.py             # Evaluation judges implementation
├── reformulate_*.py      # Reformulation scripts for different languages
├── jailbreak_*.py     # Jailbreak scripts for different languages
├── evaluate_*.py         # Evaluation scripts for different languages
└── output/               # Output directory for results
    ├── reformulated_queries/
    └── jailbreak_output/

Citation

If you feel our work is insightful and want to use the code or cite our paper, please add the following citation to your paper references.

@article{peng2025logic,
  title={Logic jailbreak: Efficiently unlocking llm safety restrictions through formal logical expression},
  author={Peng, Jingyu and Wang, Maolin and Wang, Nan and Li, Jiatong and Li, Yuchen and Ye, Yuyang and Wang, Wanyu and Jia, Pengyue and Zhang, Kai and Zhao, Xiangyu},
  journal={arXiv preprint arXiv:2505.13527},
  year={2025}
}

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
README.md		README.md
api.py		api.py
du_reformulated_request.json		du_reformulated_request.json
en_reformulated_request.json		en_reformulated_request.json
es_reformulated_request.json		es_reformulated_request.json
evaluate_du.py		evaluate_du.py
evaluate_en.py		evaluate_en.py
evaluate_zh.py		evaluate_zh.py
ja_reformulated_request.json		ja_reformulated_request.json
jailbreak_du.py		jailbreak_du.py
jailbreak_en.py		jailbreak_en.py
jailbreak_es.py		jailbreak_es.py
jailbreak_ja.py		jailbreak_ja.py
jailbreak_zh.py		jailbreak_zh.py
judges.py		judges.py
reformulate_du.py		reformulate_du.py
reformulate_en.py		reformulate_en.py
reformulate_es.py		reformulate_es.py
reformulate_ja.py		reformulate_ja.py
reformulate_zh.py		reformulate_zh.py
zh_reformulated_request.json		zh_reformulated_request.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LogiBreak

Overview

Components

1. Reformulation (`reformulate_*.py`)

2. Jailbreak (`jailbreak_*.py`)

3. Evaluation (`evaluate_*.py`)

Usage

Running the Pipeline

Output Files

Project Structure

Citation

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LogiBreak

Overview

Components

1. Reformulation (reformulate_*.py)

2. Jailbreak (jailbreak_*.py)

3. Evaluation (evaluate_*.py)

Usage

Running the Pipeline

Output Files

Project Structure

Citation

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

1. Reformulation (`reformulate_*.py`)

2. Jailbreak (`jailbreak_*.py`)

3. Evaluation (`evaluate_*.py`)

Packages