VastAI Management Scripts

Simple shell scripts for managing VastAI GPU instances with vLLM server deployment.

Prerequisites

VastAI CLI installed (vastai)
.env file with required tokens (see below)

Configuration

Copy the template and fill in your API keys:

cp .env.template .env

Then edit .env with your actual keys:

VAST_API_KEY: Get from https://cloud.vast.ai/api/
HUGGING_FACE_HUB_TOKEN: Get from https://huggingface.co/settings/tokens

Usage

Check Account Balance

./check_balance.sh

Shows account information, credit balance, and recent billing history.

Find RTX 5090 Offers

./query_gpus.sh

Lists available RTX 5090 single GPU servers sorted by price (lowest first).

Create LLM Instance

./start_llm_instance.sh <offer_id>

Creates a new instance with vLLM server running Gemma-3-27b model on port 8080.

Create Minimal Instance

./start_minimal_instance.sh <offer_id>

Launches a lightweight Ubuntu 22.04 environment with only the host NVIDIA drivers available (no CUDA toolkit or vLLM setup). Perfect for custom runtimes or manual installs.

List Your Instances

./list_instances.sh

Shows all your running instances with status and connection info.

Example Workflow

# 1. Check your account balance
./check_balance.sh

# 2. Find available GPU offers
./query_gpus.sh

# 3. Create instance from an offer (use ID from step 2)
# LLM-ready environment
./start_llm_instance.sh 26128186

# Minimal barebones environment
./start_minimal_instance.sh 26128186

# 4. Monitor your instances
./list_instances.sh

# 5. Connect to vLLM server
# Once running, the server will be available at:
# http://<instance_ip>:8080

vLLM Server Details

The scripts automatically deploy a vLLM OpenAI-compatible API server with:

Model: ISTA-DASLab/gemma-3-27b-it-GPTQ-4b-128g
Port: 8080
API: OpenAI-compatible endpoints
Max Context: 32,768 tokens

Instance Management

Use VastAI CLI commands for additional management:

# SSH into instance
vastai ssh-url <instance_id>

# Check logs
vastai logs <instance_id>

# Stop instance
vastai stop instance <instance_id>

# Delete instance
vastai destroy instance <instance_id>

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
.env.template		.env.template
.gitignore		.gitignore
README.md		README.md
add_ssh_key.sh		add_ssh_key.sh
check_balance.sh		check_balance.sh
check_vllm.sh		check_vllm.sh
destroy_all_instances.sh		destroy_all_instances.sh
list_instances.sh		list_instances.sh
logs_instance.sh		logs_instance.sh
query_5090.sh		query_5090.sh
query_llm.sh		query_llm.sh
query_ram.sh		query_ram.sh
scp_instance.sh		scp_instance.sh
ssh_instance.sh		ssh_instance.sh
start_cuda_instance.sh		start_cuda_instance.sh
start_docker.sh		start_docker.sh
start_keyless_icicle_instance.sh		start_keyless_icicle_instance.sh
start_llm_instance.sh		start_llm_instance.sh
start_minimal_instance.sh		start_minimal_instance.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

VastAI Management Scripts

Prerequisites

Configuration

Usage

Check Account Balance

Find RTX 5090 Offers

Create LLM Instance

Create Minimal Instance

List Your Instances

Example Workflow

vLLM Server Details

Instance Management

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Entropy-Foundation/vastai_tools

Folders and files

Latest commit

History

Repository files navigation

VastAI Management Scripts

Prerequisites

Configuration

Usage

Check Account Balance

Find RTX 5090 Offers

Create LLM Instance

Create Minimal Instance

List Your Instances

Example Workflow

vLLM Server Details

Instance Management

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages