API 文档

TokenSaver 提供简单的 REST API 和 Proxy 模式，让你可以以最少的改动集成 Token 压缩功能。

集成模式

SDK / Proxy / API

<10ms

响应延迟

平均压缩处理时间

代码示例

import requests

# 使用 API Key 压缩消息
headers = {"X-API-Key": "your-api-key"}

response = requests.post(
    "https://api.tokesave.com/api/v1/compress",
    headers=headers,
    json={
        "model": "gpt-4o",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "Summarize this data"}
        ]
    }
)

result = response.json()
print(f"压缩率: {result['savings_percentage']:.1f}%")
print(f"节省费用: ${result['cost_saved_usd']:.4f}")

API 端点

POST/api/v1/compress

压缩消息数组，返回压缩后的消息和统计信息。

{ "model": "gpt-4o", "messages": [...], "token_budget": 50000 // 可选 }

POST/api/v1/proxy/{provider}

Proxy 模式，自动压缩请求并转发到指定 Provider。

// 支持 provider: openai, anthropic, deepseek, gemini POST /api/v1/proxy/openai/v1/chat/completions

GET/api/v1/usage/stats

获取用户总体用量统计。

GET/api/v1/usage/daily

获取最近 N 天的每日用量统计。

Query: ?days=7 (默认 7 天)

响应格式

{
  "compressed_messages": [...],  // 压缩后的消息数组
  "tokens_before": 10000,         // 原始 Token 数
  "tokens_after": 2000,           // 压缩后 Token 数
  "savings_percentage": 80.0,     // 压缩率
  "transforms_applied": [         // 应用的压缩策略
    "smart_crusher",
    "cache_aligner"
  ],
  "cost_saved_usd": 0.024         // 节省的费用（USD）
}

支持模型

OpenAI

gpt-4ogpt-4o-minigpt-4-turbogpt-3.5-turbo

Anthropic

claude-3-5-sonnetclaude-3-5-haikuclaude-3-opus

DeepSeek

deepseek-chatdeepseek-coder

Google

gemini-1.5-progemini-1.5-flash