快速开始

  • 概述
  • 安装
  • 认证

API 参考

  • 压缩接口
  • Proxy 模式
  • 用量统计

SDK

  • Python
  • JavaScript/TypeScript
  • Go

API 文档

TokenSaver 提供简单的 REST API 和 Proxy 模式,让你可以以最少的改动集成 Token 压缩功能。

3
集成模式
SDK / Proxy / API
<10ms
响应延迟
平均压缩处理时间

代码示例

import requests

# 使用 API Key 压缩消息
headers = {"X-API-Key": "your-api-key"}

response = requests.post(
    "https://api.tokesave.com/api/v1/compress",
    headers=headers,
    json={
        "model": "gpt-4o",
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "Summarize this data"}
        ]
    }
)

result = response.json()
print(f"压缩率: {result['savings_percentage']:.1f}%")
print(f"节省费用: ${result['cost_saved_usd']:.4f}")

API 端点

POST/api/v1/compress

压缩消息数组,返回压缩后的消息和统计信息。

{ "model": "gpt-4o", "messages": [...], "token_budget": 50000 // 可选 }
POST/api/v1/proxy/{provider}

Proxy 模式,自动压缩请求并转发到指定 Provider。

// 支持 provider: openai, anthropic, deepseek, gemini POST /api/v1/proxy/openai/v1/chat/completions
GET/api/v1/usage/stats

获取用户总体用量统计。

GET/api/v1/usage/daily

获取最近 N 天的每日用量统计。

Query: ?days=7 (默认 7 天)

响应格式

{
  "compressed_messages": [...],  // 压缩后的消息数组
  "tokens_before": 10000,         // 原始 Token 数
  "tokens_after": 2000,           // 压缩后 Token 数
  "savings_percentage": 80.0,     // 压缩率
  "transforms_applied": [         // 应用的压缩策略
    "smart_crusher",
    "cache_aligner"
  ],
  "cost_saved_usd": 0.024         // 节省的费用(USD)
}

支持模型

OpenAI
gpt-4ogpt-4o-minigpt-4-turbogpt-3.5-turbo
Anthropic
claude-3-5-sonnetclaude-3-5-haikuclaude-3-opus
DeepSeek
deepseek-chatdeepseek-coder
Google
gemini-1.5-progemini-1.5-flash