Tác giả: xiyu
Muốn dùng Claude Opus 4.6 nhưng không muốn cuối tháng hóa đơn bùng nổ? Bài viết này giúp bạn cắt giảm 60-85% chi phí.
Bạn nghĩ token chỉ là “lời bạn nói + phản hồi của AI”? Thực tế còn nhiều hơn thế.
Chi phí ẩn mỗi lần đối thoại:
Một câu hỏi đơn giản như “Hôm nay thời tiết thế nào” thực tế tiêu tốn 8000-15000 input tokens. Dùng Opus tính, chỉ riêng ngữ cảnh đã mất 0.12-0.22 USD.
Cron còn khắc nghiệt hơn: mỗi lần kích hoạt = đối thoại mới = tiêm toàn bộ ngữ cảnh lại. Một cron chạy mỗi 15 phút, 96 lần/ngày, với Opus một ngày tốn 10-20 USD.
Heartbeat cũng tương tự: về bản chất là gọi đối thoại, khoảng cách ngắn hơn càng tốn kém.
Cách tiết kiệm tiền lớn nhất, hiệu quả nhất. Sonnet giá khoảng 1/5 Opus, đáp ứng 80% nhiệm vụ hàng ngày.
提示词:
Hãy giúp tôi đổi mô hình mặc định của OpenClaw thành Claude Sonnet,
Chỉ dùng Opus khi cần phân tích sâu hoặc sáng tạo.
Cần cụ thể:
1) Đặt mô hình mặc định là Sonnet
2) Cron mặc định dùng Sonnet
3) Chỉ định Opus cho các nhiệm vụ viết lách, phân tích sâu
**场景 Opus:** viết bài dài, mã phức tạp, suy luận nhiều bước, nhiệm vụ sáng tạo
**场景 Sonnet:** trò chuyện hàng ngày, hỏi đáp đơn giản, kiểm tra cron, heartbeat, thao tác file, dịch thuật
**Thực tế: **Sau khi chuyển đổi, chi phí tháng giảm 65%, trải nghiệm gần như không khác.
Mỗi lần gọi là “tín hiệu nền” có thể tiêu tốn 3000-14000 tokens. Tối ưu nhất là giảm thiểu tiêm file.
提示词:
Hãy giúp tôi tối ưu ngữ cảnh của OpenClaw để tiết kiệm token.
Cụ thể:
1) Xóa bớt phần không cần thiết trong AGENTS.md (quy tắc nhóm chat, TTS, chức năng không dùng), giữ dưới 800 tokens
2) Rút ngắn SOUL.md thành các điểm chính, 300-500 tokens
3) Dọn dẹp MEMORY.md, loại bỏ thông tin hết hạn, giữ dưới 2000 tokens
4) Kiểm tra cấu hình workspaceFiles, loại bỏ file không cần thiết
Kinh nghiệm: Mỗi giảm 1000 tokens tiêm vào, dựa trên 100 lần gọi/ngày, tháng tiết kiệm khoảng 45 USD.
提示词:帮我优化 OpenClaw 的 cron 任务以节约 token。
Yêu cầu:
1) Liệt kê tất cả cron và tần suất, mô hình dùng
2) Hạ cấp các nhiệm vụ không sáng tạo xuống Sonnet
3) Gộp các nhiệm vụ cùng thời điểm (ví dụ nhiều kiểm tra thành một)
4) Giảm tần suất không cần thiết (kiểm tra hệ thống từ 10 phút xuống 30 phút, kiểm tra phiên bản từ 3 lần/ngày xuống 1 lần/ngày)
5) Cấu hình delivery thành thông báo theo yêu cầu, bình thường không gửi tin
Nguyên tắc cốt lõi: Không cần thiết phải chạy quá thường, đa số yêu cầu "thời gian thực" là giả. Gộp 5 kiểm tra riêng thành 1 lần gọi, tiết kiệm 75% chi phí ngữ cảnh.
提示词:帮我优化 OpenClaw heartbeat 配置:
1) Khoảng cách làm việc 45-60 phút
2) Thời gian im lặng từ 23:00-08:00
3) Rút ngắn HEARTBEAT.md tối đa
4) Gộp các kiểm tra phân tán vào một lần batch trong heartbeat
Khi agent tra dữ liệu, mặc định “đọc toàn bộ” — một file 500 dòng 3000-5000 tokens, nhưng chỉ cần 10 dòng. 90% input token bị lãng phí.
qmd là công cụ truy vấn ngữ nghĩa cục bộ, xây dựng toàn bộ nội dung + chỉ mục vector, giúp agent định vị chính xác đoạn cần, không đọc toàn bộ file. Tất cả tính toán nội bộ, không tốn API.
Kết hợp mq (Mini Query): xem trước cấu trúc thư mục, trích xuất đoạn chính xác, tìm kiếm từ khóa — mỗi lần chỉ đọc 10-30 dòng cần thiết.
提示词:
Hãy giúp tôi cấu hình qmd để tiết kiệm token.
Github: https://github.com/tobi/qmd
Yêu cầu:
1) Cài đặt qmd
2) Tạo chỉ mục cho thư mục làm việc
3) Trong AGENTS.md thêm quy tắc truy vấn, bắt agent ưu tiên dùng qmd/mq thay vì đọc toàn bộ
4) Đặt lịch cập nhật chỉ mục tự động
Thực tế: mỗi lần tra dữ liệu giảm từ 15000 tokens xuống còn 1500 tokens, giảm 90%.
Khác biệt với memorySearch: memorySearch "hồi tưởng" (MEMORY.md), qmd "tra dữ liệu" (kiến thức tùy chỉnh), không ảnh hưởng nhau.
提示词:帮我配置 OpenClaw 的 memorySearch。
Nếu tập tin ghi nhớ của tôi ít (chục file md),
Nên dùng nhúng nội bộ hay Voyage AI?
Giải thích chi phí và chất lượng truy vấn từng loại.
**Kết luận đơn giản:** ít file dùng nhúng nội bộ (0 phí), nhiều file hoặc đa ngôn ngữ dùng Voyage AI (mỗi tài khoản miễn 2 tỷ token).
提示词:
Hãy giúp tôi tối ưu toàn bộ cấu hình OpenClaw để tiết kiệm tối đa token theo danh sách sau:
- Đổi mô hình mặc định thành Sonnet, chỉ dùng Opus cho nhiệm vụ sáng tạo/phân tích
- Rút ngắn AGENTS.md / SOUL.md / MEMORY.md
- Giảm cấp tất cả cron xuống Sonnet + gộp + giảm tần suất
- Heartbeat cách 45 phút + im lặng ban đêm
- Cấu hình qmd thay thế đọc toàn bộ
- Chỉ giữ các file cần thiết trong workspaceFiles
- Dọn dẹp định kỳ MEMORY.md, giữ dưới 2000 tokens
**Lợi ích lâu dài:**
1. Phân tầng mô hình — Sonnet hàng ngày, Opus quan trọng, tiết kiệm 60-80%
2. Thu gọn ngữ cảnh — tối ưu file + qmd, giảm 30-90% input token
3. Giảm gọi — gộp cron, kéo dài heartbeat, bật chế độ im lặng
Sonnet 4 đã rất mạnh, dùng cho hàng ngày không khác biệt nhiều. Khi cần Opus, chuyển sang là xong.
*Dựa trên kinh nghiệm thực chiến hệ thống đa agent, số liệu ước tính đã được làm mượt.*