Hướng Dẫn Toàn Diện về Token OpenClaw: Sử dụng Mô Hình Mạnh Nhất, Tiết Kiệm Chi Phí Nhất / Bao Gồm Các Gợi Ý

PANews

Tác giả: xiyu

Muốn dùng Claude Opus 4.6 nhưng không muốn cuối tháng hóa đơn bùng nổ? Bài viết này giúp bạn cắt giảm 60-85% chi phí.

Một, token tiêu tốn ở đâu?

Bạn nghĩ token chỉ là “lời bạn nói + phản hồi của AI”? Thực tế còn nhiều hơn thế.

Chi phí ẩn mỗi lần đối thoại:

  • System Prompt (~3000-5000 tokens): lệnh cốt lõi của OpenClaw, không thể thay đổi
  • Tiêm file ngữ cảnh (~3000-14000 tokens): AGENTS.md, SOUL.md, MEMORY.md, v.v., mỗi lần đối thoại đều mang theo — đây là khoản chi phí vô hình lớn nhất
  • Tin nhắn lịch sử: ngày càng dài
  • Input của bạn + Output của AI: đó mới là “tất cả” bạn nghĩ

Một câu hỏi đơn giản như “Hôm nay thời tiết thế nào” thực tế tiêu tốn 8000-15000 input tokens. Dùng Opus tính, chỉ riêng ngữ cảnh đã mất 0.12-0.22 USD.

Cron còn khắc nghiệt hơn: mỗi lần kích hoạt = đối thoại mới = tiêm toàn bộ ngữ cảnh lại. Một cron chạy mỗi 15 phút, 96 lần/ngày, với Opus một ngày tốn 10-20 USD.

Heartbeat cũng tương tự: về bản chất là gọi đối thoại, khoảng cách ngắn hơn càng tốn kém.

Hai, phân tầng mô hình: Sonnet hàng ngày, Opus quan trọng

Cách tiết kiệm tiền lớn nhất, hiệu quả nhất. Sonnet giá khoảng 1/5 Opus, đáp ứng 80% nhiệm vụ hàng ngày.

提示词:

Hãy giúp tôi đổi mô hình mặc định của OpenClaw thành Claude Sonnet,

Chỉ dùng Opus khi cần phân tích sâu hoặc sáng tạo.

Cần cụ thể:

1) Đặt mô hình mặc định là Sonnet

2) Cron mặc định dùng Sonnet

3) Chỉ định Opus cho các nhiệm vụ viết lách, phân tích sâu

**场景 Opus:** viết bài dài, mã phức tạp, suy luận nhiều bước, nhiệm vụ sáng tạo

**场景 Sonnet:** trò chuyện hàng ngày, hỏi đáp đơn giản, kiểm tra cron, heartbeat, thao tác file, dịch thuật

**Thực tế: **Sau khi chuyển đổi, chi phí tháng giảm 65%, trải nghiệm gần như không khác.

Ba, thu gọn ngữ cảnh: cắt bỏ các token ẩn lớn

Mỗi lần gọi là “tín hiệu nền” có thể tiêu tốn 3000-14000 tokens. Tối ưu nhất là giảm thiểu tiêm file.

提示词:

Hãy giúp tôi tối ưu ngữ cảnh của OpenClaw để tiết kiệm token.

Cụ thể:

1) Xóa bớt phần không cần thiết trong AGENTS.md (quy tắc nhóm chat, TTS, chức năng không dùng), giữ dưới 800 tokens

2) Rút ngắn SOUL.md thành các điểm chính, 300-500 tokens

3) Dọn dẹp MEMORY.md, loại bỏ thông tin hết hạn, giữ dưới 2000 tokens

4) Kiểm tra cấu hình workspaceFiles, loại bỏ file không cần thiết

Kinh nghiệm: Mỗi giảm 1000 tokens tiêm vào, dựa trên 100 lần gọi/ngày, tháng tiết kiệm khoảng 45 USD.

Bốn, tối ưu Cron: thủ phạm ẩn ít ai biết

提示词:帮我优化 OpenClaw 的 cron 任务以节约 token。

Yêu cầu:

1) Liệt kê tất cả cron và tần suất, mô hình dùng

2) Hạ cấp các nhiệm vụ không sáng tạo xuống Sonnet

3) Gộp các nhiệm vụ cùng thời điểm (ví dụ nhiều kiểm tra thành một)

4) Giảm tần suất không cần thiết (kiểm tra hệ thống từ 10 phút xuống 30 phút, kiểm tra phiên bản từ 3 lần/ngày xuống 1 lần/ngày)

5) Cấu hình delivery thành thông báo theo yêu cầu, bình thường không gửi tin

Nguyên tắc cốt lõi: Không cần thiết phải chạy quá thường, đa số yêu cầu "thời gian thực" là giả. Gộp 5 kiểm tra riêng thành 1 lần gọi, tiết kiệm 75% chi phí ngữ cảnh.

Năm, tối ưu Heartbeat

提示词:帮我优化 OpenClaw heartbeat 配置:

1) Khoảng cách làm việc 45-60 phút

2) Thời gian im lặng từ 23:00-08:00

3) Rút ngắn HEARTBEAT.md tối đa

4) Gộp các kiểm tra phân tán vào một lần batch trong heartbeat

Sáu, truy vấn chính xác: dùng qmd tiết kiệm 90% input token

Khi agent tra dữ liệu, mặc định “đọc toàn bộ” — một file 500 dòng 3000-5000 tokens, nhưng chỉ cần 10 dòng. 90% input token bị lãng phí.

qmd là công cụ truy vấn ngữ nghĩa cục bộ, xây dựng toàn bộ nội dung + chỉ mục vector, giúp agent định vị chính xác đoạn cần, không đọc toàn bộ file. Tất cả tính toán nội bộ, không tốn API.

Kết hợp mq (Mini Query): xem trước cấu trúc thư mục, trích xuất đoạn chính xác, tìm kiếm từ khóa — mỗi lần chỉ đọc 10-30 dòng cần thiết.

提示词:

Hãy giúp tôi cấu hình qmd để tiết kiệm token.

Github: https://github.com/tobi/qmd

Yêu cầu:

1) Cài đặt qmd

2) Tạo chỉ mục cho thư mục làm việc

3) Trong AGENTS.md thêm quy tắc truy vấn, bắt agent ưu tiên dùng qmd/mq thay vì đọc toàn bộ

4) Đặt lịch cập nhật chỉ mục tự động

Thực tế: mỗi lần tra dữ liệu giảm từ 15000 tokens xuống còn 1500 tokens, giảm 90%.

Khác biệt với memorySearch: memorySearch "hồi tưởng" (MEMORY.md), qmd "tra dữ liệu" (kiến thức tùy chỉnh), không ảnh hưởng nhau.

Bảy, chọn Memory Search phù hợp

提示词:帮我配置 OpenClaw 的 memorySearch。

Nếu tập tin ghi nhớ của tôi ít (chục file md),

Nên dùng nhúng nội bộ hay Voyage AI?

Giải thích chi phí và chất lượng truy vấn từng loại.

**Kết luận đơn giản:** ít file dùng nhúng nội bộ (0 phí), nhiều file hoặc đa ngôn ngữ dùng Voyage AI (mỗi tài khoản miễn 2 tỷ token).

Tám, danh sách cấu hình tối ưu toàn diện

提示词:

Hãy giúp tôi tối ưu toàn bộ cấu hình OpenClaw để tiết kiệm tối đa token theo danh sách sau:

- Đổi mô hình mặc định thành Sonnet, chỉ dùng Opus cho nhiệm vụ sáng tạo/phân tích

- Rút ngắn AGENTS.md / SOUL.md / MEMORY.md

- Giảm cấp tất cả cron xuống Sonnet + gộp + giảm tần suất

- Heartbeat cách 45 phút + im lặng ban đêm

- Cấu hình qmd thay thế đọc toàn bộ

- Chỉ giữ các file cần thiết trong workspaceFiles

- Dọn dẹp định kỳ MEMORY.md, giữ dưới 2000 tokens

**Lợi ích lâu dài:**

1. Phân tầng mô hình — Sonnet hàng ngày, Opus quan trọng, tiết kiệm 60-80%

2. Thu gọn ngữ cảnh — tối ưu file + qmd, giảm 30-90% input token

3. Giảm gọi — gộp cron, kéo dài heartbeat, bật chế độ im lặng

Sonnet 4 đã rất mạnh, dùng cho hàng ngày không khác biệt nhiều. Khi cần Opus, chuyển sang là xong.

*Dựa trên kinh nghiệm thực chiến hệ thống đa agent, số liệu ước tính đã được làm mượt.*
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận