Ai có thể giải mã được "Token Bill"?

II. "Tỷ lệ truy cập bộ nhớ cache" ảnh hưởng đến giá cả

Bên cạnh hộp đen của sự biến động trong "nội dung trí tuệ", còn có một cấu trúc chi phí ẩn giấu hơn bên dưới bảng giá.

Vào tháng 2 năm 2026, một bản cập nhật cho Claude Code đã gây ra sự sụt giảm đáng kể về tỷ lệ truy cập bộ nhớ cache của các nền tảng bên thứ ba. Điều này dẫn đến những câu hỏi về việc liệu Anthropic có cố tình làm gián đoạn việc lưu trữ bộ nhớ cache của các mô hình bên thứ ba hay không.

Một kỹ sư đã sử dụng các công cụ AI để tải xuống mã nguồn của 11 phiên bản Claude Code, từ v2.1.0 đến v2.1.41, và phân tích chúng từng cái một. Kết luận là: không có logic cố ý nào trong mã để phá vỡ các mô hình của bên thứ ba.

Tuy nhiên, bắt đầu từ phiên bản v2.1.23, Claude Code đã giới thiệu cơ chế bộ nhớ đệm theo khối dành riêng cho Claude. Các tối ưu hóa như "chia sẻ toàn cầu giữa các phiên và hiệu lực 1 giờ" đã thay đổi cấu trúc của lời nhắc hệ thống. API của các mô hình bên thứ ba không thể nhận ra các dấu hiệu này và chỉ có thể dựa vào việc khớp tiền tố cơ bản. Tuy nhiên, tiền tố rất không ổn định do những thay đổi liên tục về số phiên bản, thời gian xây dựng và các biến thử nghiệm A/B. Nói một cách đơn giản hơn, Anthropic không cố ý "đầu độc" hệ thống, nhưng trong quá trình tối ưu hóa hiệu quả của mô hình riêng, họ đã vô tình làm gián đoạn các điều kiện lưu trữ mà các mô hình bên thứ ba dựa vào. Mặc dù không cố ý, sự cố này làm nổi bật một điểm quan trọng: tỷ lệ truy cập bộ nhớ đệm quyết định số tiền bạn phải trả cho token. Dữ liệu theo dõi việc sử dụng Claude Code của một nhà phát triển trong hơn một tuần cho thấy rằng, trong điều kiện bình thường, 91% token đến từ việc truy cập thành công vào bộ nhớ cache, với giá mỗi lần truy cập chỉ bằng một phần mười giá nhập liệu tiêu chuẩn. Nếu bộ nhớ cache bị vô hiệu hóa hoàn toàn, chi phí nhập liệu sẽ tăng vọt lên gấp 5,7 lần so với chi phí ban đầu. Boris Cherny, người tạo ra Claude Code, chính ông cũng thừa nhận: "Khi sử dụng cửa sổ ngữ cảnh 1 triệu, chi phí truy cập thất bại vào bộ nhớ cache rất cao. Nếu bạn rời máy tính hơn một giờ và sau đó tiếp tục phiên làm việc cũ, bạn thường sẽ không nhận được bất kỳ lần truy cập thành công nào vào bộ nhớ cache." Ngoài ra còn có những chi tiết đáng chú ý khác. Một phân tích đang lan truyền trong cộng đồng cho rằng Claude Code âm thầm giảm thời gian lưu trữ bộ nhớ cache từ 1 giờ xuống 5 phút sau khi phát hiện người dùng đã vào chế độ "Sử dụng vượt mức". Nói cách khác, nếu bạn dừng lại hơn 5 phút, quá trình xây dựng lại ngữ cảnh hoàn chỉnh sẽ được kích hoạt và chi phí sẽ được trừ trực tiếp từ số dư dư thừa. Theo các báo cáo truyền thông, vào tháng 4, một số người dùng Pro đã báo cáo rằng họ chỉ có thể đăng hai gợi ý trên Claude Code trong vòng 5 giờ. Một người dùng thẳng thắn tuyên bố: "Cho đến khi các lỗi bộ nhớ đệm này được khắc phục, bất kỳ cuộc thảo luận nào về TTL 5 phút hoặc 1 giờ đều vô nghĩa, bởi vì các con số hoàn toàn sai." Ví dụ về tỷ lệ truy cập bộ nhớ đệm cho thấy ngay cả với cùng một kết quả (giá trị), giá phải trả có thể biến động mạnh. III. Vũng lầy ngân sách đằng sau sự sụt giảm giá 300 lần Theo dữ liệu ngành, giá mỗi token đã giảm khoảng 300 lần trong ba năm, nhưng chi tiêu cho AI của các công ty thậm chí còn khó kiểm soát hơn. Lý do rất đơn giản: sự sụt giảm giá không thể theo kịp sự tăng trưởng bùng nổ về mức độ sử dụng.

Hình: Trong hơn ba năm, giá của Token LLM đã giảm khoảng 300 lần—nhưng sự sụp đổ về giá này không làm cho chi tiêu AI của doanh nghiệp trở nên dễ dự đoán hơn. (Nguồn: TokenCost)

Các ứng dụng dựa trên tác nhân cho phép AI tự động thực hiện các tác vụ phức tạp, chuỗi dài, với một giao dịch duy nhất có thể tốn kém hơn hàng chục lần so với đối thoại truyền thống.

IV. Ngành công nghiệp đang tìm kiếm một "điểm neo" về giá

Quay trở lại câu hỏi cốt lõi: Ai có thể tính toán chính xác giá trị của một token?

Trong ngắn hạn, không ai có thể. Giá của một token là minh bạch, nhưng chất lượng trí tuệ mà nó trao đổi lại biến động. Chi phí thực sự đằng sau nó được tính chồng lên nhau bởi bộ nhớ đệm, thiết kế khung và hiệu quả năng lượng tính toán, và giá trị kinh doanh mà nó tạo ra thay đổi tùy thuộc vào kịch bản.

Một đơn vị đo lường mang quá nhiều khía cạnh không chắc chắn cho thấy rằng nó chưa thể trở thành tiêu chuẩn đo lường cho kỷ nguyên AI.

Token chưa trở thành một loại hàng hóa có thể được định giá theo cách chuẩn hóa. Chúng là một đơn vị kế toán tạm thời mà mọi người phải sử dụng trước khi ngành công nghiệp AI tìm ra một điểm neo giá trị.

Hiện tại, việc định giá token trong ngành về cơ bản là định giá "quyền sử dụng sức mạnh tính toán"—mua cơ hội để mô hình "suy nghĩ" thay bạn. Suy nghĩ đó sâu sắc hay tốt đến mức nào, và liệu cuối cùng nó có giải quyết được vấn đề của bạn hay không, nằm ngoài phạm vi của lời hứa về giá này. Tính hợp lý của phương pháp định giá này hiện không thể được bất kỳ bên nào đánh giá độc lập. Các nhà cung cấp không thể đo lường giá trị kinh doanh của sản phẩm đầu ra đối với người dùng, người dùng không thể hiểu được quá trình suy luận của mô hình để xác định xem mỗi token có "đáng giá với mức giá của nó" hay không, và các nhà đầu tư chỉ nhìn thấy đường cong tăng trưởng tiêu thụ chứ không thấy tỷ lệ chuyển đổi giá trị của mỗi token. Cuối cùng, điều thực sự có thể xác định giá trị của token có thể là việc tìm ra "đơn vị sản phẩm đầu ra" mà khách hàng sẵn sàng trả tiền, xác định năng suất thực sự của trí tuệ nhân tạo, và quản lý nội bộ mối quan hệ chuyển đổi giữa chi phí token và chi phí sức mạnh tính toán ở mức độ có thể dự đoán được.

Trump huy động được 7,5 triệu đô la tiền quyên góp tiền điện tử trong khi Elon Musk đóng góp 75 triệu đô la để hỗ trợ

Donald Trump đã huy động được khoảng 7,5 triệu đô la tiền quyên góp bằng tiền điện tử cho chiến dịch tranh cử tổng thống năm 2024 của mình, với các khoản đóng góp lớn đến từ Bitcoin, Ether và XRP. Dòng tiền quyên góp bằng tiền điện tử phản ánh sự thay đổi của ông từ một người chỉ trích sang một ứng cử viên ủng hộ tiền điện tử, nhận được sự ủng hộ từ những nhân vật chủ chốt trong ngành.

AnaisThg 10 17, 2024 4:26 ch

Ai có thể giải mã được "Token Bill"?

II. "Tỷ lệ truy cập bộ nhớ cache" ảnh hưởng đến giá cả

IV. Ngành công nghiệp đang tìm kiếm một "điểm neo" về giá

Cập nhật trực tiếp

Tin tức xu hướng

萨尔瓦多民调：92%的人未使用比特币交易，仅1.3%认为比特币代表未来

马斯克再掀选战风云！捐7500万美元力挺川普，六天密集宾州助选演讲冲刺民调

特朗普家族DeFi项目WLFI代币公售遇冷，仅售出4%，募资目标远未达成

Trump huy động được 7,5 triệu đô la tiền quyên góp tiền điện tử trong khi Elon Musk đóng góp 75 triệu đô la để hỗ trợ

Tỷ lệ trộm cắp tăng đột biến 84% trên các nền tảng tiền điện tử khiến các cơ quan quản lý thị trường EU yêu cầu các nguyên tắc an ninh mạng chặt chẽ hơn

Cựu giám đốc kỹ thuật FTX kháng cáo xin khoan hồng do vai trò "hạn chế" trước ngày tuyên án 30 tháng 10

Vitalik Buterin tiết lộ lộ trình đầy tham vọng để đưa Ethereum vượt qua 100.000 TPS

Ambient Finance giành lại quyền kiểm soát trang web bị tấn công nhưng cảnh báo người dùng hãy kiên nhẫn: Liệu làn sóng tấn công mạng này có bao giờ kết thúc?

Vitalik Buterin 展望"The Surge"：以太坊 TPS 突破 10 万，L2 跨链互通性迎重大飞跃，Rollups 技术再升级

海关强化电子设备检查，冷钱包成风险！中国出入境必备资产安全指南