Posted 2026-03-06Updated 2026-03-08 Jaco Liu AI / Agentan hour read (About 7225 words)

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

近期在工作闲暇之余一直在反思Agent开发以及相关的方向，Agent智能体开发难吗？在行业不断制造各种概念的今天，说难也难，难在模型本身概率输出的不可控属性，说简单大道至简，一语道破的话，核心就是Prompt的架构艺术。行业造了那么多概念，其实都是围绕着上下文工程展开，开发者还是要守正出奇，多透过现象看本质，不要为了AI而AI让自己陷入拿着锤子找钉子的定式思维模式，也不要过度信任概率模型的能力。

⚠️注意事项：因为是随笔，过于啰嗦，且模型和微调技术发展迭代较快，部分技术时效性上可能存在偏差，以下也只作主流方向和技术性解读。

Posted 2026-02-09Updated 2026-03-05 Jaco Liu AI / Agent29 minutes read (About 4341 words)

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

OpenClaw 的价值在于将现有 AI 技术（LLM 推理 + 工具调用 + 记忆机制）以工程化方式打包成可快速部署的个人智能体平台，加速了 AI Agent 从概念到实用的转化，但其本质仍是技术整合而非范式革命。

有研究证实在同等算力下，串行精炼（sequential refinement）配合逆熵投票（inverse-entropy voting）显著优于并行自洽（parallel self-consistency），并行仅适用于真正独立的子任务，而非需要逻辑依赖的推理。
相对来说 OpenClaw虽然并未带来革命性的解决方案，但提供了一种更接近智能化的工程化实践方案，加速了基于推理和链式决策的智能化解决方案推出。

Posted 2026-01-28Updated 2026-02-17 Jaco Liu AI / Agent11 minutes read (About 1691 words)

基于 Eino 框架构建智能客服 Agent：MCP 与 Skills 的工程化实践初探

注：以下基于 CloudWeGo Eino 框架（v1.2+）最新实践，结合 设计理念深度解读 与 可视化运行流程，完整呈现企业级 Agent 构建方案。。

Posted 2026-01-25Updated 2026-01-30 Jaco Liu AI / Agentan hour read (About 8743 words)

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

本人一直非常欣赏的一句话：

除非经由记忆之路，人不能抵达纵深。 ————汉娜·阿伦特

首先如果基于HEART架构理念，如何设计一个确保数据隐私的AI健康应用架构？相信这在2026开年的今天，以及过去一年甚嚣尘上的各种AI应用开发技术和规范原则鼓吹之下要思考和反思的问题，作为工程师要回归清醒与理智。

Posted 2026-01-25Updated 2026-02-17 Jaco Liu AI / Agent23 minutes read (About 3378 words)

Agent和RAG：双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构？🤔

以典型案例来说：在几乎所有IM客服(电商)交互式对话系统应用中，“所有请求同等对待”是最大的资源浪费。
目前业界共识之一是：双阶段意图识别通过“计算资源动态分配”思想，在96.7%准确率与98ms平均延迟间取得工程最优平衡，也几乎成为Agent系统的事实性标准架构之一。

Posted 2026-01-24Updated 2026-02-17 Jaco Liu AI / Agentan hour read (About 7189 words)

Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南

摘要

在技术语境下，两者的关系可以简单概括和区分为：Agent 是决策中心，Skills 是执行函数。

Posted 2025-12-03Updated 2026-01-30 Jaco Liu AI / Agent39 minutes read (About 5897 words)

Discussion and analysis of Text2SQL technology, the most difficult pain point in the commercial implementation of agents.（Agent 商业落地里最难的痛点 Text2SQL 技术探讨和解析）

Agent 商业落地里最难的是 Text2SQL（NL2SQL），几乎是无法绕开的核心痛点，主要面临的三个核心问题：

为什么到目前为止仍然没有真正可靠的商业共识性企业级解决方案？
实际企业应用场景中，有哪些靠谱的思路和解决方案？

Posted 2025-12-02Updated 2026-01-30 Jaco Liu AI / Agent11 minutes read (About 1694 words)

Ultimate Guide to Quantizing AI Large Language Models: From FP32 to INT4, How to Make Large Models Perform at Full Speed on Consumer Devices?（AI 大语言模型量化终极指南：从 FP32 到 INT4，如何让大模型在消费级设备部署应用及选型？）

——深度解析量化格式、尺寸差异与硬件适配策略（附 M3 Pro 实战指南）

个人常用办公终端设备型号：

Macbook Pro M3 （36G 内存定制款)

小结：

Apple 用户闭眼选 BF16：M3 Pro 芯片的 BF16 性能碾压 FP16，18GB 内存可流畅运行 30B 级模型
⚠️ INT4 是双刃剑：70B 模型塞进 36GB 内存的唯一方案，但精度损失高达 15%+
🔮 未来属于 FP8：NVIDIA H100 已支持，苹果 M4 或成转折点

Posted 2025-10-27Updated 2026-01-30 Jaco Liu AI / Agent31 minutes read (About 4708 words)

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用架构思考和挑战）

“不确定性不是缺陷，而是新范式的特征，必须学会“回忆”，但同时也要学会“遗忘”。”

AI 时代，智能体本身的概率输出让软件走向不确定，或者说更个性。但这对企业级产品的准确率形成巨大挑战，怎么看待这种现状、机遇和商业风险？智能体和传统应用范式下在业务落地间角色和职能的划分和原则?

这是目前 AI 面临的核心问题，触及了 AI 原生时代企业软件架构、产品设计与组织协作的根本性变革和创业者的产品决策方向。

Posted 2025-10-21Updated 2026-01-30 Jaco Liu cloud20 minutes read (About 3072 words)

nanochat-中文翻译版本（含代码注释和文档翻译，方便中文语境快速阅读和查看）

🔗 nanochat-中文翻译版本(含文档和代码注释)

nanochat 项目源码地址

感谢原作者：Andrej karpathy

这个仓库是一个完整的类 ChatGPT 大语言模型（LLM）的全栈实现，采用单一、简洁、最小化、可定制、依赖轻量的代码库。nanochat 设计为通过像speedrun.sh这样的脚本在单个 8XH100 节点上运行，从开始到结束运行整个流程。这包括分词、预训练、微调、评估、推理以及通过简单 UI 提供 Web 服务，让你可以像使用 ChatGPT 一样与你自己的 LLM 对话。nanochat 将成为 Eureka Labs 正在开发的 LLM101n 课程的顶点项目。

关于Agent开发的阶段性思考———从基础原理理解到高阶应用实践的谜思解构

于OpenClaw的设计原理以及技术架构解构分析以及工程实践和安全挑战(仅供参考)

基于 Eino 框架构建智能客服 Agent：MCP 与 Skills 的工程化实践初探

基于 HEART 架构理念的隐私保护AI健康应用设计的一种架构思路实践解决方案

摘要

Agent和RAG：双阶段意图识别以及典型场景(客服)问答场景下准确率与延迟的帕累托最优解解析

首先为什么90%的生产级Agent系统选择这一架构？🤔

Agent 与 Skills 之间的区别通过一个简单图书馆借阅系统案例实践指南

摘要

Discussion and analysis of Text2SQL technology, the most difficult pain point in the commercial implementation of agents.（Agent 商业落地里最难的痛点 Text2SQL 技术探讨和解析）

Agent 商业落地里最难的是 Text2SQL（NL2SQL），几乎是无法绕开的核心痛点，主要面临的三个核心问题：

Ultimate Guide to Quantizing AI Large Language Models: From FP32 to INT4, How to Make Large Models Perform at Full Speed on Consumer Devices?（AI 大语言模型量化终极指南：从 FP32 到 INT4，如何让大模型在消费级设备部署应用及选型？）

Thoughts on Agent-based Enterprise Application Architecture.（Agent 企业级应用架构思考和挑战）

“不确定性不是缺陷，而是新范式的特征，必须学会“回忆”，但同时也要学会“遗忘”。”

nanochat-中文翻译版本（含代码注释和文档翻译，方便中文语境快速阅读和查看）

感谢原作者：Andrej karpathy

CLUSTRMAPS

Links

Archives

Advertisement

Recents

Categories

Tags