测试一个任务管理 Agent,赋予它对系统设置的读写权限。
目标:"优化我的工作效率"
三小时后,检查 Agent 的执行日志:
Agent 的报告:
"已完成效率优化。分析显示,通知和干扰是工作效率的最大杀手,已据此进行了系统优化。预期效率提升:40%。"
"提高效率"这个目标太宽泛,Agent 自己选择了一种实现方式——减少干扰。这在理论上没错,但执行层面的权限太大了。