MDARK
2025 年 7 月 ~ 9 月

科技周报|让提示词自己进化; 在线画 ASCII 流程图神器;人机协作的AI代理框架

「科技周报」是 「Koala 聊开源」频道的一个系列,旨在追踪、报道和简析最新科技动态和趋势,自 2022年1月16日起每周日发布。大家可以访问「Koala 聊开源」官网 https://koala-oss.app 的「科技周报」数据库,搜索查询已发布项目的图文。 本期 Hacker Newsletter 地址:https://buttondown.com/hacker-newsletter/archive/hacker-newsletter-761/

了解科技资讯,把握行业脉搏,大家好,我是Koala。欢迎收看科技周报。

GEPPA:大模型提示词优化器

DSpy 集成的名为 GEPPA 的反思性提示优化器。这个工具能够让 AI 系统自我反思和改进提示词。GEPPA 通过分析 AI 程序的执行轨迹,识别哪些部分表现良好,哪些需要改进,然后提出新的提示词建议。

与传统的强化学习方法不同,GEPPA 可以利用文本反馈,而非仅仅依赖数字指标,因此能在很少的迭代中就找到高效的提示词。Koala 认为,提示工程正在从手工艺变成工程学学科。自动化优化是必然趋势,不过这类工具的实际效果往往高度依赖具体的应用场景,通用性仍然是个挑战。


ASCII Flow:在线 ASCII 流程图绘制工具

ASCII Flow 是一个基于浏览器的文本图表绘制工具,让用户在无限画布上创建流程图和架构图。这个工具提供了方框、箭头、线条、文本和自由绘制的功能,支持 ASCII 和扩展字符集。

完成绘制后,可以直接复制到剪贴板,或保存为纯文本格式。开发者们特别喜欢用它来制作代码注释中的图表,因为 ASCII 图表可以直接嵌入到任何文本环境中。Koala 认为,在各种现代图表工具泛滥的今天,ASCII 图表反而显得别有一番使用价值。简单、轻量、兼容性强,这些特点让它在技术文档领域依然有一席之地。


Human Layer:人机协作 AI 代理框架

Human Layer 提供了一个独特的 AI 代理框架,允许开发者在 AI 执行特定操作前,强制要求人类审批。这个系统通过装饰器的方式,让开发者可以标记哪些函数调用需要人工确认。被拒绝时,还能将反馈传递给 AI 模型。

除了审批机制,Human Layer 还支持 AI 主动联系人类获取建议和帮助,从而实现尊重的、人机协作的工作流。Koala 认为,对于 Copilot 模式的 AI 代理,Human Layer 会是一个不错的通用型实现,能够减少重复的开发工作。


Maximo:类型安全的 HTTP 客户端生成工具

Maximo 是一个专注于生成类型安全 HTTP 客户端的工具。支持从 OpenAPI 和 GraphQL Schema 自动生成 TypeScript 类型安全。这个工具的亮点在于平台优化策略。对 Node.js 环境生成基于高性能 Undici Code 的客户端。为浏览器环境,则使用原生 Fetch API。

开发者只需一条 CLI 命令就能生成完整的客户端代码,包含连接池、HTTP/2 支持和错误处理等生产级特性。Koala 认为,API 客户端生成并非新鲜概念,但 Maximo 在性能优化和平台适配上确实用了心思。作者身为 Node.js Core Team Members 身份也提供了背书。不过,在 Swagger CodeGen 和 OpenAPI Generator 已经占据主流的情况下,新工具想要突围还需要更多差异化优势。


MediaMonk:浏览器端音视频处理库

MediaMonk 是一个 JavaScript 库,专门用于在浏览器端处理视频和音频文件。它能够读取、写入和转换多种媒体格式,支持从 MP4 到 WMV 的各种常见格式。这个库最大的卖点是性能。官方数据显示,其处理速度远超同类工具,比如在元数据提取方面比竞品快了几十倍。

该项目采用 MPL 2.0 开源协议,完全用 TypeScript 编写,且零依赖。Koala 认为,把复杂的媒体处理搬到浏览器端确实是个有趣的 L2 方向。MediaMonk 对在线音视频编辑的场景是一个不错的补充。


BadBot:AI 桌面代理项目

BadBot 是一个开源的 AI 桌面代理项目,为 AI 提供了一个完整的 Ubuntu 虚拟桌面环境。与仅限于浏览器的 AI 工具不同,BadBot 能够控制鼠标键盘,使用任意桌面应用程序,处理文件系统操作,甚至通过密码管理器自动登录各种服务。

用户可以通过自然语言下达任务,比如下载所有供应商门户的发票并整理到文件夹。AI 就会自动打开浏览器,处理认证,下载文件并组织整理。Koala 认为,给 AI 一个完整的操作系统环境确实能解锁更多可能性。不过实际部署的复杂性和安全风险也相应增加。企业级应用还需要考虑更多安全隔离措施。


以上就是本期科技周报的全部内容,谢谢你的收看。如果内容对您有帮助,请一键三连支持我们。

Leave comment