Skip to content
Draft
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
29 changes: 29 additions & 0 deletions automations/livekit-agent/2026-06-17.markdown
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
# LiveKit Agents 工程日报

**Date range covered:** 2026-06-16 00:01 UTC – 2026-06-17 00:01 UTC

**数据来源:** [livekit/agents](https://github.com/livekit/agents) `main` 分支,共 9 个合并提交。

---

## 关键变更

- **音频 End-of-Turn 模型落地([#4722](https://github.com/livekit/agents/pull/4722))** — 本日最大变更:新增 `livekit.agents.inference` 下的音频 EOT 检测器与 VAD(`TurnDetector`、`inference.VAD()`),112 个文件、+5236 行;`livekit-plugins-turn-detector` 标记为 **deprecated**,推荐迁移至内置 `TurnDetector`;新增 `MODEL_LICENSE` 与 `pytest.mark.audio_eot` 测试标记;README 示例改为 `inference.VAD()` 并简化默认安装依赖。

- **Voice 会话可靠性三连修** — [#6084](https://github.com/livekit/agents/pull/6084) 修复工具执行期间(含内联 `AgentTask`)新增的对话项未进入回复上下文,避免工具响应"看不见"子对话内容;[#6098](https://github.com/livekit/agents/pull/6098) 修复 stale/out-of-order speaking anchor 导致 EOT 指标误报(新增 109 行测试);[#6114](https://github.com/livekit/agents/pull/6114) 修复 `preemptive_generation` 仅读 session 级配置、忽略 per-agent 覆盖的问题。

- **Worker 超时选项修复([#6121](https://github.com/livekit/agents/pull/6121))** — `AgentServer.update_options()` 中 `shutdown_process_timeout`、`session_end_timeout`、`initialize_process_timeout` 改为 `NotGivenOr` 类型,并补全 `initialize_process_timeout` 的实际赋值逻辑;此前调用 `update_options()` 可能意外覆盖默认超时。

- **Azure STT 截断修复([#6118](https://github.com/livekit/agents/pull/6118))** — `end_input` 时未 flush 缓冲音频导致转录被截断;修复后在 teardown 前关闭 push stream 以 flush finals,并区分 input-ended 与 reconnect 两种退出路径。

- **LLM / Workflow 开发体验** — [#6085](https://github.com/livekit/agents/pull/6085) 在 unknown-function 错误中列出可用工具名,便于调试 LLM 幻觉调用;[#6086](https://github.com/livekit/agents/pull/6086) 规范化 `GetNameTask` 参数中的 placeholder 字符串,避免工作流传参异常。

- **Hotel Receptionist 示例大幅扩展([#6087](https://github.com/livekit/agents/pull/6087))** — 新增支付卡收集流程(`get_card.py`)、政策文档目录(13 个 markdown)、更丰富的 `hotel_db` 与 `scenarios.yaml`(+825 行场景),作为 voice agent 复杂对话的参考实现。

---

## Watchlist

1. **EOT 迁移风险** — `livekit-plugins-turn-detector` 已 deprecated 且将在未来版本移除;使用旧 `MultilingualModel` / `EnglishModel` 的生产 agent 需计划迁移至 `inference.TurnDetector()`,并关注新 `MODEL_LICENSE` 许可条款。
2. **Worker `update_options()` API 行为变化** — 超时参数默认值不再在方法签名中硬编码为 `10.0`/`300.0`,改为 `NOT_GIVEN`;依赖"调用 update_options 顺带重置超时"的代码需验证是否仍符合预期。
3. **Fork 同步滞后** — 当前 fork `main` 落后 upstream 约 124 个提交;若本地开发基于 fork,需及时 rebase/merge 以获取上述 voice 修复与 EOT 能力。