AI 资讯 - 硅基世界

Hacker News 2026-04-28

据《The Information》报道，谷歌已签署一项机密协议，允许美国国防部将其人工智能模型用于“任何合法的政府目的”。该协议据报道不到 d

The Verge 2026-04-28

去年 8 月，业内一些最优秀的网络安全团队齐聚拉斯维加斯，在 DARPA 人工智能网络挑战赛上展示了他们的 AI 错误查找系统的实力（

The Verge 2026-04-28

《连线》杂志采访了彭博社的首席技术官，讨论了这个标志性交易平台即将发生的、聊天机器人式的重大变化。

WIRED 2026-04-28

arXiv:2604.22934v1 公告类型：新摘要：基于 LLM 的文本到 SQL 代理经常会在延迟与性能之间进行权衡，其中性能的提高是以延迟或反之为代价的。

ArXiv 2026-04-28

arXiv:2604.23027v1 公告类型：新摘要：大型语言模型 (LLM) 已成为现代人工智能工作流程的核心，为从开放式文本生成到复杂的基于代理的 R 等应用程序提供支持。

ArXiv 2026-04-28

arXiv:2604.23049v1 公告类型：新摘要：人工智能代理越来越多地被部署来执行任务并在代理工作流程中做出决策，从而引入了安全和受控的新要求

ArXiv 2026-04-28

arXiv:2604.23057v1 公告类型：新摘要：我们研究显式信念图是否可以提高协作多智能体推理中的法学硕士性能。通过 4 个国家/地区 3,000 多项对照试验

ArXiv 2026-04-28

arXiv:2604.23072v1 公告类型：新摘要：大型语言模型（LLM）代理越来越多地承担复杂的现实世界分析（例如，金融预测、科学发现）的任务，但

ArXiv 2026-04-28

arXiv:2604.23090v1 公告类型：新摘要：从非结构化自然语言自动生成形式本体仍然是知识工程的核心挑战。虽然大语言

ArXiv 2026-04-28

arXiv:2604.23148v1 公告类型：新摘要：基于 AR-LLM 的社会工程 (AR-LLM-SE) 攻击（例如 SEAR）的新威胁给现实世界的社交互动带来了重大风险。在 s

ArXiv 2026-04-28

arXiv:2604.23178v1 公告类型：新摘要：LLM 作为法官已成为评估语言模型输出的主导范式，但 LLM 法官表现出系统性偏见，损害了评估结果。

ArXiv 2026-04-28

arXiv:2604.23194v1 公告类型：新摘要：基于大型语言模型的代理最近已成为解决动态和多步骤任务的强大方法。大多数现有代理商都雇用 pl

ArXiv 2026-04-28

arXiv:2604.23270v1 公告类型：新摘要：思想链（CoT）提示已成为一种从大型语言模型（LLM）中引出逐步解决方案的简单有效的方法。然而，

ArXiv 2026-04-28

arXiv:2604.23278v1 公告类型：新摘要：代理人工智能的激增已经超过了描述计算系统中代理所需的概念工具的速度。普雷瓦利

ArXiv 2026-04-28