深度解析 AI 资讯 社区

AI 资讯

每日自动聚合多个来源的最新 AI 论文与技术动态

谁拥有 Claude Code 编写的代码?

评论

Hacker News 2026-04-28

据报道,谷歌和五角大楼就“任何合法”使用人工智能达成协议

据《The Information》报道,谷歌已签署一项机密协议,允许美国国防部将其人工智能模型用于“任何合法的政府目的”。 该协议据报道不到 d

The Verge 2026-04-28

杀手脚本小子的攻击

去年 8 月,业内一些最优秀的网络安全团队齐聚拉斯维加斯,在 DARPA 人工智能网络挑战赛上展示了他们的 AI 错误查找系统的实力(

The Verge 2026-04-28

不管你喜欢与否,彭博终端正在进行人工智能改造

《连线》杂志采访了彭博社的首席技术官,讨论了这个标志性交易平台即将发生的、聊天机器人式的重大变化。

WIRED 2026-04-28

PExA:复杂文本到 SQL 的并行探索代理

arXiv:2604.22934v1 公告类型:新 摘要:基于 LLM 的文本到 SQL 代理经常会在延迟与性能之间进行权衡,其中性能的提高是以延迟或反之为代价的。

ArXiv 2026-04-28

大型语言模型调试的系统方法

arXiv:2604.23027v1 公告类型:新 摘要:大型语言模型 (LLM) 已成为现代人工智能工作流程的核心,为从开放式文本生成到复杂的基于代理的 R 等应用程序提供支持。

ArXiv 2026-04-28

用于代理工作流程中受控自主的解耦人在环系统

arXiv:2604.23049v1 公告类型:新 摘要:人工智能代理越来越多地被部署来执行任务并在代理工作流程中做出决策,从而引入了安全和受控的新要求

ArXiv 2026-04-28

不要让法学硕士阅读图表:让图表思考

arXiv:2604.23057v1 公告类型:新 摘要:我们研究显式信念图是否可以提高协作多智能体推理中的法学硕士性能。 通过 4 个国家/地区 3,000 多项对照试验

ArXiv 2026-04-28

Analytica:用于稳健且可扩展的法学硕士驱动分析的软命题推理

arXiv:2604.23072v1 公告类型:新 摘要:大型语言模型(LLM)代理越来越多地承担复杂的现实世界分析(例如,金融预测、科学发现)的任务,但

ArXiv 2026-04-28

从非结构化文本自动生成本体:多代理法学硕士方法

arXiv:2604.23090v1 公告类型:新 摘要:从非结构化自然语言自动生成形式本体仍然是知识工程的核心挑战。 虽然大语言

ArXiv 2026-04-28

PhySE:实时 AR-LLM 社会工程攻击的心理框架

arXiv:2604.23148v1 公告类型:新 摘要:基于 AR-LLM 的社会工程 (AR-LLM-SE) 攻击(例如 SEAR)的新威胁给现实世界的社交互动带来了重大风险。 在 s

ArXiv 2026-04-28

评判法官:对法学硕士法官管道中的偏见缓解策略的系统评估

arXiv:2604.23178v1 公告类型:新 摘要:LLM 作为法官已成为评估语言模型输出的主导范式,但 LLM 法官表现出系统性偏见,损害了评估结果。

ArXiv 2026-04-28

由粗到细:LLM代理的自适应分层规划

arXiv:2604.23194v1 公告类型:新 摘要:基于大型语言模型的代理最近已成为解决动态和多步骤任务的强大方法。 大多数现有代理商都雇用 pl

ArXiv 2026-04-28

CAP-CoT:改善法学硕士推理思维链的循环对抗性提示

arXiv:2604.23270v1 公告类型:新 摘要:思想链(CoT)提示已成为一种从大型语言模型(LLM)中引出逐步解决方案的简单有效的方法。 然而,

ArXiv 2026-04-28

主动推理:人工智能系统中表型代理的方法?

arXiv:2604.23278v1 公告类型:新 摘要:代理人工智能的激增已经超过了描述计算系统中代理所需的概念工具的速度。 普雷瓦利

ArXiv 2026-04-28