这项由Sierra公司联合多伦多大学开展的研究首次揭示了AI对话系统在双控制环境下的真实挑战。研究团队发现,当AI需要指导用户协作操作时,性能会显著下降约20%。他们开发的τ?-bench评估平台通过电信技术支持场景,系统性地测试了AI的协作指导能力,并通过程序化任务生成和环境约束的用户模拟大幅提升了评估可靠性,为未来人机协作AI系统的发展指明方向。
在AI圈子里,大家或许听到过这样的话术,“AI创新既是一场马拉松,也是一场短跑”,此时此刻我在AMD Advancing AI这场关乎未来AI计算格局的会上,脑中多次浮现出这句话。
德州农工大学等多所知名高校联合Meta公司推出的SAFEFLOW框架,为AI智能体首次提供完整安全保障体系。该系统通过信息流控制、事务日志和动态信任评估,解决了当前AI助手易受欺骗、缺乏协调的关键问题,在专门构建的测试平台上实现了接近完美的安全表现。
弗吉尼亚理工大学研究团队开发出突破性技术,能从单一视频生成全新视角画面。他们通过"K阶递归噪声表示"解决AI模型记忆问题,用"随机潜在调制"智能填充新视角中的空白区域。该方法无需重新训练模型,在视觉质量、角度准确性等关键指标上均优于现有方法,为电影制作、虚拟现实等领域带来新可能。
这项由加州大学圣克鲁兹分校和eBay联合完成的研究首次揭示了先进AI模型的"睁眼瞎"问题:它们虽然具备强大的感知和推理能力,却无法识别表面合理实际有缺陷的指令。研究发现,即使是最先进的AI系统,在面对物体缺失、指代模糊、事实矛盾和目标不可行等隐性问题时,正确识别率不到40%。更令人意外的是,这些AI系统其实内心已经察觉到问题,但因过度训练的服从性而不敢表达。当被允许提出澄清性问题时,它们的表现瞬间飙升至94%以上,表明简单的交互设计改进就能大幅提升AI系统的可靠性。
Gartner正看到AI计算正在不断演进、AI算力问题=新机会、迎接强大的边缘AI三大颠覆性变革。
在数字化转型纵深推进的当下,软件已从工具属性跃升为企业战略核心载体。软件质量随之成为用户体验与市场竞争力的核心因素。
Warp成立于2021年,致力于通过技术赋能的物流网络优化企业供应链。该公司现计划使用机器人自动化其仓储网络,进一步提升供应链效率。公司在洛杉矶测试仓库安装摄像头,利用计算机视觉技术创建数字孪生环境进行实验。经过测试,Warp成功部署改装后的现成机器人处理货物装卸和存储。公司刚完成1000万美元A轮融资,计划今年开始在核心网络城市部署机器人技术。
Continuity Software研究发现,企业存储和数据保护设备在信息安全方面存在严重盲点,使公司数据面临危险暴露。调查涵盖300个环境中超过1万台设备,发现平均每台设备存在10个漏洞,其中一半为高风险。最常见漏洞涉及身份认证管理和未修复的CVE。许多设备仍使用出厂默认密码,缺乏多因素认证。研究还发现勒索软件防护功能未启用或配置错误的情况。
Meta本周发布了名为V-JEPA 2的开源生成式AI模型,该模型能够帮助人工智能理解重力和物体永恒性等物理概念。与依赖标记数据或视频模拟现实的传统模型不同,V-JEPA 2强调物理世界的逻辑,包括物体如何移动和相互作用。该模型可应用于自动驾驶汽车和机器人等设备,无需针对每种可能情况进行训练,简化了流程并提高了现实应用的效率。
文章探讨了人类与人工智能协作的复杂关系。研究显示,面对"如何与AI竞争"这一问题,66%的受访者认为应该利用AI进行协作,而非对抗。以学生群体为例,调查发现一半青少年使用生成式AI进行搜索和头脑风暴,虽存在作弊现象,但更多体现了积极的学习应用。专家建议保持好奇心,采用"宏大梦想,小步迭代"的策略,通过深入理解技术来建立最佳协作关系。
随着摩尔定律接近极限和数据中心功耗问题日益突出,AMD制定了到2030年将芯片能效提升20倍的宏伟目标,并将机架级架构视为关键设计方向。AMD高级副总裁表示,设备规模越大效率越高,机架级计算能将整个机架的计算设备集成到单一封装中。AMD计划明年推出首个机架级计算平台MI400,未来五年内光学互连可能取代铜质连接。除硬件创新外,软硬件协同设计将是实现目标的关键因素。
研华科技近日发布全新品牌愿景"Edge Computing & WISE-Edge in Action",标志着从传统IPC时代正式迈入边缘计算时代。
斯坦福大学研究团队开发出SynthesizeMe方法,能让AI通过观察用户的选择自动学习个人偏好,无需填写复杂资料。该方法通过三步流程分析用户互动,生成个性化画像,在理解用户偏好方面准确率提升4.4%。研究还构建了PersonalRewardBench测试平台,为AI个性化能力评估提供标准。这项技术有望应用于智能客服、教育和内容推荐等领域。
普渡大学研究团队首次提出AI模型免疫技术,通过条件数理论让模型能够抵抗恶意训练。该方法在保持正常功能的同时,显著增加恶意微调的难度,实验显示免疫效果可达40倍以上。这项突破性研究为AI安全提供了"预防胜于治疗"的新思路,开创了模型免疫这一全新技术方向。
布朗大学和哈佛大学研究团队开发出SAIL系统,让机器人能够像人类一样通过自我实践来学习新技能。该系统结合互联网规模的视频模型和环境特定知识,使机器人在面对未见过的任务时能够持续自我改进。实验证明,机器人的成功率能从24%提升至80%以上,且即使从失败经验中也能学习改进。
约翰霍普金斯大学研究发现,AI大模型存在严重的"记忆偏见"问题,即使明确指示忽略内部知识,AI仍会固执地依赖训练时的记忆。研究通过创新的诊断框架测试了三种AI模型,发现知识冲突会显著降低模型性能,且这种偏见会影响AI用作评判工具的公正性。
北京大学与字节跳动联合研发的CyberV系统,让AI视频理解具备了类似人类的"反思"能力。该系统通过监控AI推理过程、检测注意力漂移并提供视觉反馈,成功让小型模型超越GPT-4o,大型模型接近人类专家水平,为AI系统设计带来新范式。
爱丁堡大学研究团队发现现有视觉语言模型难以准确预测现实世界变化,创新性地提出"师傅带徒弟"训练策略。通过让擅长反向推理的动态模型指导世界模型学习,在多个真实场景测试中超越专业图像编辑模型15%。该方法包括合成数据生成和推理时验证两种策略,为人工智能理解物理世界变化提供新思路。
华盛顿大学研究团队开发出MUTEX系统,让家用机器人具备类人灵活性。该系统通过扩散策略和分层学习,使机器人能观察人类演示视频自主学习,在陌生环境中适应性完成复杂任务。测试显示成功率提升近一倍,动作更自然流畅。系统具备多任务协调、人机协作和安全保护功能,为未来智能家居和工业应用奠定基础。