最新文章
科技巨头如何为智能体时代重塑网络安全防护体系

科技巨头如何为智能体时代重塑网络安全防护体系

智能体AI系统正在企业环境中广泛部署,以最少的人工监督进行决策和操作,但这种自主性带来了新的风险类别。56%的企业高管将安全列为首要关注点。传统安全框架无法应对机器速度运行的智能体。微软推出AI安全副驾驶,谷歌云强调可追溯性,思科推出AgenticOps策略,将实时可观测性、零信任框架和AI原生运营整合。企业需要建立专用框架,结合安全性、跨域环境和持续监督,而非简单的附加控制。

微软发布Project Ire智能体,可大规模自动识别恶意软件

微软发布Project Ire智能体,可大规模自动识别恶意软件

微软推出名为Project Ire的人工智能代理,能够大规模自动分析和分类恶意软件。该AI模型可对可疑软件文件进行逆向工程,使用反编译器等取证工具分析代码以判断文件安全性。在公共数据集测试中,准确率达98%,召回率为83%。在涉及4000个"高难度目标"文件的实际测试中,准确率为89%,误报率仅4%。Project Ire将集成到Defender平台中,用于威胁检测和软件分类。

MX Linux 25将失去systemd切换功能,因Debian 13即将发布

MX Linux 25将失去systemd切换功能,因Debian 13即将发布

随着Debian 13"Trixie"版本即将发布,MX Linux 25也将推出新版本,但将失去部分初始化系统切换能力。由于systemd-shim项目因内核6.12版本关闭cgroup v1支持而停止维护,MX Linux 25用户需要在下载时选择init系统,而非启动时切换。项目将提供独立的ISO镜像,systemd为默认选项以确保与Debian生态系统的兼容性。

医疗智能体AI的双面性:天使还是魔鬼?

医疗智能体AI的双面性:天使还是魔鬼?

自主AI系统正在医疗领域快速发展,从辅助工具转变为能够独立决策和执行任务的智能代理。这些系统承诺简化诊断流程、减轻医生负担、提供个性化治疗方案,但同时也带来数据完整性、公平性风险、过度依赖和隐私安全等挑战。成功部署需要在医学教育、医院管理和治理框架方面进行系统性变革,建立监督机制和问责制度,确保人类判断的主导地位得以保持。

18款AI编程工具助你实现思维速度开发

18款AI编程工具助你实现思维速度开发

AI编程工具正在改变开发模式,从简单的自动补全发展为"氛围编程"。文章介绍了18款主流工具,包括GitHub Copilot、Cursor等IDE助手,Lovable、V0等一键应用构建器,以及Continue.dev等开源工具。这些工具能够搭建后端、连接前端、生成测试数据并推送代码。虽然提高了开发效率,但也存在成本控制和代码质量风险,需要建立适当的防护机制来平衡自主性与可控性。

AI浪潮中的领导者:为何他们选择顺势而为

AI浪潮中的领导者:为何他们选择顺势而为

Endava研究显示,商业领袖在私人生活中日益采用AI技术,这让他们对AI商业应用更有信心。三分之二的商业领袖愿意信任全自动AI为其做出生活决策,同样比例的人认为AI访问权与电力、水等基础设施同样重要。尽管AI应用是企业首要战略,但近一半受访者认为组织未投资正确的AI技术。研究发现高管层对AI转型更乐观,而中层管理者信心不足,主要因担心被AI取代。

伯明翰市议会1.31亿英镑Oracle重建项目风险升级

伯明翰市议会1.31亿英镑Oracle重建项目风险升级

欧洲最大地方政府伯明翰市议会第二次实施Oracle财务和人力资源系统项目仍处于"琥珀-红色"风险等级,距离预期上线时间不足九个月。该项目预算从最初的2000万英镑飙升至1.31亿英镑。2022年首次上线的Oracle系统造成灾难性后果,导致现金交易错误频发,市议会于2023年秋季实际破产。目前正计划于2026年4月重新实施Oracle系统及第三方现金管理软件,但项目仍面临资源压力、数据所有权等重大风险。

打造陪伴人形机器人,傅利叶GR-3的设计思路

打造陪伴人形机器人,傅利叶GR-3的设计思路

“GR-3在功能性、操作性和亲合度上的提升,让我们离进入家庭这个目标又迈出了坚实的一步。”

Backblaze硬盘统计显示20TB级驱动器表现优异

Backblaze硬盘统计显示20TB级驱动器表现优异

云存储提供商Backblaze发布2025年第二季度硬盘故障率统计,整体故障率较上季度有所下降。其中12TB希捷ST12000NM0007故障率从上季度9.47%降至3.58%。两款希捷硬盘ST8000NM000A和ST16000NM002J本季度零故障。在大容量硬盘方面,20TB及以上容量的三款硬盘表现良好,22TB西数硬盘故障率低于平均水平,显示大容量硬盘技术日趋成熟。

Anthropic发布Claude 4.1编程测试称霸,GPT-5即将来袭

Anthropic发布Claude 4.1编程测试称霸,GPT-5即将来袭

Anthropic周一发布旗舰AI模型升级版Claude Opus 4.1,在SWE-bench Verified基准测试中获得74.5%成绩,超越OpenAI o3模型的69.1%和谷歌Gemini 2.5 Pro的67.2%。该公司年收入从10亿美元增至50亿美元,但近一半API收入依赖Cursor和GitHub Copilot两大客户。新模型采用最严格ASL-3安全协议,在多文件代码重构方面表现突出,但面临GPT-5竞争威胁。

缺乏 AI 监管增加数据泄露风险

缺乏 AI 监管增加数据泄露风险

IBM年度数据泄露报告显示,16%的数据泄露事件涉及AI工具使用,20%的组织因员工使用未授权AI工具而遭受泄露。97%的相关组织缺乏访问控制,63%没有AI治理政策。美国数据泄露平均成本达1022万美元创纪录新高。同时,求职者清理社交媒体可能适得其反,因为雇主正使用AI工具筛选社交媒体以识别真实身份。

OpenAI模型首次登陆AWS云平台

OpenAI模型首次登陆AWS云平台

OpenAI宣布推出两款开放权重推理模型,性能媲美o系列,亚马逊同时宣布这些新模型将于周二在AWS上线。这是OpenAI模型首次在AWS平台提供服务,将通过Amazon Bedrock和SageMaker AI服务提供。此举对两家公司都具有重要竞争意义,AWS终于与最大的模型制造商OpenAI建立合作关系,而OpenAI也在与微软关系紧张的情况下,通过与最大云服务商合作来加强自身地位。

2025-08-06

实测对比OpenAI开源的gpt-oss,奥特曼给的是诚意还是糊弄?

实测对比OpenAI开源的gpt-oss,奥特曼给的是诚意还是糊弄?

AI编程工具Cursor存在远程代码执行漏洞

AI编程工具Cursor存在远程代码执行漏洞

Check Point研究人员在AI编程工具Cursor中发现远程代码执行漏洞,攻击者可通过篡改已批准的MCP配置来污染开发环境。该漏洞被称为"MCPoison",源于Cursor对MCP配置的一次性批准机制,一旦初始配置获得批准,后续修改无需重新验证。攻击者可先提交无害命令获得批准,随后悄悄替换为恶意命令。Cursor已发布1.3版本修复此问题,要求每次MCP服务器条目修改都需用户批准。

清华大学团队开发神奇对话评分器:让AI对话质量评判更准确高效

清华大学团队开发神奇对话评分器:让AI对话质量评判更准确高效

浙江大学与阿里巴巴合作开发了MTDEval多轮对话评估系统,通过学习五个顶级AI评委的评判智慧,将多评委评估的准确性与单模型推理的效率完美结合。系统在七个基准测试中表现优异,评估速度比传统方法快数倍,同时构建了两个高质量数据集供研究使用。该开源系统为AI对话质量评估提供了实用可靠的解决方案。

北大研究团队突破3D场景理解:AI机器人终于能像人类一样"思考"三维空间了

北大研究团队突破3D场景理解:AI机器人终于能像人类一样"思考"三维空间了

北京大学团队开发的3D-R1系统实现了AI在三维空间理解领域的重大突破,通过结合高质量思维链数据集Scene-30K和强化学习技术,让AI首次具备了类似人类的空间推理能力。该系统不仅能准确识别物体位置关系,还能进行复杂的空间规划和推理,在多项测试中性能提升约10%,为智能家居、自动驾驶和虚拟现实等领域的实际应用奠定了重要基础。

低资源语言大模型的"胡言乱语"问题:斯坦福大学团队揭秘印地语、波斯语与中文对话中的幻觉现象

低资源语言大模型的"胡言乱语"问题:斯坦福大学团队揭秘印地语、波斯语与中文对话中的幻觉现象

斯坦福大学等国际研究团队通过对比GPT-3.5、GPT-4o等六个主流大语言模型在印地语、波斯语和中文对话中的表现,发现AI在不同语言中的"幻觉"现象存在显著差异。研究显示中文表现最稳定,幻觉现象最少,而印地语和波斯语中AI经常出现答非所问的情况。这一发现揭示了训练数据质量对AI语言能力的决定性影响,为多语言AI公平性发展提供重要参考。

成功破解3D重建难题!中美韩三国联合研究团队推出革命性建模系统

成功破解3D重建难题!中美韩三国联合研究团队推出革命性建模系统

韩国成均馆大学联合美国Rembrand公司开发的iLRM系统成功破解了3D重建技术的效率难题。该系统采用迭代优化策略,将复杂的一步式重建转变为逐步精雕细琢的过程,同时通过解耦设计和分批处理技术,实现了2-3倍的速度提升和显著的质量改善。这项突破为虚拟现实、电商展示、房地产等领域的3D应用普及奠定了技术基础,有望推动3D内容创作的民主化发展。

中科大团队发明DreamScene:让AI像搭积木一样建造3D世界,一句话就能造出完整场景

中科大团队发明DreamScene:让AI像搭积木一样建造3D世界,一句话就能造出完整场景

中科大团队开发的DreamScene系统实现了从文本到3D场景的端到端自动生成,只需1.5小时即可创建完整三维场景。该系统采用GPT-4进行智能场景规划,通过形成模式采样法生成高质量物体,并支持灵活的后期编辑功能,在生成质量和效率上显著超越现有方法。

ByteDance发布数学定理证明AI系统:在国际数学奥林匹克竞赛中解出5道题的人工智能突破

ByteDance发布数学定理证明AI系统:在国际数学奥林匹克竞赛中解出5道题的人工智能突破

ByteDance团队开发的Seed-Prover AI系统在2025年国际数学奥林匹克竞赛中成功解出5道题,创下AI数学推理新纪录。该系统采用创新的"引理式证明"方法,能够逐步构建复杂证明,并具备反思改进能力。在多个数学基准测试中表现卓越,为AI辅助数学研究和教育开辟了新可能。