最新文章
代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

代码验证能否做到既快又准?威斯康星大学破解大型语言模型编程任务的速度与精度平衡难题

威斯康星大学研究团队提出"生成-筛选-排序"策略,通过结合快速筛选器和智能奖励模型,在AI代码验证中实现了11.65倍速度提升,准确率仅下降8.33%。该方法先用弱验证器移除明显错误代码,再用神经网络模型精确排序,有效解决了传统方法在速度与准确性之间的两难选择,为实用化AI编程助手铺平了道路。

约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

约翰霍普金斯大学揭秘:AI为什么总是对外部建议"充耳不闻"?

约翰霍普金斯大学研究团队发现,即使给AI模型提供近乎完美的外部反馈,它们仍然无法完全吸收并达到理论最佳表现,这种现象被称为"反馈摩擦"。研究通过九项不同任务测试了多个先进AI模型,发现所有模型都存在这一局限性,且主要原因是模型的反馈抗拒而非反馈质量问题,为AI自我改进研究指明了新方向。

韩国大学联合耶鲁大学:让AI医生学会"边推理边验证",小模型也能超越大模型诊断准确率

韩国大学联合耶鲁大学:让AI医生学会"边推理边验证",小模型也能超越大模型诊断准确率

这项由韩国大学联合耶鲁大学等多所院校开展的研究,开发了名为Med-PRM的医疗AI推理框架。该系统让AI在诊断时能够实时查阅医学文献并验证每个推理步骤,使80亿参数的小模型在医学考试中首次突破80%准确率,训练成本仅需20美元却超越了成本数万美元的竞争对手,为医疗AI的普及和可靠性提升提供了新路径。

哈工大团队革命性突破:AI智能体终于学会了像人类一样长期规划和思考

哈工大团队革命性突破:AI智能体终于学会了像人类一样长期规划和思考

哈工大研究团队开发出革命性AI智能体Mirage-1,首次实现了像人类一样的长期规划和跨应用操作能力。该系统通过分层多模态技能学习和技能增强搜索算法,在Android和网页环境测试中分别取得32%、19%、15%和79%的性能提升,为AI助手的实用化发展奠定了重要基础。

Pure推出企业数据云:存储管理策略导向新突破

Pure推出企业数据云:存储管理策略导向新突破

Pure Storage发布企业数据云(EDC),整合其现有产品组合,提供增强的数据存储可见性和基于策略的简化管理。EDC集成了Purity存储操作系统、Fusion资源管理、Pure1舰队管理和Evergreen消费模式等架构元素,提供类云存储管理环境。该方案支持声明式策略驱动管理,让客户专注业务成果而非基础设施管理。同时发布高性能闪存阵列和300TB直接闪存模块,并与Rubrik合作提供网络安全防护能力。

LLM聊天机器人学会了察言观色:希伯来大学突破性研究让AI懂得何时说话
2025-06-19

LLM聊天机器人学会了察言观色:希伯来大学突破性研究让AI懂得何时说话

这个突破意味着,未来的AI助手将不再是被动的问答机器,而是能够主动、适时地参与人类对话的智能伙伴。

推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法
2025-06-19

推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法

推理模型存在崩溃缺陷?Open Philanthropy研究人员提出AI推理能力评估的改进方法

盖洛普新报告:AI文化准备需要全新思维模式

盖洛普新报告:AI文化准备需要全新思维模式

职场正在经历一场悄然的变革。最新盖洛普研究显示,虽然算法工具越来越普及,27%的员工经常使用AI工具,但员工对与AI系统协作的准备度却在下降。欧盟AI法案强调透明度,要求用户了解何时与AI交互。研究提出"双重素养"概念,即同时具备人类和算法领域的流利度。成功的人机协作需要信任校准,在过度依赖和充分利用AI能力之间找到平衡。组织文化需要培养好奇心、同理心、创造力和勇气四种品质,以实现有意识的人机协作。

微软测试物理PC到云PC故障转移服务应对设备故障

微软测试物理PC到云PC故障转移服务应对设备故障

微软宣布推出Windows 365 Reserve预览版,这是一项云电脑服务,可在物理设备不可用时提供预配置的临时云电脑。该服务预装Microsoft 365应用、安全策略和Windows自定义设置,支持OneDrive数据同步,每年可使用10天。用户可通过Windows应用或浏览器在几分钟内连接。微软还更新了云电脑默认安全设置,禁用USB和剪贴板重定向功能。

智能体AI重塑企业安全与可观测性的未来发展

智能体AI重塑企业安全与可观测性的未来发展

智能体AI具备推理、适应和自主行动能力,能够以机器速度运行,有望彻底改变企业维护数字韧性的方式。它结合了大语言模型的对话分析体验和智能体框架的任务执行自动化,帮助IT团队从被动救火模式转向主动规划模式。智能体AI可瞬间定位根本原因、预防中断和停机、提供实时洞察并优化人力资源配置,为企业数字生态系统的安全和可靠性能交付提供全新解决方案。

企业高管对开源AI模型持谨慎态度偏爱专有方案

企业高管对开源AI模型持谨慎态度偏爱专有方案

凯捷研究院调研显示,尽管AI在自动化重复性业务任务方面带来显著成本节约,但应用场景相对简单。调研涵盖1607名来自年收入超10亿美元企业的高管,发现AI可降低客户运营成本40%、人员运营成本26%。然而,四分之三的高管仍偏好专有AI模型,其中43%选择超大规模云服务商产品。尽管开源模型如DeepSeek能实现11倍计算成本降低,企业领导者仍因技术专业性要求、安全风险和社区支持等因素,对开源AI方案保持谨慎态度。

Threads正在测试剧透隐藏功能,扎克伯格透露

Threads正在测试剧透隐藏功能,扎克伯格透露

Meta CEO扎克伯格宣布,Threads微博平台正在测试剧透遮罩功能。该功能可将文字或图片置灰显示,用户需手动点击才能查看内容。这项功能常用于Discord和Reddit等平台,帮助用户讨论影视作品时避免意外透露剧情。Meta表示,《最后生还者》等热门剧集在播出期间经常在Threads上成为热门话题,显示该平台娱乐文化社区正在壮大。

1Password携手AWS共推企业AI与云环境安全防护

1Password携手AWS共推企业AI与云环境安全防护

加拿大密码管理公司1Password与亚马逊云服务AWS达成战略合作协议,专注为人工智能和云原生环境提供企业级安全工具。该合作帮助1Password从消费级密码管理器转型为企业安全平台,目前服务财富100强中三分之一的公司。双方推出新的AWS密钥管理器集成功能,解决AI代理、非托管设备和未授权应用带来的安全盲点问题,通过扩展访问管理平台为混合和AI驱动环境提供全面的访问安全解决方案。

Midjourney发布首个AI视频生成模型V1

Midjourney发布首个AI视频生成模型V1

知名AI图像生成公司Midjourney发布备受期待的AI视频生成模型V1。该模型可将用户上传的图像转换为四段5秒视频,仅通过Discord提供服务。V1与OpenAI的Sora、Runway的Gen 4等产品竞争,但更专注创意应用而非商业用途。公司计划未来开发3D渲染和实时AI模型,最终目标是创建实时开放世界模拟系统。视频生成费用为图像生成的8倍,最低订阅计划为每月10美元。

企业无线网络市场强劲复苏,第一季度增长10.6%

企业无线网络市场强劲复苏,第一季度增长10.6%

IDC研究显示,2025年第一季度全球企业无线局域网市场增长10.6%,达到23亿美元。经历两年供应链危机波动后,市场供需动态趋于稳定。Wi-Fi 6E在接入点市场收入中占比31.9%,Wi-Fi 7占比11.8%,新标准推动市场增长。地区方面,美洲市场增长15.2%,欧洲中东非洲增长11%。厂商竞争格局中,思科以39.5%市场份额领先,HPE Aruba占15.9%,Ubiquiti增长强劲达50.9%。

Visa首席信息安全官:绝不允许网络安全自满

Visa首席信息安全官:绝不允许网络安全自满

在数字支付领域,网络安全至关重要。作为Visa高级副总裁兼首席信息安全官,Subra Kumaraswamy领导着这家支付卡服务巨头的网络安全工作。他认为自己和团队总是可以做得更好,每天都在思考如何改进。在Visa,超过1000人从事网络安全工作,涵盖六个垂直功能领域。Kumaraswamy强调避免自满情绪,认为自满是安全的敌人。目前Visa正在探索80多个生成式AI网络安全项目,并将最佳实践分享给客户,力求让整个支付生态系统都能像Visa一样强大。

谷歌AI搜索实时语音功能正式上线

谷歌AI搜索实时语音功能正式上线

谷歌在美国地区的iOS和Android应用中推出了AI搜索语音功能Search Live。用户需在实验室模式中开启AI功能,即可通过语音与搜索进行对话交流。该功能基于定制版Gemini驱动,支持连续语音问答和文本转换。谷歌称这适合用户在移动或多任务处理时使用。未来几个月还将支持实时图像识别和解答功能。不过此功能可能影响原始信息源网站的访问流量。

浙江大学团队首创"先问后教"AI标注法:让机器学会谦逊表达"我不确定"

浙江大学团队首创"先问后教"AI标注法:让机器学会谦逊表达"我不确定"

浙江大学团队提出CanDist框架,让AI在数据标注时先提供多个候选答案而非单一答案,再通过师生框架筛选最优标签。该方法受心理学"模糊厌恶"启发,在六个文本分类任务上表现优异,相比传统方法平均提升18-27%准确率,为AI数据标注提供了更智能可靠的解决方案。

让AI模型自己找出弱点并主动改进:微软打造的"自我反思"训练新方法

让AI模型自己找出弱点并主动改进:微软打造的"自我反思"训练新方法

微软联合多所知名高校开发了SwS框架,让AI模型能够自主识别学习弱点并生成针对性练习题进行自我改进。该方法在数学推理任务上取得显著效果,7B和32B模型平均性能分别提升10%和7.7%。通过"弱点诊断-针对性出题-强化训练"的三步流程,AI首次实现了真正意义上的自我反思式学习,不依赖外部知识灌输即可持续优化自身能力,为人工智能的自主学习开辟了新道路。