伊利诺伊大学研究团队开发出RM-R1奖励模型,首次让AI评委具备深度推理能力。通过"链式评分标准"机制,模型会先分析问题、制定标准、详细推理再给出评判,就像人类评委的思考过程。在三大基准测试中达到业界最高水平,14B模型超越70B传统模型,数学任务准确率达91.8%。该技术已完全开源,将推动AI系统向更透明、可解释方向发展,为各领域提供更可靠的智能评判服务。
这是阿里巴巴通义实验室推出的创新AI训练框架ZEROSEARCH,通过虚拟搜索环境替代真实搜索引擎进行训练,成本降低80%以上,效果反而更好。该方法采用渐进式学习策略,从简单到复杂逐步提升训练难度,让AI掌握稳定的搜索技能,为AI搜索能力发展开辟了经济高效的新路径。
沙特阿拉伯Misraj AI公司开发出名为Sadeed的阿拉伯语标音模型,仅用15亿参数就在标音任务上超越了GPT-4等大型模型。研究团队创建了严格的数据清洗流程和全新的SadeedDiac-25评测基准,解决了现有基准数据污染问题。该模型证明了专业化小模型在特定任务上可以击败通用大模型,为阿拉伯语AI发展提供了新思路。
中国人民大学联合北京智源人工智能研究院推出WebThinker框架,首次实现AI在推理过程中自主搜索网络、深度探索网页并撰写研究报告。该系统突破传统AI知识局限,具备类似人类研究员的主动信息获取能力,在多项复杂推理和报告生成任务中显著超越现有方法,为AI应用开辟新方向。
中国人民大学研究团队开发了名为DeepCritic的AI批评框架,解决了现有AI监督模型批评过于浅薄的关键问题。该系统通过两阶段训练让AI学会深度思考和多角度分析,在数学推理任务上显著超越现有模型,甚至让小规模模型超越大十倍的系统,为构建安全可控的AI系统提供了新路径。
香港中文大学团队开发出MathCoder-VL,这是首个通过代码理解数学图形的AI模型。该系统将图形转换为精确绘图代码,而非模糊的自然语言描述,从而实现对几何图形的精确理解。研究团队构建了860万图形-代码配对的训练数据集,让AI学会"看图写代码",并能创造性地生成新的数学图形。在几何问题测试中,MathCoder-VL超越了GPT-4o等顶级商业模型,为数学教育AI应用开辟了新道路。
香港大学团队联合快手科技发布的这项交互式生成视频技术综述,展示了AI如何实时创造虚拟世界的革命性能力。该技术通过五大模块协同工作,让AI能够根据用户操作实时生成独特的游戏场景,在游戏、机器人训练和自动驾驶等领域展现出巨大应用潜力,有望重塑我们的数字体验方式。
微软推出的Phi-4-Mini-Reasoning模型仅用38亿参数就在数学推理任务上击败了70-80亿参数的竞争对手。通过创新的四阶段训练方法(大规模中期训练、监督精调、回滚偏好学习、强化学习),该模型在AIME24、MATH-500等测试中表现卓越。这项研究证明了"精巧胜于庞大"的AI设计理念,为资源受限环境下的高性能AI应用开辟了新路径,在教育、科研等领域具有广阔应用前景。
港中文团队开发的T2I-R1系统首次让AI学会"思考式"图像生成,通过语义规划和细节优化的双层推理机制,在复杂图像生成任务上比基础模型提升13-19%,甚至超越了业界最强的FLUX.1模型,为AI创意产业应用开辟新路径。
华中科技大学开发的PixelHacker是一款革命性AI图像修复系统,通过创新的"潜在类别指导"方法,只需区分前景和背景两大类别,就能实现近乎完美的图像修复效果。该系统在1400万张图像上训练,采用门控线性注意力机制,在多个国际标准数据集上全面超越现有方法,修复效果自然到几乎看不出痕迹,为个人用户和专业领域提供了强大的图像处理能力。
云测试凭借资源弹性调度、多终端覆盖等特性,与自动化测试深度融合,逐渐成为企业突破测试困境的核心选择,推动软件质量保障体系向集约化、智能化演进。
亚马逊云科技日前推出了基于NVIDIA Blackwell架构的两款最新AI计算方案——Amazon EC2 P6e-GB200 UltraServer与Amazon EC2 P6-B200实例。
AI使用就像城市的早高峰,出发越早,到得越早,晚十分钟出发,可能就晚一小时到。飞书用一次次更新和标准化方法,给了行业一种确定性:AI不止能看,关键是能用、能落地。
Atlassian总裁Anu Bharadwaj在Transform 2025大会上分享了公司AI智能体规模化的实践经验。她强调,成功部署AI智能体需要营造实验文化,而非仅依靠自上而下的指令。Atlassian通过Rovo Studio平台为各团队提供了构建定制化智能体的环境,创造心理安全的工作氛围,鼓励员工大胆尝试和迭代。公司客户通过该平台显著提升了工作效率,建筑行业客户将路线图创建时间缩短75%。
全球科技领导企业思科9日宣布,任命Ben Dawson为思科亚太、日本及大中华区(APJC)新任总裁,接替现任总裁Dave West。
Zoom发布全新智能代理AI功能,旨在帮助用户在工作中节省时间。新的自定义AI助手插件可连接16多个第三方应用,无需离开Zoom界面。该AI助手现已支持在线购买并可集成到微软Teams和谷歌Meet等第三方会议平台。智能代理AI能够独立运行,自动执行任务、收集数据并达成目标。新功能包括日程管理、会议录制剪辑生成、文档创作辅助等,月费12美元。
YouTube准备更新政策,打击创作者从"非真实"内容中获利的能力,包括批量生产视频和其他重复性内容。7月15日,公司将更新YouTube合作伙伴计划货币化政策,提供更详细的指导原则。随着AI技术的兴起,YouTube充斥着AI生成的低质量内容,包括AI语音配音、虚假新闻视频等。尽管YouTube将此称为"小幅更新",但实际上是为了应对AI内容泛滥对平台声誉和价值的潜在损害。
微软宣布未来五年将向学校和非营利组织捐赠40亿美元现金和技术,推出Microsoft Elevate项目,旨在为AI驱动的经济环境提供技能和工具。资金主要用于为K-12学校和社区大学提供AI和云服务积分,预计2000万人将获得AI技能认证。微软还与Anthropic、OpenAI合作成立国家AI教学学院,培训40万名教师。
AI搜索公司Perplexity发布了自主研发的Comet浏览器,以其AI搜索引擎为默认搜索服务,直接挑战谷歌。该浏览器基于谷歌Chromium平台开发,为付费用户提供个性化搜索、自动化功能和自然语言交互。Comet集成了广告拦截功能,可通过语音或文字命令管理标签页、总结视频、处理邮件等。目前仅向每月200美元的Max订阅用户开放,未来将扩展到更多用户群体。
今天“数据”的概念已远超过去的范畴,“数据库”的概念也已经不同往日。AI让数据的多模融合变得更为重要,这正是甲骨文持续强调融合数据库在AI时代至关重要的原因。