MiniMax公司开发的MiniMax-Speech语音合成系统实现了真正的"零门槛"声音克隆技术,仅需一段录音即可生成32种语言的高质量语音。该系统采用创新的学习型声音编码器和Flow-VAE技术,在全球TTS竞技场中击败OpenAI等巨头登顶第一。
上海AI实验室联合多所知名高校开发的NavDP系统实现了机器人导航的重大突破。该系统仅通过虚拟环境训练就能让不同类型机器人在真实世界中自由导航,无需地图或预先调试。核心创新包括大规模虚拟数据生成、扩散模型轨迹规划和智能安全评估机制,实现了真正的跨平台零样本迁移,为机器人技术产业化奠定了重要基础。
复旦大学团队开发了全新的多维约束框架来评估和改进大语言模型的指令跟随能力。研究发现AI在处理复杂约束时表现不佳,成功率从简单约束的77%降至复杂约束的33%。通过强化学习训练,模型性能显著提升30-50个百分点且不影响其他能力。研究揭示改进主要来自注意力机制优化,为AI实用化提供了重要突破。
加州大学伯克利分校研究团队开发了gg-bench系统,让AI自己设计策略游戏来测试其他AI的智能水平。研究发现,即使是最先进的AI模型,在面对自己"同类"设计的游戏时胜率也只有7-36%,揭示了AI在创造和解决问题之间的能力差异。这项研究为避免传统AI测试中的"数据污染"问题提供了创新解决方案。
这项研究推出了SkillFormer AI系统,通过多角度视频分析来评估人类技能水平。该系统采用创新的CrossViewFusion模块融合第一人称和第三人称视角信息,并使用LoRA技术实现高效训练。在EgoExo4D数据集测试中,准确率达到47.5%,且仅需传统方法四分之一的参数和训练时间,在篮球、烹饪等结构化技能领域表现尤为出色。
这项由胡志明市信息技术大学团队完成的研究创建了首个越南语多模态评论帮助度预测数据集ViMRHP。通过创新的人机协作标注方式,将AI初步标注与人类专家验证结合,在保证数据质量的同时大幅降低了65%的成本和时间。研究涵盖四个领域2000个产品46000条评论,实验证明人类验证数据的模型性能显著优于纯AI标注,为电商平台改善用户购物体验提供了重要技术支撑。
Prime Intellect团队首次实现320亿参数AI模型的全球分布式强化学习训练,开发了INTELLECT-2推理模型。该研究突破了传统中心化训练的限制,通过PRIME-RL框架、SHARDCAST权重分发和TOPLOC验证系统,让全球任何拥有GPU的计算机都能参与大模型训练,显著降低了AI开发门槛,为AI民主化发展开辟了新路径。
多模态GenAI模型等具有重大影响力的技术位于“Gartner新兴技术影响力雷达图:GenAI”的中心。产品负责人必须就投资这些新兴GenAI技术做出关键性决策,从而帮助客户创造前所未有的业务价值。”
达索系统近日宣布,与全球轻奢家具行业领军品牌BoConcept达成一项为期五年的战略合作,旨在为其遍布全球65个国家和地区的顾客,开启全新的3D室内设计与产品配置体验。
Gartner一项新调查显示,45%具备高人工智能(AI)成熟度企业的领导者表示,其AI项目已持续运转三年以上,以确保长期产生影响和价值。而在AI成熟度较低的企业中,这一比例仅为20%。
全球工业软件公司AVEVA剑维软件于7月2日至4日在宁波成功举办“论剑2025·剑维软件中国用户大会”。大会首日,公司战略宣布成立剑维软件中国智能创新中心,标志着其本土化与创新研发战略迈入全新阶段。本次大会以“驰·远 工业焕启新程”为主题,汇聚逾700位客户及合作伙伴,共谋工业数字化转型新机遇,推动行业向绿色、智能、高端融合的高质量发展。
森林保护技术正在改变我们保护全球森林的方式。从基于太空的碳追踪卫星,到能探测烟雾和电锯声的地面物联网传感器,这些高科技工具正助力预防野火、保护生物多样性,并识别非法伐木活动。
近期,普洛斯数据中心在智算服务能力方面全面提升,从技术创新到交付效率实现新突破,其自主研发的“灵熵”系列智算中心空调控制系统入选“算力产业创新实践案例”;普洛斯东莞谢岗数据中心刷新交付速度,仅用一个月便完成万卡级智算项目改造交付,树立智算服务新标杆。
锐龙7 8700G、酷睿i7-14700两款重量级置于聚光灯下,进行一场全面而严苛的性能对决。
华盛顿大学研究团队开发出世界首个主动式耳机AI助手LLAMAPIE,能够在用户对话中主动提供简短关键词提醒,无需用户主动询问。该系统采用双模型架构,在真人测试中将问答准确率从37%提升至87%,同时保持对话自然流畅。这项技术为人机交互带来新突破,在教育、商务和辅助医疗等领域具有广阔应用前景。
这项由Kaggle团队主导的重要研究揭示了生成式AI评估面临的严重危机。传统的测试方法在面对训练于海量互联网数据的AI模型时失效,数据泄露问题普遍存在。研究团队提出AI竞赛平台作为解决方案,其并行评估结构和成熟的防作弊机制为GenAI评估提供了可靠途径,对整个AI领域的发展方向具有重要指导意义。
伊利诺伊大学研究团队提出DynamicRAG框架,通过动态重排序器和强化学习技术,让AI系统能根据问题复杂度智能调整参考文档数量和排序。该系统在七个知识密集型数据集上表现优异,显著提升了问答准确性和效率,为构建更智能的AI助手指明了新方向。
清华大学研究团队开发出H3DP系统,让机器人具备了类似人类的"三重分层思考"能力。该系统通过深度感知分层、多尺度视觉表征和分层动作生成三个层次,实现了视觉感知与动作执行的深度融合。在44个仿真任务中平均提升27.5%性能,在真实世界复杂操作中提升32.3%。这项技术为机器人在杂乱环境中的精确操作和家庭服务应用奠定了重要基础。
腾讯AI团队提出连续视觉自回归生成框架,通过严格适当评分规则实现无需向量量化的直接图像生成。该方法基于能量分数训练,避免了传统离散化过程中的信息损失,在ImageNet数据集上取得竞争性结果,推理速度比扩散方法快近10倍。