最新文章
中科院让AI做数学题更聪明:一种像教师和教练双重指导的新训练方法

中科院让AI做数学题更聪明:一种像教师和教练双重指导的新训练方法

中科院团队提出SRFT新方法,通过同时进行监督学习和强化学习,并使用熵感知机制动态平衡两种训练方式,让AI在数学推理任务中取得显著提升,准确率达59.1%,为AI训练提供了新的有效范式。

MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声

MIT实验室打造音频界"翻译官":一个模型搞定语音、音乐和环境声

这篇论文介绍了MIT开发的USAD技术,这是一种能够同时理解语音、音乐和环境声音的通用音频AI模型。通过创新的知识蒸馏方法,USAD在多个音频处理任务上都达到了接近专门模型的性能水平,为构建更智能的音频理解系统奠定了基础。该技术在智能助手、多媒体处理、教育等领域具有广阔的应用前景。

企业智能体扩展面临的隐形挑战与解决方案

企业智能体扩展面临的隐形挑战与解决方案

Writer首席执行官May Habib指出,企业在构建和扩展AI智能体时面临重大挑战。智能体在构建、运行和改进方式上与传统软件截然不同,需要抛弃传统软件开发生命周期。智能体不会可靠地遵循规则,而是结果导向、具备解释和适应能力。企业需要采用目标导向方法,设计业务逻辑蓝图而非工作流程。质量保证也需要评估非二元行为和实际应用表现。智能体维护需要新的版本控制系统,涵盖提示、模型设置等所有影响行为的因素。

Salesforce首席执行官:AI已承担公司近半数工作

Salesforce首席执行官:AI已承担公司近半数工作

Salesforce首席执行官马克·贝尼奥夫表示,公司正大力推进人工智能应用,AI代理现在承担了公司30%至50%的工作。他认为员工应适应AI替代人工的趋势,转向更高价值的工作。然而,这一变化导致约1000名员工被裁,虽然公司计划招聘同等数量新员工,但主要专注于销售AI技术。这一趋势在科技行业普遍存在,今年已有超过63000个科技岗位消失,AI被认为是重要原因之一。

谷歌推出AI虚拟试衣应用Doppl,让你可视化穿搭效果

谷歌推出AI虚拟试衣应用Doppl,让你可视化穿搭效果

谷歌发布实验性应用Doppl,利用AI技术让用户在数字化身上虚拟试穿不同服装。用户上传全身照片后,可通过拍摄或截图的服装图片进行虚拟试穿,应用会生成穿着该服装的虚拟形象,甚至可转换为AI视频展示效果。该应用基于谷歌购物的虚拟试衣功能开发,目前仅在美国iOS和Android平台提供。

超大规模运营商将在2030年前占据全球数据中心容量60%

超大规模运营商将在2030年前占据全球数据中心容量60%

根据Synergy Research Group报告,超大规模运营商目前占全球数据中心容量的44%,到2025年第一季度末,大型超大规模设施数量达到1189个。企业自有数据中心占比从六年前的56%下降至34%,预计2030年将进一步降至22%。全球数据中心容量将持续快速增长,主要由超大规模容量未来六年三倍扩张驱动。所有地区数据中心总容量年增长率都将达到两位数。

AI初创工作室计划每年推出十万家公司

AI初创工作室计划每年推出十万家公司

亨里克·韦德林通过其新创立的Audos公司,计划利用AI技术将创业孵化规模从每年"数十家"扩展到"数十万家"。该平台专门帮助非技术背景的"普通创业者"创建百万美元AI公司,采用15%收入分成模式而非股权投资。Audos提供AI工具、最高2.5万美元资金支持和社交媒体推广服务,已在测试阶段帮助数百家企业启动,获得1150万美元种子轮融资。

OpenDylan 2025.1版本发布:抛弃括号的Lisp语言获得重要更新

OpenDylan 2025.1版本发布:抛弃括号的Lisp语言获得重要更新

OpenDylan 2025.1版本带来多项实用改进,包括新的LSP插件lsp-dylan,提供语法高亮和代码补全功能。命令行项目管理工具从dylan重命名为deft以减少歧义。Dylan是一种独特的编程语言,起源于苹果Newton项目,旨在创建一个更传统语法的Lisp变体,避免大量括号的使用。该语言已存在三十多年,目前仍在积极维护和开发中。

中科院团队推出SimpleGVR:让AI视频从模糊走向高清的超级放大镜

中科院团队推出SimpleGVR:让AI视频从模糊走向高清的超级放大镜

中科院团队开发的SimpleGVR系统革新了AI视频增强技术,通过直接在潜在空间处理和创新的分阶段训练策略,能够将AI生成的低分辨率视频高效提升至高清画质。该系统不仅提升分辨率,还能修正AI视频特有的颜色混合等问题,在多项指标上超越现有顶级方法,为AI视频生成领域提供了实用的解决方案。

浙江大学重磅发布KnowRL:让AI大模型拥有"知识边界"意识,告别胡编乱造时代

浙江大学重磅发布KnowRL:让AI大模型拥有"知识边界"意识,告别胡编乱造时代

浙江大学联合腾讯AI实验室提出KnowRL方法,通过在强化学习中集成事实性奖励机制,有效解决慢思维AI模型在推理过程中的幻觉问题。该方法在保持原有推理能力的同时,显著提升了模型的事实准确性,为构建更可靠的AI系统提供了新思路。

浙大联合蚂蚁集团揭秘:为什么开源AI在数据分析上总是败给商业模型?

浙大联合蚂蚁集团揭秘:为什么开源AI在数据分析上总是败给商业模型?

浙大联合蚂蚁集团通过系统性研究发现,开源AI在数据分析上表现不佳的根本原因是缺乏战略规划能力。研究团队通过精心设计的数据合成方法,成功提升了开源模型的表现,14B模型甚至能媲美GPT-4,证明了高质量训练数据比海量数据更重要,为开源AI在数据分析领域的发展指明了新方向。

大语言模型在"混合语言"面前的尴尬:MBZUAI揭示AI理解多语言混用文本的真实水平

大语言模型在"混合语言"面前的尴尬:MBZUAI揭示AI理解多语言混用文本的真实水平

MBZUAI和巴黎综合理工学院研究团队系统评估了大语言模型对混合语言文本的理解能力,发现当英语中混入其他语言时模型性能下降,但其他语言中混入英语时性能反而提升,揭示了AI系统的语言偏见问题,并提出了通过专门训练改善的有效方案。

Amazon团队推出FiSCo:首个能揪出AI语言模型微妙偏见的"神探"系统

Amazon团队推出FiSCo:首个能揪出AI语言模型微妙偏见的"神探"系统

Amazon研究团队开发了FiSCo系统,首次实现对AI语言模型长篇回答中微妙偏见的精准检测。该系统通过分解语义声明和统计分析,能发现传统方法无法捕捉的隐性偏见,在准确率上比现有方法提升15%。实验显示主流AI模型普遍存在不同程度的群体偏见,为AI公平性评估提供了重要工具。

Adobe团队首次实现"时空魔法":让AI从几张照片重建任意时刻的4D世界

Adobe团队首次实现"时空魔法":让AI从几张照片重建任意时刻的4D世界

Adobe研究团队开发的4D-LRM系统实现了从稀疏多视角图像重建动态4D场景的突破。该技术采用统一的时空表示学习方法,通过Transformer架构直接预测4D高斯基元,能在1.5秒内重建24帧动态序列。在多种相机配置下表现优异,为AR/VR、影视制作和机器人学等领域提供了新的技术可能。

英伟达新突破:让电脑自己设计芯片,75%工作量不再需要人工干预

英伟达新突破:让电脑自己设计芯片,75%工作量不再需要人工干预

英伟达等机构联合开发出Spec2RTL-Agent智能系统,能直接从复杂芯片设计文档自动生成硬件代码,减少75%人工干预。该系统采用多代理协作方式,包含理解规划、渐进编程和智能反思三大模块,成功验证了人工智能在硬件设计自动化领域的重大突破。

首个突破:首尔国大团队让AI学会"私人定制"看图说话术,多角色一次搞定不再出错

首个突破:首尔国大团队让AI学会"私人定制"看图说话术,多角色一次搞定不再出错

首尔国立大学团队突破性地提出了基于强化学习的多模态大语言模型个性化训练框架RePIC,仅用2000个样本就达到传统方法21万样本的效果,在多角色图像描述任务中准确率提升至71%(传统方法仅21.3%),首次实现了高效、准确的AI个性化看图说话能力,为个人专属AI助手的普及化应用奠定了重要技术基础。

Valeo公司推出DIP:让AI模型像人类一样"举一反三"学习图像理解

Valeo公司推出DIP:让AI模型像人类一样"举一反三"学习图像理解

法国Valeo公司联合巴黎索邦大学开发出DIP技术,让AI模型能像人类一样通过少量样本快速学习图像理解。该技术采用创新的"元学习"训练方式,无需人工标注即可显著提升模型在复杂场景下的分割性能,训练时间仅需9小时,在多个数据集上表现优异,为自动驾驶、医疗影像等领域应用提供了新可能。

微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术

微软推出RealPlay:用AI把游戏世界变成现实世界的神奇技术

微软等机构联合推出的RealPlay系统首次实现了用游戏控制指令生成现实视频的突破。该系统仅使用赛车游戏数据训练,却能控制现实中的汽车、自行车和行人运动,控制成功率达90%。RealPlay支持交互式视频生成,用户可像玩游戏般逐步指导视频发展,生成质量接近真实拍摄,为AI视频生成和未来游戏引擎开发开辟了新方向。

中科院团队突破视频光影魔法:让任何视频在不同时间地点"重新拍摄"

中科院团队突破视频光影魔法:让任何视频在不同时间地点"重新拍摄"

中科院自动化所研究团队开发出TC-Light视频重新打光技术,能够在保持原有内容完全不变的情况下改变视频光照环境。该技术采用独创的"独特视频张量"和两阶段优化策略,可将阴天场景转换为阳光效果,或为普通视频添加科幻光影,同时保持完美的时间连贯性。技术在58个长视频测试中表现优异,为影视制作、AI训练等领域提供了高效解决方案。

SCB 10X团队重磅突破:金融界的AI助手终于学会了专业推理

SCB 10X团队重磅突破:金融界的AI助手终于学会了专业推理

SCB 10X团队开发了FinCoT方法,通过将金融专家推理流程嵌入AI提示中,显著提升了大语言模型在金融任务上的表现。该方法在CFA考试题目上将准确率从63.2%提升至80.5%,同时将输出长度减少8倍,为AI在专业金融领域的应用提供了新思路。