最新文章
让AI学会"临时抱佛脚":苏黎世联邦理工学院团队突破性研究如何让AI在考试前快速学习新技能

让AI学会"临时抱佛脚":苏黎世联邦理工学院团队突破性研究如何让AI在考试前快速学习新技能

苏黎世联邦理工学院研究团队提出"测试时课程学习"方法,让AI像学生考前针对性复习一样,自主从海量数据中筛选最相关内容进行强化训练。该方法在数学推理任务上提升1.8倍,编程任务提升2.1倍,并通过"潜在改进"评估确保了真正的推理能力提升而非格式记忆,为AI个性化学习开辟新路径。

扩散模型语言模型推理大突破:中美研究团队发现AI文字生成顺序竟能决定质量高低

扩散模型语言模型推理大突破:中美研究团队发现AI文字生成顺序竟能决定质量高低

中美研究团队发现扩散语言模型内部存在多个"隐藏专家",不同的文字生成顺序会激活不同专家。他们开发的HEX方法通过让多个专家投票选择答案,在数学推理等任务中将正确率提升3.56倍,无需重新训练即可显著改善AI性能,为AI系统优化开辟了新路径。

华威大学新突破:让数据变身"正常"的魔法工具终于不再崩溃了

华威大学新突破:让数据变身"正常"的魔法工具终于不再崩溃了

华威大学研究团队发现传统数据预处理工具Box-Cox和Yeo-Johnson变换存在严重数值稳定性问题,在处理特定数据时会崩溃或产生错误结果。研究提出完整解决方案,包括对数域计算、改进方差公式、参数约束等技术,并首次将稳定的幂变换扩展到联邦学习场景,设计了树状聚合算法确保分布式环境下的计算稳定性,为数据科学提供更可靠工具。

沃里克大学发明AI"联邦ROC与PR曲线"评估神器:让机器学习模型评估既保护隐私又精准高效

沃里克大学发明AI"联邦ROC与PR曲线"评估神器:让机器学习模型评估既保护隐私又精准高效

沃里克大学研究团队开发出联邦学习环境下的ROC和PR曲线计算新方法,通过分位数估计和差分隐私技术,实现了在保护数据隐私的同时进行精准模型评估。该方法将面积误差控制在O(1/Q)范围内,通信成本仅为O(Q),显著优于传统方法。实验验证表明,即使在严格隐私保护设置下,ROC曲线误差小于0.001,为多方合作的AI模型评估提供了实用解决方案。

清华等顶尖机构联手揭秘:AI模型防护系统竟能被"隐形字符"轻松攻破

清华等顶尖机构联手揭秘:AI模型防护系统竟能被"隐形字符"轻松攻破

清华等机构研究团队发现AI安全防护系统存在重大漏洞:通过在恶意问题后添加人眼不可见的Unicode变体选择器字符,可以让安全AI绕过防护机制提供有害回答。这种"隐形攻击"在多个主流AI模型上成功率高达80%-100%,且攻击痕迹完全不可见,为AI安全领域敲响警钟。

亚马逊与OpenAI签署380亿美元英伟达芯片供应协议

亚马逊与OpenAI签署380亿美元英伟达芯片供应协议

亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。

通过核能推动数据中心增长

通过核能推动数据中心增长

当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。

微软将在阿联酋投资79亿美元大幅扩展AI数据中心容量

微软将在阿联酋投资79亿美元大幅扩展AI数据中心容量

微软宣布将在阿联酋投资79亿美元,大幅扩展当地数据中心基础设施。此次投资将使微软在阿联酋的算力容量增长近四倍,达到相当于81900块H100芯片的水平。项目将部署英伟达最新的GB300超级芯片。同时,微软还与云计算初创公司Lambda Labs达成合作,委托其建设价值数十亿美元的AI基础设施。这些投资将配备数万块显卡,进一步增强微软的AI算力布局。

苹果计划使用Google定制版Gemini AI为Siri提供动力

苹果计划使用Google定制版Gemini AI为Siri提供动力

据彭博社报道,苹果正与谷歌合作开发定制版Gemini AI模型,将在2026年春季为新版Siri提供支持。苹果此前在谷歌和Anthropic之间进行评估,最终选择谷歌是因为其提供了更优惠的财务条件。该定制模型将在苹果私有云计算服务器上运行,处理复杂任务,而苹果自有模型仍在设备端处理个人数据。

现代芯片设计为何及如何实现自动化

现代芯片设计为何及如何实现自动化

人工智能正在彻底改变半个世纪以来不断发展的芯片设计自动化进程。从IBM在1950年代引入电子自动化设计开始,如今AI模型能在数小时内创造出比人类设计更高效的无线芯片,但其"随机形状"的设计原理连人类也无法理解。Cadence首席执行官提出"三层蛋糕"概念,强调硬件、物理基础和AI层的协同作用,认为中间层是实现高价值的关键所在。

特拉维夫大学团队突破性研究:AI图像编辑终于学会"精准控制",一个按钮调节笑容深浅

特拉维夫大学团队突破性研究:AI图像编辑终于学会"精准控制",一个按钮调节笑容深浅

特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。

荷兰代尔夫特工大团队开发Code4Me V2:让AI编程助手研究不再是"黑盒子"

荷兰代尔夫特工大团队开发Code4Me V2:让AI编程助手研究不再是"黑盒子"

Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。

AI就绪阶段,企业IT管理的秘密你知道几个?

AI就绪阶段,企业IT管理的秘密你知道几个?

技术成熟可靠可扩展、性价比高,正是ManageEngine卓豪赢得客户的关键。

Cloudera 被独立分析机构评为2025年数据架构平台领导者
2025-11-04

Cloudera 被独立分析机构评为2025年数据架构平台领导者

报告指出,对于需要强大的数据处理能力、可扩展的存储以及持续数据管理来支持现代业务应用的企业而言,Cloudera是理想的选择.

亚马逊云科技与OpenAI宣布达成多年战略合作

亚马逊云科技与OpenAI宣布达成一项为期多年的战略合作协议。OpenAI将立即在亚马逊云科技全球领先的云基础设施上运行并扩展其核心AI(人工智能)工作负载。

跷跷板上的大模型训练:一个神奇常数如何破解AI学习的最佳配方

跷跷板上的大模型训练:一个神奇常数如何破解AI学习的最佳配方

德国于利希超级计算中心研究团队通过两千多次实验发现了AI模型训练的神奇规律:无论模型大小和数据量如何变化,最优训练配置总是对应同一个特定数值——输出层算子范数约为128。这一"范数传递"现象为AI训练提供了可靠的理论指导,并揭示了具体的缩放法则,能够显著提高训练效率、降低成本。研究还发现分层学习率优化可带来6%性能提升,为AI训练的民主化做出重要贡献。

帝国理工学院团队开发AI专家混合模型:让语音识别变得更聪明更节能

帝国理工学院团队开发AI专家混合模型:让语音识别变得更聪明更节能

帝国理工学院团队开发的MoME系统将稀疏专家混合机制与多粒度表示学习相结合,创造出能够动态调整处理精度的音视频语音识别框架。该系统如同智能变速箱,可根据资源情况在同一模型中灵活切换不同性能模式,在保持高准确性的同时大幅减少计算开销,特别适合移动设备等资源受限场景。

波兰大学团队重新打造经典数据集:让AI轻松理解人类问题并生成SQL查询

波兰大学团队重新打造经典数据集:让AI轻松理解人类问题并生成SQL查询

波兰弗罗茨瓦夫科技大学研究团队对经典WikiSQL数据集进行了全面改进,创建了LLMSQL数据集。该研究解决了原数据集中49.25%查询返回空结果、数据类型冲突、大小写不一致等问题,并将查询格式现代化为标准SQL。通过对多个大语言模型的测试,最大模型达到88.4%准确率,小模型经微调后可超过90%。这项工作为开发自然语言数据库接口提供了更可靠的基础。

新加坡国立大学团队首创学术视频自动生成系统:让论文秒变精彩讲座

新加坡国立大学团队首创学术视频自动生成系统:让论文秒变精彩讲座

新加坡国立大学Show Lab团队开发了首个学术演讲视频自动生成系统Paper2Video,能将研究论文转换为包含专业幻灯片、同步字幕、个性化语音和虚拟演讲者的完整视频。该系统创建了101篇论文配对演示视频的评估基准,设计了四套创新评估指标,其PaperTalker框架采用多智能体协作,在知识传递效率上甚至超越人工制作视频10%。

罗彻斯特大学新突破:视频AI从零分直接跳到90分的训练秘籍

罗彻斯特大学新突破:视频AI从零分直接跳到90分的训练秘籍

罗彻斯特大学研究团队发布了视频AI后训练的突破性研究成果。该研究系统性地解决了视频AI从基础感知向深度推理转变的关键问题,提出包括监督式精调、强化学习和测试时扩展的完整训练体系。通过思维链训练、GRPO算法等创新方法,显著提升了AI在复杂视频理解任务上的表现,为智能视频分析技术的实用化奠定了重要基础。