最新文章
浦项科技大学研究团队:让AI学会"脑补"声音,无需听觉也能推理音频知识

浦项科技大学研究团队:让AI学会"脑补"声音,无需听觉也能推理音频知识

浦项科技大学研究团队发现当前AI模型缺乏音频推理能力,仅凭文字描述无法判断声音属性。他们构建了AuditoryBench++测试平台,涵盖音调、音量比较等5类任务,发现主流AI模型表现接近随机猜测。研究团队提出AIR-CoT方法,通过两阶段训练让AI学会"想象"声音:先识别需要音频推理的文本片段,再调用音频知识模块生成声音特征。实验显示该方法显著提升了AI的音频推理能力。

明灯科技团队打造智能GUI助手:让电脑像人一样"看懂"界面并自动操作

明灯科技团队打造智能GUI助手:让电脑像人一样"看懂"界面并自动操作

明灯科技团队开发了名为Mano的智能GUI助手系统,能够像人一样"看懂"电脑界面并自动执行复杂操作任务。该系统采用三阶段训练方法,结合基础技能培训、策略优化和实战适应,在Mind2Web和OSWorld测试中取得显著性能提升。系统还包含智能数据采集、验证和身份认证等辅助模块,通过持续学习机制不断自我改进,为GUI自动化领域带来重要突破。

北大港科大联手突破:让AI学会"看图说话"编辑视频,无需训练就能插入删除替换任何物体

北大港科大联手突破:让AI学会"看图说话"编辑视频,无需训练就能插入删除替换任何物体

这项由北京大学和香港科技大学联合完成的研究开发了ContextFlow系统,实现了无需训练的高质量视频物体编辑。该系统通过RF-Solver高精度反演和自适应上下文丰富机制,能够精确插入、替换或删除视频中的物体,同时保持背景完整和时间连续性,在多项指标上超越现有方法,为视频编辑技术带来重大突破。

印度理工学院新突破:让小模型也能像大模型一样聪明,无需标注数据的AI视觉问答训练法

印度理工学院新突破:让小模型也能像大模型一样聪明,无需标注数据的AI视觉问答训练法

印度理工学院团队开发出MPA模型对等对齐器,这是一种革命性的AI训练方法,能让小型视觉语言模型在无需人工标注数据的情况下,通过大模型指导显著提升性能。该技术通过三步法实现知识传递:大模型自动出题答题、精准识别知识差距、针对性强化训练。实验显示小模型性能提升高达15.2%,成本仅为传统方法的几十分之一,为AI技术普及开辟新路径。

加拿大推出首个主权AI工厂,由TELUS主导建设

加拿大推出首个主权AI工厂,由TELUS主导建设

TELUS与NVIDIA和HPE合作,在魁北克省里穆斯基市推出加拿大首个完全主权AI工厂。该设施运行在加拿大本土基础设施上,让企业能够在不跨境的情况下开发、训练和运营AI模型。设施采用可再生能源,具备高效冷却系统。这一举措呼应了全球主权AI发展趋势,旨在确保加拿大在敏感数据处理方面的自主权,为医疗和金融等行业提供符合数据驻留要求的AI解决方案。

Mac用户终于开始重视恶意软件威胁

Mac用户终于开始重视恶意软件威胁

Moonlock发布的2025年Mac安全调查显示,Mac用户对恶意软件的认知正在发生重要转变。仅15%的受访者认为macOS免疫恶意软件,较2023年的28%大幅下降。66%的Mac用户在过去一年中至少遭遇过一次网络威胁。调查还发现,72%的用户担心人工智能助长网络威胁,46%认为需要额外安全软件保护。

AI安全组织发现智能体工具实际拖慢开源开发者效率

AI安全组织发现智能体工具实际拖慢开源开发者效率

AI安全组织METR通过随机对照试验发现,经验丰富的开源开发者使用AI工具时,完成任务时间比不使用工具时延长19%。研究涉及16名开发者,平均每个任务耗时2小时。研究人员认为,AI基准测试可能高估了AI能力,因为现实开发中存在需要人类直觉和常识解决的问题,而AI模型在这些方面表现不足。

经济奇点时代即将到来的五大认知误区

经济奇点时代即将到来的五大认知误区

经济奇点指绝大多数人类失去工作的时刻。作者分析了关于经济奇点的五个常见误区:自动化不会造成失业、工作提供人生意义、经济奇点是坏事、收入分配问题及就业逐步消失。文章指出,认知自动化与过往机械化不同,将全面替代人类工作。失去工作后人们仍可从家庭、兴趣中获得意义。关键挑战是收入分配,需要大规模财富再分配和接近免费的商品服务。就业可能突然全面消失,社会必须提前准备应对方案。

避开这11个ChatGPT陷阱:AI大语言模型使用禁区指南

避开这11个ChatGPT陷阱:AI大语言模型使用禁区指南

ChatGPT是强大的AI工具,能帮助写邮件和头脑风暴,但在某些领域使用它可能造成严重后果。大语言模型可能自信地给出错误、过时或有偏见的信息。在健康诊断、心理治疗、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个方面,依赖ChatGPT可能带来真实世界的风险和危害。

医疗AI规模化部署的新标准:AI评估与KPI体系为何不可或缺

医疗AI规模化部署的新标准:AI评估与KPI体系为何不可或缺

医疗AI的前景不再是理论,但大多数试点项目无法规模化。在Epic和Cerner等EMR平台中,AI要实现企业级应用,必须证明技术可靠性和可衡量价值。严格的AI评估(evals)和明确的关键绩效指标(KPIs)是成功的必要支柱。评估确保系统准确性和安全性,KPIs量化临床价值和投资回报率。

哈佛研究中心探讨人类智能与AI计算智能是否本质相同

哈佛研究中心探讨人类智能与AI计算智能是否本质相同

哈佛大学伯克曼·克莱因中心探讨人类智能是否实际上就是一种计算智能形式。谷歌技术与社会首席技术官在秋季演讲系列中力挺"大脑即计算机"观点,认为大脑不仅像计算机,本身就是计算机。该理论将大脑比作预测性处理器,类似大语言模型通过预测下一个词元工作。支持者认为通过扩大计算规模可实现AGI,但也有声音质疑当前架构可能遇到瓶颈。研究者希望通过破解AI内部机制来理解人类思维。

千里科技AI战略布局完成第一步,新品牌、新计划开启新阶段

千里科技AI战略布局完成第一步,新品牌、新计划开启新阶段

9月28日,“新韵重庆 千里智驾——AI重庆智驾之夜暨千里科技品牌发布会”在重庆隆重举行。

AI倡议推动CIO与CEO关系更加紧密

AI倡议推动CIO与CEO关系更加紧密

一项调查显示,31%的美国技术领导者表示,由于AI转型的紧迫性,CEO与CIO的合作比一年前更加密切。79%的技术领导者认为企业对AI的关注提升了他们在董事会层面的地位。数据分析和AI成为企业未来12个月的重点投资领域,37%的受访者将其列为优先事项。虽然28%的技术领导者预测首席AI官将承担CIO职责,但86%的企业尚未设立该职位。

AEO可能是AI领域最危险的缩写词

AEO可能是AI领域最危险的缩写词

答案引擎优化(AEO)正在重新定义真相的标准。与传统搜索引擎优化不同,AEO让AI系统直接生成答案,而非提供链接。研究显示70%的人会直接接受机器提供的信息,不加质疑。当资本主义与此结合,真相本身变得可以被购买和优化。AEO实质上是一种设计性审查,通过专有数据和封闭算法隐藏推理过程。我们需要重新引入摩擦和质疑机制,要求算法透明度和可追溯性,否则现实本身将成为可以随意调节的设置。

英国Nscale在AI数据中心热潮中融资11亿美元

英国Nscale在AI数据中心热潮中融资11亿美元

AI数据中心开发商Nscale在宣布与英伟达和OpenAI合作一周后,成功融资11亿美元。挪威能源集团Aker ASA领投,Point72、英伟达、诺基亚等参投。Nscale成立于2024年,从加密货币挖矿业务转型而来,现已成为英国AI设施建设计划的核心。公司估值约31亿美元,正与微软合作在英国建设最大AI超级计算机。

像修复兵马俑一样打造合作伙伴生态:Hitachi Vantara亚太的“GPU”秘笈

像修复兵马俑一样打造合作伙伴生态:Hitachi Vantara亚太的“GPU”秘笈

在亚太区,Hitachi Vantara推出了独特的“GPU”合作伙伴策略,但此“GPU”非彼“GPU”,这里代表了成长(Growth)、业绩(Performance)和团结(Unity)。

ETH苏黎世大学提出OBR框架:让大模型既小巧又快速的神奇魔法

ETH苏黎世大学提出OBR框架:让大模型既小巧又快速的神奇魔法

ETH苏黎世大学研究团队提出OBR(最优脑重建)框架,创新性解决了大语言模型压缩中量化与剪枝方法的根本冲突。通过"分组错误补偿"机制,OBR实现了W4A4KV4+50%稀疏性的极端压缩,在保持优秀性能的同时获得4.72倍速度提升和6.4倍内存节省,为边缘设备部署大模型开辟新道路。

斯坦福AI突破:让机器像人类一样学会"举一反三"的神奇能力

斯坦福AI突破:让机器像人类一样学会"举一反三"的神奇能力

斯坦福大学研究团队开发出概念组合学习框架,让AI系统像人类一样学会"举一反三"。该技术将复杂学习任务分解为基础概念模块,通过灵活组合处理新任务,学习效率比传统方法提高10倍。实验显示在多概念组合任务中准确率达78%,并具备跨领域迁移能力。这项突破为通用人工智能发展奠定重要基础,预计将在医疗、教育、自动驾驶等领域率先应用。

深度睡眠解码器:华盛顿大学团队破解梦境密码,让植物人与世界重新对话

深度睡眠解码器:华盛顿大学团队破解梦境密码,让植物人与世界重新对话

华盛顿大学研究团队成功开发出能够检测重度意识障碍患者大脑活动的"翻译系统",准确率达89%。该技术通过脑电图和人工智能算法,发现近40%被判定为"植物人"的患者实际仍有意识。系统不仅能诊断意识状态,还能预测康复前景,为患者家庭带来希望,推动了脑机接口技术革命性进展。

阿里巴巴团队让AI像人类研究员一样深度调研:WebWeaver框架如何突破传统搜索限制

阿里巴巴团队让AI像人类研究员一样深度调研:WebWeaver框架如何突破传统搜索限制

阿里巴巴通义实验室开发的WebWeaver框架通过双智能体协作和动态研究循环,让AI首次具备了类似人类专家的深度研究能力。该系统采用规划智能体进行探索式信息收集和大纲优化,写作智能体执行分层次的精确写作,有效解决了传统AI系统的静态规划和信息过载问题。在三大权威测试中均获得最佳成绩,并通过WebWeaver-3k数据集实现了技术向小模型的成功迁移。