最新文章
让机器像人一样看懂长视频:华南理工大学团队突破AI视频理解新界限

让机器像人一样看懂长视频:华南理工大学团队突破AI视频理解新界限

华南理工大学研究团队开发出Grounded-VideoDiT系统,突破了AI长视频理解的关键技术瓶颈。该系统通过扩散时间潜在编码器、实体感知分割跟踪和混合标记策略三大创新,让AI具备了精确的时间定位、物体跟踪和多模态推理能力。在多项测试中表现优异,为教育、安防、医疗、体育分析等领域的视频应用开辟了广阔前景。

谷歌最新研究:人工智能如何重新发现经典物理定律,揭示科学探索的全新可能

谷歌最新研究:人工智能如何重新发现经典物理定律,揭示科学探索的全新可能

谷歌DeepMind团队开发出符号回归神经网络,能在无先验知识下从观测数据中自主发现物理定律。该AI系统成功重现牛顿第二定律、胡克定律等经典物理定律,展示了数据驱动科学发现的新范式。研究证明AI可通过模式识别和数学推理系统性发现科学规律,为材料科学、生物医学等领域提供新的研究工具,开启人机协作科学探索的新时代。

清华大学突破性成果:让AI学会"察言观色"——从表情动作到内心情感的智能解读

清华大学突破性成果:让AI学会"察言观色"——从表情动作到内心情感的智能解读

清华大学团队开发出多模态感知推理网络,这是首个能从人类表情、动作等外在表现准确推断内在情感状态的AI系统。该系统综合分析面部表情、语音语调、肢体动作等多维信息,在复杂情感识别中达到87.3%准确率,已在医疗、教育等领域试点应用。这项技术突破了传统单一感知模式限制,具备动态权重分配和时序建模能力,为构建更智能人性化的人机交互奠定基础。

上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界

上海交大团队发布"画图变3D场景"神器:一张照片瞬间生成完整的三维世界

上海交通大学团队开发的SceneGen系统能够从单张照片自动生成完整3D场景,包含准确的几何结构、逼真纹理和正确的空间关系。该技术在两分钟内完成场景重建,几何精度比现有方法提升76%,为游戏开发、室内设计、虚拟现实等领域提供了革命性的内容创建工具,代码已开源供研究使用。

阿里云团队突破传统:金融AI如何学会像专家一样思考

阿里云团队突破传统:金融AI如何学会像专家一样思考

阿里云团队开发了Fin-PRM,一个专门针对金融推理的AI评判系统。该系统采用双重评判机制,既检查推理步骤准确性又评估整体合理性,并具备专业知识验证功能。通过3000个高质量样本训练,在三大应用场景中显示出显著性能提升:数据筛选提升12.9%,测试选择提升5.1%,强化学习提升5.2%,为金融AI的专业化发展提供了重要技术支撑。

异构智算产业生态联盟走进青岛国实集团,共探异构智算与AI大模型的深度融合
2025-08-28

异构智算产业生态联盟走进青岛国实集团,共探异构智算与AI大模型的深度融合

走进青岛国实集团,见证海洋科技新范式!

卡内基梅隆大学让变形金刚学会用"压缩包"思考,AI计算速度暴涨200倍

卡内基梅隆大学让变形金刚学会用"压缩包"思考,AI计算速度暴涨200倍

卡内基梅隆大学研究团队开发出FLARE技术,这是一种革命性的AI计算方法,通过"压缩"思维过程让AI在处理复杂三维模型时速度提升200倍,准确度更高。该技术采用固定长度潜在序列路由注意力,成功突破传统自注意力机制的计算瓶颈,能在单GPU上处理百万级数据点,为工程设计、医疗器械等领域带来重大效率提升。

谷歌DeepMind发布最强AI推理模型:Gemini 2.0 Flash Thinking如何让AI学会"思考"

谷歌DeepMind发布最强AI推理模型:Gemini 2.0 Flash Thinking如何让AI学会"思考"

谷歌DeepMind于2024年12月发布的Gemini 2.0 Flash Thinking模型实现了AI领域的重大突破,让人工智能首次具备了类似人类的"深度思考"能力。该模型通过"推理时计算"技术,能在回答问题前进行内部思考和分析,在编程、数学推理、创意写作等领域表现卓越,标志着AI从"快速反应"向"深度思考"的重要转变。

当街拍照片被AI变成"数字间谍":斯坦福团队发现人脸识别技术的惊人隐私风险

当街拍照片被AI变成"数字间谍":斯坦福团队发现人脸识别技术的惊人隐私风险

斯坦福大学研究团队通过分析超过50000张公开照片,发现商业人脸识别系统能够从普通照片中推断出年龄、性别、种族、职业等大量个人隐私信息,准确率高达95%。研究揭示了不同人群面临的差异化隐私风险,并提出了技术保护、法律规范、个人防护等多层面的应对策略。这项发表于《自然·机器智能》的研究为数字时代的隐私保护提供了重要参考。

德州大学奥斯汀分校团队发现:人类可以通过感知温暖来增强彼此信任

德州大学奥斯汀分校团队发现:人类可以通过感知温暖来增强彼此信任

德州大学奥斯汀分校研究团队通过巧妙实验发现,短暂接触热饮会让人们更倾向于信任陌生人并表现出亲社会行为。这项发表于《科学》杂志的研究证明了"具身认知"理论——身体感受会影响思维决策。研究表明大脑中处理温度和社会情感的区域相互关联,这种机制可能源于人类进化过程中温暖与安全的关联。该发现为商业谈判、医疗护理、教育等领域提供了实用启示。

麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话

麻省理工团队揭秘:AI如何仅靠语音就能"读懂"你在什么地方说话

麻省理工学院研究团队开发出革命性AI技术,能够仅通过分析音频信号就准确推断出说话者所处的三维空间环境。该技术利用声音在不同空间中的独特传播特征,让AI系统像声学侦探一样重建完整的空间几何信息。在测试中,系统的空间尺寸预测精度达95%以上,声学特性匹配度超90%。这项创新为智能家居、虚拟现实、音频制作等领域带来广阔应用前景,有望让未来的智能设备真正理解和适应人类的生活环境。

大模型时代的"身份证":浙江大学团队破解AI版权保护终极难题

大模型时代的"身份证":浙江大学团队破解AI版权保护终极难题

浙江大学团队发表关于大型语言模型版权保护的综合性研究,系统梳理了文本水印、模型水印和模型指纹识别技术,提出统一的评估框架。研究涵盖内在和侵入性指纹识别方法,并首次讨论了指纹传输和移除技术,为AI模型版权保护提供了完整的技术指南和未来发展方向。

第四届828 B2B企业节开幕,聚焦AI释放更多产业红利
2025-08-28

第四届828 B2B企业节开幕,聚焦AI释放更多产业红利

今年828企业应用一站购商城将提供超过12000款新产品,推出近600款精选智能化产品与解决方案,覆盖企业数智化转型的全阶段、全场景,助推更多企业实现降本增效和创新发展。

2025年美国AI初创企业百万美元融资盘点

2025年美国AI初创企业百万美元融资盘点

2025年美国AI行业延续2024年强劲融资势头,已有33家AI创业公司完成亿美元级融资轮次。其中OpenAI以400亿美元刷新融资纪录,估值达3000亿美元;Anthropic融资35亿美元,估值615亿美元。涵盖医疗AI、法律科技、基础设施、编程工具等多个细分领域。

Google AI视频编辑器Vids正式向所有用户开放

Google AI视频编辑器Vids正式向所有用户开放

Google宣布将向所有用户开放其人工智能驱动的视频编辑器Vids。该工具利用AI技术简化视频制作流程,用户可以更轻松地创建和编辑视频内容。此举标志着Google进一步扩大其AI产品的用户覆盖面,让更多人能够享受到智能化视频编辑带来的便利。

微软推出企业版Windows备份工具:仅保存设置不备份文件

微软推出企业版Windows备份工具:仅保存设置不备份文件

微软推出Windows Backup for Organizations功能,专为企业用户设计。该工具并非完整备份解决方案,不会创建磁盘镜像或复制文件到其他位置,而是专门备份Windows 10或11的系统设置,并在Microsoft Entra加入的设备上恢复。功能还可备份Microsoft Store应用列表并恢复到开始菜单。该工具主要面向处理设备重置或迁移的管理员,支持从Windows 10平滑过渡到Windows 11。备份数据存储在企业租户中,默认禁用需手动启用。

Google和Grok正逐步追赶ChatGPT竞争地位

Google和Grok正逐步追赶ChatGPT竞争地位

a16z最新AI报告显示,谷歌Gemini、xAI的Grok以及Meta AI等ChatGPT竞争对手正在缩小与OpenAI热门聊天机器人的差距。该报告展示了两年半来消费者AI产品使用情况的演变数据。谷歌首次凭借Gemini、AI Studio、NotebookLM和Google Labs四款产品进入顶级生成式AI消费网络产品榜单。移动端Gemini排名第二,月活用户约为ChatGPT的一半。

英伟达CEO:更先进AI模型将推动芯片与数据中心持续增长

英伟达CEO:更先进AI模型将推动芯片与数据中心持续增长

英伟达CEO黄仁勋在公司财报电话会议上表示,未来十年将看到显著增长机遇,预计AI基础设施支出到本世纪末可达3-4万亿美元。他指出,采用"推理"技术的新AI模型需要传统大语言模型100倍以上的计算能力,这种"长思考"模式能产生更好答案。随着代理系统和机器人模型的发展,对芯片、能源和数据中心的需求持续上升。

KAIST韩国科技院的新发现:AI能看懂越南考试题吗?答案让人意外

KAIST韩国科技院的新发现:AI能看懂越南考试题吗?答案让人意外

韩国科技院研究团队创建ViExam数据集,首次全面评估视觉语言模型在越南语多模态考试中的表现。通过2548道涵盖七个学科的题目测试,发现顶级AI模型平均准确率仅57.74%,低于人类学生66.54%的水平。研究揭示AI在多模态推理方面的局限性,为多语言AI发展提供重要参考。

普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

普渡大学研究团队突破:让人工智能"看见"物体真实大小的神奇方法

普渡大学研究团队开发的深度平衡正则化器(DEC)解决了AI模型在处理不同大小物体时判断不一致的问题。该方法基于单调缩放群理论,通过潜在空间正则化显著提升了ViT、Swin等模型的尺度一致性和整体准确率,在ImageNet等数据集上表现优异,为自动驾驶、医疗图像分析等应用提供更可靠的视觉识别能力。