最新文章第12页

2025-09-02

2025 年的四大 CAD 趋势

2025 年带来了地缘政治和经济的不确定性，使制造商不得不考虑将时间和资源投资于何处。因此，工程领导者正在关注产品开发和 CAD 的变化，这些变化可能会立即影响业务成果。

人工智能

3D编辑技术

新型算法

2025-09-02

北航团队发明"神奇修改器"：让3D模型编辑如同PS照片一样简单

北航团队推出VoxHammer技术，实现3D模型的精确局部编辑，如同3D版Photoshop。该方法直接在3D空间操作，通过逆向追踪和特征替换确保编辑精度，在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集，为3D编辑领域建立新标准，展现出在游戏开发、影视制作等领域的巨大应用潜力。

3D物理仿真

计算机视觉

CLIP特征预测

2025-09-02

宾大研究团队开发PIXIE：让计算机仅通过视觉就能预测物理世界的"物理大师"

宾夕法尼亚大学研究团队开发出PIXIE系统，这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒，准确率提升高达4.39倍，并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集，为相关技术发展奠定了重要基础，在游戏开发、机器人控制等领域具有广阔应用前景。

人工智能

强化学习

开源技术

2025-09-02

ByteDance研发了一个神奇的AI"调光器"：让机器推理像灯泡一样想亮就亮

字节跳动团队开发的ThinkDial系统首次实现了开源的AI可控推理技术，让用户能像调节灯光一样控制AI思考深度。系统提供高、中、低三种模式，在减少50-75%计算量的同时，性能损失控制在10-15%内。通过创新的端到端训练方法和泄露惩罚机制，ThinkDial打破了技术垄断，实验表现与OpenAI专有模型相当，为AI技术民主化奠定基础。

人工智能

音频驱动视频生成

电影级视频制作

2025-09-02

阿里巴巴让声音"导演"电影场景：从一段音频到完整电影级视频的神奇魔法

阿里巴巴通义实验室开发的Wan-S2V系统实现了音频驱动电影级视频生成的重大突破。该140亿参数模型能仅凭音频创造复杂场景视频，包括多角色互动、动态摄像机运动等，远超传统"说话头像"技术。通过创新的文本-音频协同控制和长视频连贯性技术，在多项评估中显著优于现有竞品，为视频创作民主化开辟了新路径。

NVIDIA与CMU联合开发：让AI像写文章一样理解视频，一个模型搞定所有视频任务

视频理解

通用模型

并行训练

2025-09-02

NVIDIA与CMU联合开发：让AI像写文章一样理解视频，一个模型搞定所有视频任务

NVIDIA联合CMU等机构开发了AUSM通用视频分割模型，首次将语言模型思路引入视频理解，用一个模型统一处理各种视频任务。该模型采用创新的并行训练策略，训练速度提升2.5倍，在七个权威数据集上均达到领先水平。AUSM突破了传统方法需要针对不同任务训练专门模型的限制，为视频AI应用提供了更简洁高效的解决方案。

人工智能

网络安全

实战训练环境

2025-09-02

AI训练神器"道场"：让网络安全机器人学会真实的黑客攻击

由蒙纳士大学和AWS AI实验室联合开发的CTF-DOJO是全球首个网络安全AI训练环境，包含658个真实CTF挑战。通过创新的CTF-FORGE自动化系统，仅用486个高质量训练样本就让AI在三大权威测试平台上取得显著提升，32B模型达到31.9%成功率，媲美顶级商业系统，为开源AI安全研究开辟新路径。

人工智能

多臂老虎机算法

幻觉缓解技术

2025-09-02

摩根大通开发的AI幻觉"疫苗"：让大语言模型不再胡说八道的神奇药方

摩根大通AI研究团队开发了QueryBandits系统，通过智能改写问题来减少大语言模型的幻觉现象。该系统分析17个语言特征，自动选择最适合的改写策略，在13个测试数据集上实现了87.5%的改进效果，比静态改写方法高出42.6%-60.3%，为AI交互优化开辟了新方向。

人工智能

AI创新者大会

2025-09-02

阿里、百度、360等AI负责人、跨界艺术家、具身智能天团齐聚，PEC 2025 暨第二届AI创新者大会议程重磅公布

一句提示词，一个新世界 (One word, one world)。

人工智能

自然语言处理

安全防护优化

2025-09-02

OpenAI承认长时间对话可能绕过AI安全防护措施

OpenAI在最新博客中首次承认，其AI安全防护在长时间对话中可能失效。该公司指出，相比短对话，长对话中的安全训练机制可能会退化，用户更容易通过改变措辞或分散话题来绕过检测。这一问题不仅影响OpenAI，也是所有大语言模型面临的技术挑战。目前OpenAI正在研究加强长对话中的安全防护措施。

人工智能

云计算

基础设施投资

2025-09-02

谷歌公布90亿美元弗吉尼亚州数据中心投资计划

谷歌宣布计划到2026年底在弗吉尼亚州投资90亿美元，重点发展云计算和AI基础设施。投资包括在里士满南部切斯特菲尔德县建设新数据中心，扩建现有设施，并为当地居民提供教育和职业发展项目。弗吉尼亚州长表示这项投资是对该州AI经济领导地位的有力认可。此次投资是谷歌北美扩张战略的一部分。

人力资源管理

员工发展

留任策略

2025-09-02

员工留任：留住顶尖人才的7大策略

技术岗位失业率仅为2.9%，使得IT人才竞争异常激烈。72%的CIO将招聘和留住技能人才视为首要问题。研究显示，自愿离职率低于10%的组织，其整体绩效表现高出18%。成功的员工保留策略包括：识别高绩效员工、主动参与互动、赋予挑战性工作、强调工作影响力、让员工感受价值认可、提供针对性培训，以及专注于所有员工的成长发展。

人工智能

服务器技术

营收增长

2025-09-02

戴尔AI业务推动营收创历史新高

戴尔第二财季营收同比增长19%至创纪录的298亿美元，其中服务器和网络业务在AI需求推动下暴涨69%。基础设施解决方案集团营收增长44%至168亿美元，首次超越客户解决方案集团。公司上半年AI解决方案出货额达100亿美元，超过去年全年，并将全年AI服务器出货指导价提升至200亿美元。全闪存存储产品表现强劲，但传统存储需求疲软。

人工智能

评估模型

新型算法

2025-09-02

AI智能助理终于学会给研究论文"打分"了！字节跳动团队让机器评委上岗

字节跳动团队开发了首个AI研究助手评估系统ReportBench，通过对比AI生成报告与专家综述论文的引用质量，并验证陈述准确性来评估AI助手表现。研究发现OpenAI Deep Research引用准确率38.5%，Gemini为14.5%，两者都存在陈述和引用幻觉问题。该系统为AI研究助手建立了标准化质量检测工具，推动行业发展。

视频理解

深度学习

认知评估

2025-09-02

台湾大学团队开发MovieCORE：让AI像人类一样深度理解电影的创新数据集

台湾大学研究团队开发了MovieCORE数据集，这是首个专门训练AI深度理解电影内容的创新工具。该数据集通过多AI智能体协作生成复杂问题，采用认知分类法测量思维深度，99.2%的问答需要高层次思维。研究还开发了ACE增强技术，可将AI性能提升25%。实验显示现有AI在深度视频理解方面仍存在显著不足，为未来AI发展指明了方向。

人工智能

专家混合模型

推理优化

2025-09-02

东京科学技术大学团队揭秘：专家混合模型在推理任务中并非专家越多越好

东京科学技术大学团队通过大规模实验发现，专家混合模型在处理推理任务时存在"专家过多反而有害"的现象。研究显示，对于记忆性任务，专家数量越多性能越好；但对于数学推理等需要深度思考的任务，存在最优专家数量，超过这个临界点性能会下降。该发现为AI系统架构设计提供了重要指导，揭示了"少而精"策略在某些场景下优于"多而全"的传统观念。

3D修复技术

视频生成模型

跨模态应用

2025-09-02

南京大学团队让AI修复3D物体，就像视频编辑一样简单！

南京大学等高校联合研究团队开发出ObjFiller-3D技术，巧妙地将3D物体修复转化为视频编辑问题。该技术利用视频模型的时序一致性优势，能够高质量修复3D物体缺失部分，在图像质量和处理速度上均大幅超越现有方法。技术支持参考图像引导修复，可广泛应用于文物保护、数字内容创作等领域，为3D修复和编辑任务提供了统一高效的解决方案。

网络科学

认知架构

分布式学习

2025-09-02

解开AI大脑密码：揭秘大语言模型的"思维模块"如何像生物大脑一样协同工作

伦斯勒理工学院研究团队通过网络科学方法首次系统揭示了大语言模型的内部"认知架构"。研究发现AI模型采用类似鸟类大脑的弱定位架构，模块间通过分布式协作而非专业化分工来处理认知任务。这一发现颠覆了基于功能模块优化的传统思路，指出应充分利用网络级协作来提升AI性能。

人工智能

工具集成推理

强化学习优化

2025-09-02

腾讯研究团队首次从理论高度解密AI为何需要工具，背后竟隐藏着这样的数学原理

腾讯和清华研究团队首次从数学理论角度解释了为什么AI需要外部工具。研究证明纯文本AI存在"隐形枷锁"，无法突破预训练的能力边界，而工具集成能打破这种限制，让AI获得全新的问题解决策略。团队还开发了ASPO算法，解决了训练AI更早使用工具的技术难题。实验显示配备工具的AI在数学问题上全面超越纯文本版本，展现出三种新奇认知模式，为构建更强大的AI系统提供理论指导。

人工智能

视觉语言模型

效率优化

2025-09-02

多模态视觉语言模型的智能"减肥术"：亚利桑那州立大学团队让AI看图说话快2倍

亚利桑那州立大学团队开发出MMTok技术，通过多模态覆盖最大化方法，让视觉语言AI模型在保持98.7%准确度的同时实现1.87倍速度提升。该方法同时考虑图片和文字信息来智能选择关键视觉令牌，将处理的视觉信息从2880个压缩到160个，显著降低计算成本和内存使用，为AI系统的实际部署提供了高效解决方案。

新硅NewGeek

追踪每一个硅基生命的动向

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: