最新文章
字节跳动重磅发布OmniHuman-1.5:会"思考"的虚拟人,告别千篇一律的呆板表演

字节跳动重磅发布OmniHuman-1.5:会"思考"的虚拟人,告别千篇一律的呆板表演

字节跳动推出OmniHuman-1.5,首次将认知科学的双系统理论应用到虚拟人技术中。该技术通过多模态大语言模型模拟人类的推理思考,结合创新的MMDiT架构和伪最后帧技术,让虚拟人不再只是机械地同步口型,而是能够根据说话内容的语义做出相应的表情和动作,大幅提升了虚拟人表现的自然度和智能化水平,为教育、娱乐、客服等领域带来革命性应用前景。

字节跳动突破AI训练效率瓶颈:TreePO让强化学习"长脑子"了

字节跳动突破AI训练效率瓶颈:TreePO让强化学习"长脑子"了

字节跳动团队开发的TreePO技术通过树状结构重新组织AI推理过程,让多个推理路径共享相同前缀,避免重复计算。该技术在保持准确率的同时将训练效率提升22%-43%,在数学推理任务上表现优异,准确率从46.63%提升至58.21%。这项创新不仅能让AI助手响应更快更准,还可应用于教育、科研等多个领域,代表了从追求模型规模向追求算法效率的重要转变。

“茅王”也好,“寒王”也罢,谁手持AI两大新王?
2025-09-03

“茅王”也好,“寒王”也罢,谁手持AI两大新王?

截止至9月2号,寒武纪(SH:688256)在连续两个交易日股价大幅回调后,9月第2个交易日收涨2.18%。

OpenAI为ChatGPT预览新安全功能

OpenAI为ChatGPT预览新安全功能

OpenAI今日宣布计划为ChatGPT配备新的安全功能,当用户遭遇心理或情感困扰时能提供更有效的帮助。首项更新将专注于GPT-5的路由组件,能检测用户急性困扰并调用推理优化的大语言模型。公司还将推出家长控制功能,允许家长与青少年账户关联,设置年龄适宜的行为规则并禁用特定功能。系统检测到青少年处于急性困扰时会发送通知。OpenAI将与青少年发展、心理健康专家委员会及全球医师网络合作完善这些功能。

CTERA调查:83%企业从勒索软件攻击中恢复

CTERA调查:83%企业从勒索软件攻击中恢复

CTERA云文件服务公司发布的2025年数据与云战略调查报告显示,83%在过去两年遭受勒索软件感染的企业成功恢复,仅17%遭受永久数据丢失。调查涵盖美国、欧洲、中东、非洲和亚太地区300名高级IT和安全负责人,所有受访企业均在过去两年内遭遇勒索软件攻击。报告显示80%的领导者将安全视为2025年首要关注点,仅10%企业支付赎金。此外,98%受访者正在部署大语言模型和AI工具。

英伟达财报揭示超大规模云服务商主导AI基础设施变革

英伟达财报揭示超大规模云服务商主导AI基础设施变革

英伟达最新财报显示,尽管面临地缘政治压力和新兴竞争对手,公司依然保持强劲增长。超大规模云提供商如微软、谷歌和亚马逊AWS占其销售额近40%,体现了AI需求的高度集中。博通在数据中心领域的作用日益重要,其网络技术与英伟达GPU形成互补。企业级市场采用较慢,但概念验证项目增长显示需求正在复苏。

五步防护方案阻止恶意提示攻击智能家居AI设备

五步防护方案阻止恶意提示攻击智能家居AI设备

提示词恶意软件是一种针对对话式和生成式AI的新型恶意攻击,能强制AI执行用户不希望的指令。研究人员在黑帽大会上演示了如何通过隐藏在日常消息中的恶意提示词,让谷歌Gemini AI控制智能窗户、锅炉等设备。防护措施包括:及时更新设备系统,拒绝打开未知来源消息,避免让AI总结不可信内容,在邮件和日历等应用中禁用AI功能,以及谨慎复制粘贴邮件主题和文件名等内容。

微软推出Windows 11 25H2预览版,Win10支持即将终止

微软推出Windows 11 25H2预览版,Win10支持即将终止

微软向Windows Insider发布了Windows 11 25H2预览版,正式版将于今年晚些时候推出。该版本采用与24H2相同的服务分支,安装过程类似启用包。市场数据显示,Windows 11份额达49.08%,Windows 10为45.53%,新系统继续保持领先。在美国市场,Windows 11份额接近60%,而在欧洲市场Windows 10仍占主导地位。随着Windows 10即将停止免费支持,用户迁移趋势值得关注。

Denodo声称DeepQuery能超越生成式AI的表面洞察

Denodo声称DeepQuery能超越生成式AI的表面洞察

Denodo推出DeepQuery功能,声称可超越检索增强生成技术的局限性。该技术不仅检索事实,还能进行调查、综合分析并解释推理过程。DeepQuery基于Denodo数据管理平台的语义层,可直接访问实时企业数据,通过结构化推理分析多数据源,为复杂的多步骤分析问题提供可解释的答案。该技术面向业务用户和分析师,让非技术团队能用自然语言提问并获得基于证据的可信洞察。

d-Matrix声称3D堆叠内存将突破AI推理瓶颈

d-Matrix声称3D堆叠内存将突破AI推理瓶颈

数字内存计算芯片初创公司d-Matrix推出3D堆叠内存技术,声称相比当前行业标准HBM4,该技术可将AI模型运行速度提升10倍,能耗降低90%。该公司成立于2019年,采用LPDDR5内存配合数字内存计算硬件,通过改进的SRAM单元直接在内存阵列中执行计算。首款3DIMC芯片Pavehawk已在实验室投入运行,下一代架构Raptor将整合该技术。

高盛警告:AI泡沫可能冲击数据中心繁荣

高盛警告:AI泡沫可能冲击数据中心繁荣

高盛研究显示,受AI需求驱动,数据中心容量预计到2027年将激增50%,该行业能耗到2030年将翻倍。目前全球数据中心容量约62吉瓦,AI工作负载仅占13%,但预计2027年将达28%。AI数据中心繁荣可能使全球半导体收入在2024-2030年间翻倍,超过1万亿美元。然而高盛警告正密切关注AI采用可能不及预期的迹象。

网络安全专业人员需具备AI技能需求激增

网络安全专业人员需具备AI技能需求激增

研究显示,90%的企业正在试点或实施AI技术,较2023年的59%大幅上升。与此同时,网络安全威胁日益严峻,29%的技术领导者表示其组织在过去两年遭受重大攻击。AI正被广泛部署到网络安全团队中,从威胁检测到漏洞分析,各个环节都在AI化。因此,具备AI技能的网络安全人才需求激增,成为招聘的重要标准。未来网络安全将是人工智能与人类专家相结合的混合模式。

2025-09-02

2025 年的四大 CAD 趋势

2025 年带来了地缘政治和经济的不确定性,使制造商不得不考虑将时间和资源投资于何处。因此,工程领导者正在关注产品开发和 CAD 的变化,这些变化可能会立即影响业务成果。

北航团队发明"神奇修改器":让3D模型编辑如同PS照片一样简单

北航团队发明"神奇修改器":让3D模型编辑如同PS照片一样简单

北航团队推出VoxHammer技术,实现3D模型的精确局部编辑,如同3D版Photoshop。该方法直接在3D空间操作,通过逆向追踪和特征替换确保编辑精度,在保持未修改区域完全一致的同时实现高质量局部修改。研究还创建了Edit3D-Bench评估数据集,为3D编辑领域建立新标准,展现出在游戏开发、影视制作等领域的巨大应用潜力。

宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"

宾大研究团队开发PIXIE:让计算机仅通过视觉就能预测物理世界的"物理大师"

宾夕法尼亚大学研究团队开发出PIXIE系统,这是首个能够仅通过视觉就快速准确预测三维物体完整物理属性的AI系统。该技术将传统需要数小时的物理参数预测缩短至2秒,准确率提升高达4.39倍,并能零样本泛化到真实场景。研究团队还构建了包含1624个标注物体的PIXIEVERSE数据集,为相关技术发展奠定了重要基础,在游戏开发、机器人控制等领域具有广阔应用前景。

ByteDance研发了一个神奇的AI"调光器":让机器推理像灯泡一样想亮就亮

ByteDance研发了一个神奇的AI"调光器":让机器推理像灯泡一样想亮就亮

字节跳动团队开发的ThinkDial系统首次实现了开源的AI可控推理技术,让用户能像调节灯光一样控制AI思考深度。系统提供高、中、低三种模式,在减少50-75%计算量的同时,性能损失控制在10-15%内。通过创新的端到端训练方法和泄露惩罚机制,ThinkDial打破了技术垄断,实验表现与OpenAI专有模型相当,为AI技术民主化奠定基础。

阿里巴巴让声音"导演"电影场景:从一段音频到完整电影级视频的神奇魔法

阿里巴巴让声音"导演"电影场景:从一段音频到完整电影级视频的神奇魔法

阿里巴巴通义实验室开发的Wan-S2V系统实现了音频驱动电影级视频生成的重大突破。该140亿参数模型能仅凭音频创造复杂场景视频,包括多角色互动、动态摄像机运动等,远超传统"说话头像"技术。通过创新的文本-音频协同控制和长视频连贯性技术,在多项评估中显著优于现有竞品,为视频创作民主化开辟了新路径。

NVIDIA与CMU联合开发:让AI像写文章一样理解视频,一个模型搞定所有视频任务

NVIDIA与CMU联合开发:让AI像写文章一样理解视频,一个模型搞定所有视频任务

NVIDIA联合CMU等机构开发了AUSM通用视频分割模型,首次将语言模型思路引入视频理解,用一个模型统一处理各种视频任务。该模型采用创新的并行训练策略,训练速度提升2.5倍,在七个权威数据集上均达到领先水平。AUSM突破了传统方法需要针对不同任务训练专门模型的限制,为视频AI应用提供了更简洁高效的解决方案。

AI训练神器"道场":让网络安全机器人学会真实的黑客攻击

AI训练神器"道场":让网络安全机器人学会真实的黑客攻击

由蒙纳士大学和AWS AI实验室联合开发的CTF-DOJO是全球首个网络安全AI训练环境,包含658个真实CTF挑战。通过创新的CTF-FORGE自动化系统,仅用486个高质量训练样本就让AI在三大权威测试平台上取得显著提升,32B模型达到31.9%成功率,媲美顶级商业系统,为开源AI安全研究开辟新路径。

摩根大通开发的AI幻觉"疫苗":让大语言模型不再胡说八道的神奇药方

摩根大通开发的AI幻觉"疫苗":让大语言模型不再胡说八道的神奇药方

摩根大通AI研究团队开发了QueryBandits系统,通过智能改写问题来减少大语言模型的幻觉现象。该系统分析17个语言特征,自动选择最适合的改写策略,在13个测试数据集上实现了87.5%的改进效果,比静态改写方法高出42.6%-60.3%,为AI交互优化开辟了新方向。