法国研究者提出TPTT框架,通过混合注意力机制和智能记忆管理,让现有AI大模型无需重训练就能获得超长文本处理能力。该技术在多个10亿参数模型上验证有效,Llama-3.2-1B精确匹配率提升20%,已开源供社区使用。
德州农工大学研究团队发现多模态AI存在"视觉质量悖论",即AI在处理略显模糊或有噪点的图片时,在推理任务上反而表现更好。研究开发了VQ-TTT技术,能动态调整图片特征以匹配AI偏好,最高提升8.6%准确率且计算开销极小。这一发现挑战了"高画质对AI更好"的传统认知,为AI优化提供新思路。
微软将在今年夏季晚些时候推出Windows恢复力计划,著名的Windows蓝屏死机将被新的黑屏替代。这一变化是微软对2024年7月CrowdStrike故障事件的回应,该事件导致约850万台Windows设备瘫痪。作为Windows恢复力计划的一部分,微软正在重新设计Windows代码,让安全软件在内核外运行,以提高系统稳定性和恢复能力,减少因第三方安全软件问题导致的系统崩溃。
随着GPU成为AI工作负载训练和运营的关键,越来越多的云服务提供商开始提供云GPU实例。这为希望避免部署GPU硬件费用和复杂性的组织带来好消息。云GPU实例可按超大规模与专业化提供商、通用与专用实例、共享与独占服务器进行分类。选择时需考虑工作负载类型、GPU类型、成本、延迟和控制级别等因素。
企业云服务平台IFS收购硅谷代理AI专家theLoops,推出"工业AI"概念。该技术旨在创建具备语义环境感知能力的自主AI代理,专门服务于制造、能源、建筑等资产密集型行业。这些工业AI代理能够理解业务职责,遵循行业规则,与人类协同工作,执行实际工作任务而非简单的聊天或辅助功能,为企业带来可衡量的生产力提升和投资回报。
数据中心行业往往专注于生成式AI的物理需求,如密集GPU机架和散热需求,但却忽视了GenAI对整个软件堆栈的颠覆性影响。专家指出,软件实际上是推动变革的核心驱动力。AI将在编程自动化、企业软件重构、存储需求提升和网络安全等多个层面带来深刻变革,传统SaaS厂商面临AI原生初创企业的挑战。
韩国科学技术院研究团队公布了HBM4至HBM8四代高带宽内存技术发展路线图。HBM5将于2029年采用浸没式冷却技术,HBM7和HBM8将集成嵌入式冷却。从HBM6开始将使用铜对铜直接键合技术。HBM8带宽可达64TBps,堆栈容量提升至240GB,比HBM4提升50%。英伟达Feynman加速器计划采用HBM5技术。
小米科技生态站上新起点:首款SUV小米YU7、小米AI眼镜等新品重磅发布,玄戒O1超大规模量产。
创新突破边界,技术重塑未来。今日,是德科技在上海成功举办了年度技术交流盛会Keysight World Tech Day 2025。
Jabra 推出 PanaCast 40 VBS:首款专为小会议室设计的 180° Android 智能音视频一体机
这是一项关于计算机视觉技术突破的研究,由多家知名院校联合完成。研究团队开发了LINO-UniPS系统,能让计算机像人眼一样从不同光照下的照片中准确识别物体真实的表面细节,解决了传统方法只能在特定光照条件下工作的局限性,为虚拟现实、文物保护、工业检测等领域带来重要应用前景。
这篇文章介绍了北京人工智能研究院开发的OmniGen2模型,一个能够同时处理文字转图像、图像编辑和情境生成的全能AI系统。该模型采用双轨制架构,分别处理文本和图像任务,并具备独特的自我反思机制,能够自动检查和改进生成结果。研究团队还开发了专门的数据构建流程和OmniContext评测基准,展现了开源模型的强大潜力。
清华大学和新加坡技术设计大学联合发布了突破性AI写作研究LongWriter-Zero,该模型完全通过强化学习训练,无需任何长文样本即可生成万字高质量文章。实验显示,仅32B参数的LongWriter-Zero在WritingBench和Arena-Write基准测试中均超越了千亿参数级的顶级模型,证明了创新训练方法胜过单纯扩大模型规模的理念。
被盗凭证导致80%的企业数据泄露。随着AI智能体投入生产,管理10万员工的企业将需要处理超过100万个身份。传统身份访问管理架构无法应对智能体AI的大规模部署。领先厂商正采用蓝牙低功耗技术替代硬件令牌,实现基于距离的身份验证。行为分析可实时捕获被入侵的智能体,零信任架构扩展至智能体部署。这代表了自云计算普及以来最重要的安全变革。
随着AI在各行业中变革企业运营,数据存储面临关键挑战。PEAK:AIO和Solidigm在VB Transform大会上展示了医疗影像AI创新,通过与MONAI开源框架合作,重新定义数据基础设施如何支持医院实时推理和训练。他们的软件定义存储技术结合高性能固态硬盘,能够存储超过200万份全身CT扫描,在空间和功耗受限的边缘环境中实现卓越性能,为临床AI应用提供所需的速度、安全性和可扩展性。
谷歌将Agent2Agent协议捐赠给Linux基金会,联合亚马逊AWS、思科、微软、Salesforce、SAP和ServiceNow等主要技术厂商,共同推进AI代理通信标准化。该协议作为通信层,允许AI代理发现彼此能力、安全交换信息并协调复杂任务。目前已有超过100家技术公司支持该协议,有望解决企业AI部署中的平台碎片化问题,实现跨平台代理互操作性。
谷歌DeepMind发布AlphaGenome人工智能工具,可全面预测人类DNA序列突变或变异对基因调节的影响。该模型能处理长达100万个碱基对的DNA序列,预测数千种分子特性,包括基因起止位置、剪接位置和蛋白质产量等。AlphaGenome在多项基因组预测基准测试中达到最先进性能,可预测剪接错误引起的罕见遗传疾病。研究人员认为这是该领域的里程碑,有望成为疾病研究的强大工具。
Cosmoe是一个现代化的C++用户界面库,专为构建原生Wayland应用而设计。该项目虽然刚刚发布,但已相当成熟完整且轻量化。它无需额外运行时支持,让开发者能够构建多线程Linux应用程序。Cosmoe具有独特清新的外观设计,API完整稳定。该项目源于BeOS重建项目,现在提供了一种在Wayland环境下实现BeOS风格界面的新途径,为Linux桌面开发提供了Qt和Gtk之外的另一种选择。
ByteDance智能创作实验室发布的Phantom-Data是首个大规模跨情境主体一致性视频生成数据集,包含约100万个身份一致配对样本。该数据集通过创新的三阶段构建管道,从5300万视频和30亿图像中精选高质量跨场景配对,有效解决AI视频生成中的"复制粘贴"问题,显著提升文本遵循能力和视觉质量。
普林斯顿大学研究团队开发了ReasonFlux-PRM,这是首个能深度理解AI复杂思维过程的评分系统。不同于传统只看最终答案的评估方法,新系统能评判AI思考轨迹的每个步骤质量,在数学和科学推理任务上实现了平均4.5%-12.1%的性能提升,为AI教育和训练提供了突破性的解决方案。