数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
谷歌终于公开了其AI助手Gemini的详细使用限制和配额规则。此前用户对于Gemini的使用次数、频率限制等一直不够明确,经常遇到突然无法使用的情况。此次谷歌明确了不同订阅级别用户的具体使用配额,包括免费用户和付费用户的区别待遇,以及针对不同功能模块的限制标准,为用户提供了更透明的使用指导。
OpenAI正式进军影视娱乐行业,推出名为Critterz的AI驱动动画电影项目。该项目展示了人工智能在内容创作领域的最新突破,标志着AI技术从传统的文本和图像生成扩展到完整的影视制作流程。这一举措将对传统好莱坞制片模式产生重大影响,同时为AI在创意产业的应用开辟新的可能性。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。
微软与人工智能基础设施提供商Nebius签署了一项价值高达近200亿美元的合作协议,后者将从其位于新泽西州的新数据中心提供专用GPU基础设施容量。该协议五年期价值174亿美元,如微软增加计算需求,预购选择条款可将潜在价值扩展至194亿美元。Nebius将利用协议现金流为数据中心建设融资并采购必要芯片。
谷歌DeepMind团队开发的GraphCast是一个革命性的AI天气预测模型,能够在不到一分钟内完成10天全球天气预报,准确性超越传统方法90%的指标。该模型采用图神经网络技术,通过学习40年历史数据掌握天气变化规律,在极端天气预测方面表现卓越,能耗仅为传统方法的千分之一,为气象学领域带来了效率和精度的双重突破。
韩国成均馆大学研究团队开发了首个机器遗忘可视化评估系统Unlearning Comparator,解决了AI"选择性失忆"技术缺乏标准化评估的问题。系统通过直观界面帮助研究人员深入比较不同遗忘方法,并基于分析洞察开发出性能优异的引导遗忘新方法,为构建更负责任的AI系统提供重要工具支持。
ByteDance等机构联合发布的MM-BrowseComp是首个专门评估AI多模态网页浏览能力的测试基准。该研究包含224道需要综合处理文字、图像、视频信息的题目,测试结果显示即使是最先进的OpenAI o3模型也只达到29%的准确率,揭示了当前AI在多模态信息理解方面的技术短板,为未来AI发展指明了重要方向。
华东师范大学等机构联合开发FineCE方法,首次实现AI系统在文本生成过程中的细粒度实时信心评估。该方法通过蒙特卡罗采样构建训练数据,结合后向信心整合策略,让AI能够准确判断自己答案的可靠性。实验显示在多个基准数据集上显著优于现有方法,为AI安全性和可解释性研究开辟新方向。
复旦大学团队提出PASR技术,首次让AI具备在生成过程中主动反思和修正的能力,改变了传统AI只能事后修改的局限。该方法在10个任务上显著提升了准确率,同时降低了41.6%的计算消耗,代表了AI从被动执行向主动思考的重要转变。
悉尼科技大学等机构联合提出REARM框架,通过元网络过滤模态共享特征噪声,运用正交约束保护独特信息,并深度挖掘用户兴趣与商品关联关系,在多个电商数据集上显著提升推荐准确性,为多模态推荐系统的个性化与精准化提供了新的技术路径。
ByteDance Seed等机构联合开发的FutureX是首个专门测试AI未来预测能力的实时平台,每日从195个网站收集真实事件让25个AI模型预测,完全避免数据污染。测试发现Grok-4等先进模型在复杂预测中表现优秀,但与人类专家相比仍有差距,为AI预测能力发展提供了重要基准。
武汉大学团队开发出FinCDM金融AI认知诊断框架,首次将教育心理学的认知诊断理论应用到金融AI评估中。该框架能像医生体检一样精确诊断AI模型在70个金融概念上的具体掌握情况,而非传统的粗糙总分评估。研究构建了基于CPA考试的高质量数据集,对30个AI模型的测试揭示了模型间的隐藏差异和现有评估的盲区,为金融AI的精准选择和针对性改进提供了重要工具。
上海人工智能实验室等机构联合开发的MeshCoder系统能将3D物体点云自动转换为可编辑的Blender Python代码。该系统采用分层训练策略,先训练部件识别模型,再训练整体推理模型,在重建精度上显著优于现有方法。生成的代码支持灵活的几何和拓扑编辑,并能增强大语言模型对3D形状的理解能力,为游戏开发、建筑设计等领域带来新的可能性。
香港城市大学等机构联合开展的首个扩散大语言模型量化研究发现,这类新型AI模型存在特殊的激活异常值分布模式,为量化压缩带来新挑战。研究系统评估了多种量化方法,发现4位权重量化和8位权重激活同时量化是目前最实用的选择,GPTQ和DuQuant分别在两种策略中表现最佳,为扩散语言模型的实用化部署提供了技术指导。
阿里达摩院推出RynnEC,这是一个专为机器人设计的视频理解AI模型。它能让机器人像人类一样理解物理空间,准确识别物体位置、判断距离关系,甚至预测行动后果。该技术在认知测试中超越现有AI模型10.7个百分点,并提供轻量版本便于实际部署,为未来智能机器人的普及铺平道路。
NVIDIA发布Nemotron Nano 2混合AI模型,采用创新的Mamba-Transformer架构,在保持90亿参数规模的同时,实现了比同类模型3-6倍的推理速度提升。该模型在数学、科学、编程等复杂推理任务上表现出色,支持15种语言,能在单GPU上处理12.8万字符长文本,为高效AI应用开辟了新路径。
ByteDance Seed和南京大学研究团队提出DuPO双向学习训练法,让AI模型通过"出题-验证"的方式自我提升,无需人工标注。该方法在多语言翻译和数学推理上效果显著,让7B模型达到GPT-4o水平,数学推理提升6.4个百分点。这一突破为AI自主学习开辟新路径,大幅降低训练成本。