TechCrunch Disrupt 2025将于10月27-29日在旧金山举行,汇聚超过10,000名科技和投资领袖。Wonder Dynamics联合创始人、现Autodesk公司成员Nikola Todorovic将登台演讲。作为视觉效果资深专家转型AI企业家,他与演员Tye Sheridan共同推出了Autodesk Flow Studio,这是一个突破性AI平台,能让创作者无缝地将3D角色融入真人场景。该平台使用云端工具自动化复杂的灯光、动画和合成流程,为电影制作人提供更快速、更便捷的高端视觉效果制作途径。
全球风投市场二季度显现复苏迹象,退出价值达676亿美元,为经济放缓以来最高季度数据。尽管美国交易价值因缺少OpenAI大额融资而下降25%,但AI领域仍表现突出,Meta对Scale AI的143亿美元投资成为史上第二大风投交易。AI交易占2025年美国风投总额近三分之二。然而募资仍是最大挑战,上半年仅募得266亿美元,有望创十年新低。欧洲、亚太和拉美地区同样面临困境。
Perplexity AI是一款将搜索引擎和聊天机器人结合的"答案引擎",能够实时搜索网络并提供带引用的直接答案。该平台成立于2022年,已拥有2200万活跃用户。其深度研究功能可快速分析大量学术资料,生成详细报告。除基础搜索外,还支持文档总结、图像生成、代码编写等功能。提供免费版和每月20美元的专业版。目前正与三星等公司洽谈合作,但也面临多家媒体机构的版权诉讼挑战。
英超联赛与微软达成五年合作协议,将在官方应用中推出AI虚拟助手Premier League Companion。该工具基于Azure OpenAI技术,能回答球迷关于球员数据、比赛分析等问题,提供个性化内容推荐。这一举措旨在让球迷更多使用官方应用,同时为联赛获取更好的用户数据。全球体育联赛正掀起AI技术竞赛,通过智能工具增强球迷互动体验。
Skywork AI团队通过创新的人机协作数据处理方法,构建了史上最大规模的高质量偏好数据集SynPref-40M,训练出Skywork-Reward-V2系列模型。该系列在七项主要测试中全面超越现有最佳模型,证明了数据质量胜过算法复杂度的重要原理,为AI更好理解人类偏好开辟了新道路。
Meta研究团队发明了一种革命性的"三人舞"注意力机制,突破了传统AI只能处理两元关系的局限。这种新方法让AI能够同时分析三个元素间的复杂关系,在数学推理、编程和逻辑分析等任务上表现显著提升。更重要的是,新方法改变了AI的学习规律,能够用更少的数据获得更好的效果,为数据稀缺时代的AI发展指明了新方向。
人大团队提出HiRA框架,通过"元推理规划器-自适应协调器-专门执行器"的三层分工体系,让AI像企业团队一样协作处理复杂搜索任务。该系统将高层战略规划与具体执行分离,配备双通道记忆机制,在四个深度搜索基准上显著超越传统方法,为AI系统设计提供了分工协作的新思路。
阿里巴巴通义实验室发布WebSailor,这是首个让开源AI智能体在复杂网络信息搜索中达到"超人级"推理能力的完整训练方法。通过创新的高不确定性训练数据生成和强化学习算法,WebSailor在权威基准测试中的表现媲美顶级商业系统,将开源模型的复杂推理能力提升到了前所未有的高度。
多伦多大学团队开发出μ?Tokenizer智能医学系统,能够自动分析CT扫描并生成精准诊断报告。该系统采用创新的多尺度多模态处理技术,在保持高准确性的同时显著提升诊断效率。尽管参数量仅为同类系统的14%,但在多项医学评估指标上都显著超越现有技术,为缓解医疗资源紧张、提升诊断质量提供了重要技术支撑。
美团视觉AI团队开发出ARIG系统,让虚拟角色能够像真人一样参与自然对话。该技术通过交互行为理解、对话状态识别和实时表情生成三大模块,使虚拟角色能够实时理解对话情境并做出恰当反应,包括打断、反馈、思考等复杂交互行为。系统采用连续生成方法替代传统离散选择,显著提升了表情的自然度和多样性,在多项评测中均超越现有技术。
MIT研究团队突破传统AI图像生成瓶颈,开发出局部感知并行解码技术,将生成步骤从256步减少至20步,速度提升12.8倍。该技术通过发现AI绘图中的空间局部性规律,重新设计了生成架构,让AI能够同时在多个区域并行"作画"而不影响质量,为实时图像生成应用开辟新道路。
首尔国立大学研究团队提出STR-Match视频编辑技术,通过创新的时空相关性分数(STR分数)解决传统方法在帧一致性、运动保持和域转换方面的局限。该方法无需重新训练模型,可直接应用于现有文本到视频生成模型,在极端编辑场景下仍能保持高质量输出,为视频编辑领域带来突破性进展。
快手推出的Keye-VL是一个专门为短视频理解而设计的80亿参数AI模型,在视频内容理解、数学推理和多模态任务方面达到同类模型中的最高水平。该模型采用独创的五模式推理系统和四阶段训练策略,能自动判断任务难度并选择合适的思考方式,在快手自建的KC-MMBench短视频基准测试中大幅领先其他模型。
瑞典AI初创公司Lovable正在进行新一轮超1.5亿美元的融资,估值接近20亿美元。该公司专注于"氛围编程"领域,仅在今年2月完成1500万美元融资后数月就迎来估值大幅跃升。Lovable可通过文本提示构建完整网页应用,包括前端界面和数据库连接。公司去年11月发布产品,CEO称六个月内年经常性收入达5000万美元。近期还推出AI代理测试版,可自动执行代码编辑和调试等任务,采用基于使用量的收费模式。
Testin云测作为国内领先的AI测试服务商,凭借十余年技术积累与行业实践,正通过自动化测试解决方案推动企业降本增效,加速智能化升级进程。
传统数据工程面临数据质量差、治理不善等挑战,成为AI项目的最大障碍。多智能体AI系统通过协作方式正在彻底改变数据准备、治理和应用模式。Google Cloud基于Gemini大语言模型构建协作生态系统,让不同智能体专门负责数据工程、科学、治理和分析等任务。系统通过分层架构理解组织环境,自主学习历史工作流程,能够预防问题并自动处理重复性任务,大幅提升效率。
中科大团队开发出LongAnimation系统,解决了长动画自动上色中的色彩一致性难题。该系统采用动态全局-局部记忆机制,能够为平均500帧的动画进行稳定上色,性能比现有方法提升35-58%。核心创新包括SketchDiT特征提取器、智能记忆模块和色彩优化机制,可大幅提升动画制作效率。
南开大学团队开发出DepthAnything-AC模型,解决了现有AI距离估算系统在恶劣天气和复杂光照条件下性能下降的问题。通过创新的扰动一致性训练框架和空间距离约束机制,该模型仅用54万张图片就实现了在雨雪、雾霾、夜晚等复杂环境下的稳定距离判断,同时保持正常条件下的优秀性能,为自动驾驶和机器人导航等应用提供了重要技术支撑。
微软推出Copilot调优功能,让企业通过低代码工具利用自动化微调技术训练企业数据。与基于公开数据的通用AI模型不同,企业需要理解内部数据和流程的专业化模型。Gartner预测专业化GenAI模型市场将在2026年翻倍至25亿美元。这些模型通常基于开源模型构建,部署为小语言模型,提供更好的成本控制和数据安全性,同时更易符合欧盟AI法案要求。
福特CEO在阿斯彭创意节上坦言,AI将取代一半白领工作者,这是高管首次公开承认企业内部已讨论数月的现实。摩根大通、亚马逊等公司高管也预测大幅裁员。然而,这些工作并非完全消失,而是转化为零工经济模式。目前36%的美国员工已成为独立工作者,零工经济增长速度是整体劳动力的三倍。企业正将固定劳动成本转为可变零工成本,白领零工经济转型分四阶段推进,最终企业将保留20%全职员工但拥有500%更多零工关系。