多年以来,数字孪生一直被宣扬为航天工业的下一个大事件。而随着技术的不断发展,行业企业也切实感受到复杂卫星网络的设计工作正对数字工程工具提出更高的要求。
专注太空系统的数字工程软件开发初创厂商Sedaro公司联合创始人兼CEO Robbie Robertson表示,“如今我们终于迎来了转折点,从备受嘲讽的炒作噱头成为人们真正需要的技术工具。”
这家总部位于弗吉尼亚州阿灵顿的公司成立于2016年,已获得美国国防部和NASA颁发的近300万美元小型企业研究奖,同时也在积极筹措风险投资。
Robertson认为,卫星星座体系的巨大规模和复杂性,已经让数字孪生成为必要前提。但最大的问题在于,军事领域之前就曾推出过头顶“数字孪生”之名的数字设计工具。
在他看来,对于大型卫星星座项目的规划和设计,“在将虚拟和物理两套体系对接起来时,其复杂性水平将达到人类自身根本无法管理的程度。”
随着国防部着手规划下一代太空系统,数字孪生在军事卫星项目中也越来越受到欢迎。
Sedaro的软件已经得到五角大楼内监督主要系统采购工作的部门所采纳。例如,导弹跟踪卫星网络的数字孪生,就能帮助决策者在购买卫星之前调整具体要求。
美国太空军还在使用数字孪生技术建立了一项名为Tetrra 5的实验,希望为在线卫星补充燃料。Robertson指出,“这也是需要同时交付数字孪生和物理系统的典型案例。”
用于数字工程的AI平台
数字工程初创公司Istari也接触过不少军事太空项目。这家年轻的企业得到了前谷歌CEO Eric Schmidt支持,并由五角大楼前采购官员Will Roper负责经营。
Istari公司创始人兼CEO Roper指出,如果能够通过建模和仿真来设计、测试甚至认证太空平台,那么军用飞机、卫星和其他系统的开发速度会更快、成本也更低廉。
但如今这一切还无法落地,因为军事采购计划依赖于不同承包商间多种模型和模拟方案的混合,它们不可能在统一的集成数字环境中协同运作。
Istari的AI平台将充当模型和模拟场景的通用操作系统,希望让来自各家承包商的任何模型都能在这里即插即用。
Roper还提到,美国太空军将从这项技术中显著获益。例如,未来的卫星操作人员将在工程师设计的相同模型上进行训练,由此建立起真正的数字线程,允许工程师使用来自用户的实时数据不断更新并改进自身设计。
“真正的”数字孪生
Robertson指出,客户们常常会被营销宣传语和数字孪生的多种定义搞得晕头转向。他给出的解释是“物理系统的高保真虚拟表示,贯穿其整个生命周期,且轨道系统及其孪生的行为之间完全同步。”
Sedaro公司今年4月推出了其云数字工程工具的更新版本,希望借此破除怀疑论者们一直在抨击的过度炒作问题。
“不少人对我们在太空系统数字工程方面的进展感到失望。”这也确实可以理解,“因为我们还没能动用软件来显著提高硬件技术的复杂性和质量。”
多年以来,国防部卫星项目一直依赖于已有几十年历史的内部商业软件产品,在混乱和冲突当中勉强设计自己的数字孪生体系。Robertson坦言,这些遗留技术根本无法扩展进军方面向未来规划的大型卫星星座项目,例如太空发展局(SDA)提出的近地轨道架构。
运用数字工程规划星座项目
在最近的通信卫星招标中,美国太空发展局要求承包商提交其卫星的数字表示,以便该局能够据此构建模型。Robertson表示,“他们并没有明确要求提供数字孪生副本”,但明显正朝着这个方向努力。“从种种迹象来看,数字孪生对于特定组织已经具有重大意义。”
而对国防部来说,掌握在轨卫星的数字孪生“将是这项技术最令人兴奋的未来应用。”
他还补充称,传统上人们一直把工程仿真当作一种设计工具,“它存在于硬件甚至是物理系统出现之前。”
“但数字孪生的意义在于指导运营,以极高的保真度实现系统模拟,借此帮助持有者优化使用方式,从军事角度发现漏洞并开展预测性维护。这也正是数字孪生技术在其他行业中的主流应用方式。”
要想在国防市场上占据一席之地,数字工程平台必须提供一套可互操作的环境,如同我们熟悉的互联网一样。因此国防部绝不能过度依赖单一供应商,太空发展局也不可能接受投入数百万美元从不同制造商处购买无法兼容的卫星模型和软件工具。
Robertson提到,在太空军内部,包括数字工程在内的各种数字技术也正被引入行动中的方方面面。
但这一切在用户层面会带来哪些影响仍不明确。“军方高层希望转型为数字形态,但却仍然依赖于传统供应商提供的定制型软件工具。”
根据“国家太空试验与训练中心”这一新计划的设想,美国太空军将就包括数字工程在内的多项技术寻求行业建议。
Robertson认为,“目前整个数字工程生态和工具集都已经出现,包括数字孪生所需要的各种元素。但市场上还没有出现明确的赢家。”
领域之内也面临着艰难的决定,“各方都在投入重复、甚至可以说是多余的努力,为的就是自己能像云计算时代那样成为最后的巨头。”
美国太空司令部已经在今年4月宣布计划,将启动一套数字工程“生态系统平台,以帮助美国太空军及其任务合作伙伴始终在与威胁的对抗中占据领先。”
该数字平台预计将于2025年完工,“将有助于整合整个太空军生态系统内的各现有数字工程成果。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。