创业公司Pythagora发布全新AI编程平台,通过14个专业AI代理实现从前端到后端的全栈应用开发。该平台支持开发者和非技术用户仅通过自然语言提示创建应用程序,涵盖规划、编码、测试、调试和部署全流程。与传统AI编程工具不同,Pythagora提供端到端解决方案,AI代理可自动处理前后端开发、API连接、数据库管理等任务,并具备专门的调试功能,让用户无需实际编写代码即可创建完整应用。
Context公司推出AI驱动的自动驾驶平台,可同时启动数千个AI代理执行深度研究、数据分析和报告生成等工作。该公司与高通建立战略合作,支持AI代理在骁龙神经处理单元上本地部署,实现在用户个人电脑而非云端运行的AI自动化。平台类似中国AI平台Manus,通过大语言模型执行复杂任务,包括企业搜索、代码解释、文档生成等应用,已完成1100万美元种子轮融资。
随着CISO地位和责任的提升,首席安全官角色变得更加复杂。除了持续评估安全态势外,现代CISO还必须与业务保持一致,支持关键业务目标。面对个人责任风险,CISO需要不断评估安全技术栈、团队文化、业务状态和方向。本文汇总了安全领导者必须回答的10个紧迫问题,涵盖业务促进作用、风险平衡、董事会沟通、技术风险传达、团队授权、客户需求、数据位置、AI影响和未来威胁等关键领域。
前沿模型代表了最先进的AI系统,具有多模态、零样本学习和智能体行为等关键特征。OpenAI的GPT-4o和谷歌的Gemini 1.5等为典型代表。专家指出,这些模型需要大量资源投入,在质量与成本之间寻求平衡。基准测试虽然重要但存在局限性。未来发展方向包括AI智能体、跨学科技术和非Transformer架构。预计十年内,前沿模型将成为无处不在的后台智能体,通过语音、视觉和情感等多种方式与人类自然交互。
AI智能体(AI Agent)也被称为代理型AI。这项技术正在引发巨大的热潮,是突破AI功能极限、深入改变企业运营与竞争方式的新一代AI解决方案。
Gartner预测,到2030年,守护代理(Guardian Agent)技术将在代理型人工智能(AI)市场中占据至少10%至15%的份额。
无线技术的未来,其实比想象中来得更快。6G技术的出现有望带来更高的性能和灵活性,其应用场景将远超我们今天的无线系统。预计到2030年代初,这些下一代网络就会投入商用,而整个行业正从研究阶段逐步转向开发和标准化阶段。
字节跳动联合浙江大学发布了ImmerseGen系统,这是一个能根据文字描述自动生成VR世界的AI工具。该系统采用轻量化代理和RGBA纹理技术,用AI代理协作完成从地形生成到物体布置的全流程,还能添加动态效果和环境音效。相比传统方法,它生成的场景效率提升数十倍,在移动VR设备上达到79帧流畅运行,为VR内容创作带来革命性突破。
慕尼黑大学研究团队开发了SwarmAgentic技术,这是首个能够完全自主生成智能体系统的框架,无需人工预设模板。该技术借鉴蜂群智能原理,让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中,SwarmAgentic表现优异,在旅行规划任务上比现有最佳方法提升261.8%,展现了全自动智能体系统设计的巨大潜力。
EPFL研究团队开发了首个专门测试AI计算机代理安全性的综合平台OS-HARM,通过150个测试任务发现包括GPT-4.1、Claude 3.7 Sonnet等在内的主流AI代理都存在严重安全漏洞,会执行有害指令、易受攻击欺骗,并可能因判断失误造成危险后果。
这项由德国慕尼黑大学等机构联合完成的研究提出了FedNano框架,创新性地解决了多模态大语言模型在联邦学习中的部署难题。通过将模型拆分为服务器端核心和客户端轻量级NanoEdge模块,结合Fisher合并技术处理数据异质性,实现了95%的存储减少和99%的通信优化,同时保持了优异性能,为AI技术的普及化应用开辟了新路径。
上海人工智能实验室联合多个机构发布了名为Sekai的全球首个世界探索视频数据集,包含超过5000小时来自101个国家750个城市的第一人称视角视频。数据集配备位置、天气、场景等丰富标注,并基于此训练了YUME交互式世界探索模型,用户可通过键盘鼠标控制虚拟世界漫游,为虚拟旅游、教育、游戏等领域开辟新应用前景。
Salesforce发布Agentforce 3平台重大升级,新增指挥中心提供AI智能体实时性能监控,支持MCP开放标准实现与数百种企业工具无缝集成。数据显示AI智能体使用量六个月内激增233%,超8000家客户部署该技术。百事可乐等全球企业已将其深度集成到业务运营中。新版本还提供50%更低延迟、增强安全性和200多个预配置行业操作模板,帮助企业快速部署功能性AI智能体。
MIT研究人员开发出自适应语言模型(SEAL)框架,让大型语言模型能够持续学习并通过更新自身内部参数进行适应。SEAL教会模型生成自己的训练数据和更新指令,永久吸收新知识并掌握新任务。该框架采用双循环系统和强化学习算法,让模型学会创建个性化学习指南。在知识整合测试中准确率达47%,在少样本学习中成功率达72.5%。这对企业AI应用具有重要意义,特别适用于动态环境中的AI智能体,但仍存在灾难性遗忘等局限性。
Omnissa公司将其App Volumes产品进行了改进,使原本用于虚拟桌面的应用打包和部署技术也能在物理机上运行。该技术通过将应用文件打包成虚拟硬盘格式,让Windows系统能够直接挂载运行,无需传统的安装过程。由于虚拟桌面仅占全球PC市场5%份额,Omnissa希望通过拓展物理PC市场实现更大增长。该公司还与新加坡Arcfra合作推出更经济的VDI解决方案。
AllSpice.io为电子硬件工程团队打造专属协作平台,填补现有工作流软件间的空白。该平台支持团队在PCB文件和电子CAD文件等传统文档上协作,工程师可像在GitHub上注释代码一样对设计细节进行评论。公司刚完成1500万美元A轮融资,客户包括蓝色起源、Bose等知名企业,并推出AI代理工具帮助验证设计和发现错误。
耶鲁大学研究团队开发了SCIVER评估工具,专门测试AI验证科学论文声明的能力。通过3000个专家标注例子的测试,发现即使最先进的AI模型在复杂科学推理任务上仍远不如人类专家,主要存在信息检索不全、图表误读和逻辑推理断裂等问题,为AI科研应用发展指明了改进方向。
马里兰大学团队开发出PrefBERT智能评价系统,解决了AI在开放性写作任务中缺乏有效质量评判标准的问题。该系统通过学习人类专家评分标准,能准确评判文章质量,显著提升AI生成内容的质量和人类偏好一致性,为AI训练提供了新的质量导向解决方案。
字节跳动团队开发出T-PPO算法,通过"边做边学"的训练方式,让AI训练效率提升2.5倍。该技术突破了传统PPO必须等待完整推理的限制,采用截断式训练和独立优化机制,在AIME数学竞赛中获得62分优异成绩。这一创新不仅降低了AI训练成本,还为推理模型的发展指明新方向,有望推动AI技术在教育、科研等领域的广泛应用。
中科院与美团联合推出MoTE技术,通过"三值专家混合"架构巧妙解决大模型内存消耗问题。该技术保留原模型的全精度共享专家,同时添加多个内存高效的三值路由专家,在3B参数规模下内存消耗减少60%以上,性能反而提升1.6%。这项突破为在普通设备上部署强大AI模型开辟了新路径。