亚马逊云服务宣布为S3云对象存储推出向量存储功能S3 Vectors,声称可将AI存储中向量数据的上传、存储和查询成本降低90%。该服务旨在让客户以经济方式在AWS云中存储大量向量数据并进行语义搜索,可替代昂贵的向量数据库。每个S3 Vectors存储桶支持多达1万个向量索引,每个索引可存储数千万个向量。
AI公司正推动智能体成为下一个职场颠覆者,但专家认为还未成熟。初创公司Mixus推出AI智能体平台,让用户直接通过邮件或Slack与智能体交互,保持人类参与工作流程。该公司已获得260万美元种子轮融资,其最大卖点是易用性。用户可通过文本提示创建智能体,支持多步骤任务执行、团队协作和共享记忆功能。基于Claude 4和OpenAI o3构建,具备网络访问能力,旨在成为不知疲倦的数字同事。
人工智能芯片初创公司Hailo Technologies今日宣布推出第二代AI加速器Hailo-10H,具备强大的生成式AI功能。该芯片支持大语言模型、视觉语言模型等生成式架构,无需依赖云连接即可在设备上运行。Hailo-10H功耗仅2.5瓦,可应用于个人设备、智能家居、汽车和电信基础设施等领域,实现首个令牌生成时间不到一秒,在2B参数模型上每秒处理超过10个令牌。
核能技术公司Oklo与Vertiv宣布合作,为超大规模和托管数据中心开发先进的电力和冷却技术。该系统将利用Oklo小型模块化反应堆产生的蒸汽和电力,结合Vertiv的先进电力和热管理系统,为AI和高性能计算提供可靠电力,同时降低环境影响。首个试点演示计划在爱达荷国家实验室进行。此次合作旨在应对数据中心电力需求激增,通过核能技术提升数据中心能源效率。
企业软件开发者在构建AI应用时面临复杂的架构挑战,包括服务配置、安全、连接和集成等问题。Composio提供AI代理技能基础设施服务,通过捕获和编码代理的连接行为及成功经验,将这些知识存储为可重用的"技能"。当一个代理学会与Salesforce等应用交互后,这些知识可被其他代理共享使用。该平台构建自优化技能层,弥合了智能语言模型与能够从经验中进化的实用代理之间的根本差距。
数字化转型永久性地改变了首席信息官的角色。作为业务领导者,CIO必须与其他部门协作,并证明IT部门提供的业务价值。董事会和CEO希望了解IT提供的美元价值,而非技术指标。CIO们正意识到必须更多地作为商业人士而非仅仅是技术专家来行动和运营,专注于结果而非产出,通过季度业务回顾等方式与业务伙伴密切合作,衡量和报告真正的业务影响。
研究显示客户对超大规模云服务商PostgreSQL实例的正常运行时间可靠性感到担忧,为小型替代供应商提供了填补空白的机会。Foundry研究发现,82%的PostgreSQL云服务用户担心云区域故障,21%在过去一年中经历过此类故障。91%使用PostgreSQL的组织要求每月停机时间不超过四分钟,即99.99%的正常运行时间,24%的组织要求停机时间少于30秒。这促使PlanetScale、pgEdge等分布式PostgreSQL服务提供商推出高可用性替代方案。
英国网络安全巨头Darktrace宣布收购网络流量可视化专家Mira Security,以增强其网络安全能力。此次收购将结合Mira的在线解密技术与Darktrace的AI分析能力,为客户提供更深入的网络流量洞察,解决加密数据盲点问题。收购完成后,将扩展Mira在美国和南非的工程团队,利用其高性能网络加速技术改进Darktrace下一代硬件。这是Darktrace继收购Cado Security后的又一重要收购。
如果把Agent简单理解为客服、问答助手、文档润色工具,那无疑低估了它。AI Agent带给企业的,不仅是效率提升,更是实打实的价值输出。
Akamai坚持“简而未减、网络先行、拥抱开源”的独特定位。凭借“鱼与熊掌兼得”的特色,过去几年,Akamai在电商、流媒体、广告科技、SaaS、金融科技等行业客户中获得了广泛认可。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。
Amazon研究团队开发的BYOKG-RAG技术通过多策略检索和迭代优化,解决了传统知识图谱问答系统难以适应不同图谱结构的问题。该技术将大语言模型与专业检索工具结合,在五个基准测试中平均提升4.5个百分点,特别适用于企业级应用。已开源发布。
这项来自斯坦福大学等机构的研究首次将离散扩散模型应用于音频修复领域,通过将音频转换为词汇序列,实现了对长达500毫秒音频空白的有效修复。该方法显著优于传统技术,在处理音频中断、损坏录音恢复等场景中展现出广阔应用前景,为音频处理技术开辟了新的发展道路。
布里斯托大学和Memories.ai Research联合开发了UGC-VideoCaptioner,这是首个专门针对短视频音画同步理解的AI系统。该研究构建了包含1000个TikTok视频的基准测试,采用创新的两阶段训练策略,仅用2000个样本就达到了传统方法需要20000个样本的效果。实验显示该模型在音频理解、视觉识别和综合描述生成方面都有显著提升。
康奈尔大学和希腊伯罗奔尼撒大学的研究团队开发了一种新型AI协作框架,让多个AI代理像人类团队一样互相信任和协作。通过建立信任评估机制和重新思考流程,在苹果叶片疾病诊断任务中,系统准确率从48.13%提升到85.63%,相对提升77.94%。这种方法无需额外训练即可大幅提升AI性能,为多代理AI系统的发展提供了新思路。
LG AI Research发布EXAONE 4.0大型语言模型,创新性地在单一模型中集成了快速回答和深度思考两种模式。该模型支持英语、韩语、西班牙语三种语言,具备智能工具使用能力,能处理12.8万字长文本,在数学推理和编程能力方面表现出色,甚至超越了许多更大规模的模型,为AI技术的实用化发展提供了新的解决方案。
这项由苹果公司与索邦大学合作的研究首次为AI模型训练中的数据混合问题提供了科学的数学解决方案。研究团队建立了预测公式,能够通过小规模实验准确预测大规模模型的最优数据配方,在语言、多模态和视觉三种AI模型上验证了方法的有效性。这一突破有望显著降低AI模型开发成本,将训练过程从经验艺术转变为科学工程,对整个AI行业具有重要影响。
斯坦福大学研究团队开发出革命性的"差分隐私对话训练"方法,首次解决了AI训练中性能与隐私保护的矛盾。该技术通过在训练过程中添加精心计算的噪音,让AI既能流畅对话又无法泄露训练数据中的敏感信息。实验显示,使用此方法的AI在对话质量上几乎达到传统方法水平,但隐私保护能力显著增强,为未来AI服务的安全发展提供了重要技术基础。
这项由ETH和Google联合开展的研究开发了AGENTSNET基准测试工具,专门评估多个AI智能体的协作能力。通过五个分布式计算问题测试,研究发现即使最先进的AI模型在大规模协作方面仍存在显著局限性,但为未来开发能够真正团队协作的AI系统指明了方向。