卖家们普遍面临从流量增长到精细化运营的过渡压力。Pacvue泊客电商正帮助卖家实现全渠道的运营决策,并且通过 AI技术提升广告投放和商业运营绩效,成为推动商业增长的关键。
腾讯混元等机构联合提出PREF-GRPO方法,首次采用成对偏好比较替代传统评分,成功解决AI图像生成中的奖励欺骗问题。同时构建UNIGENBENCH评测基准,包含600测试案例和27个细粒度评价维度,为行业提供更精确的模型评估标准。实验显示新方法在多项指标上显著优于传统方法,特别在复杂任务上提升明显。
蚂蚁集团与西湖大学联合开发的AWORLD开源框架,通过分布式并行训练将AI助手的练习效率提升14.6倍,成功将Qwen3-32B模型在GAIA测试中的准确率从21.59%提升至32.23%,在最困难任务上甚至超越了GPT-4o等商业AI产品,为"从练习中学习"的AI训练理念提供了实用解决方案。
Zoom公司研究团队开发的TCIA框架通过"拆解-重组"策略解决AI指令训练中的多样性不足和任务漂移问题,将指令分解为基础查询和约束条件后智能重组,在四个真实任务中平均性能提升8.7%,某些场景甚至超越GPT-4o,同时保持通用能力不受损,为企业低成本定制专业AI应用提供了新方案。
哈工大研究团队开发的CogVLA系统通过模仿人脑认知机制,让机器人学会"智能筛选"信息,根据任务指令只关注重要内容。该系统采用三阶段渐进式处理架构,在LIBERO基准测试中达到97.4%成功率,同时训练成本降低2.5倍,推理速度提升2.8倍,为机器人技术的实用化和普及化奠定了重要基础。
乔治亚理工学院联合Adobe Research开发的OnGoal系统,通过智能目标追踪和可视化反馈,解决了用户与AI长对话时目标混乱、沟通低效的问题。20人实验证明,该系统让用户完成任务更快、压力更小,还能学会更有效的AI沟通策略,为未来人机协作指明了透明化、个性化的发展方向。
伊利诺伊大学研究团队开发出Dress&Dance系统,这是首个能生成高清虚拟试衣视频的AI技术。用户只需提供个人照片、服装图片和参考动作视频,即可生成1152×720分辨率、24帧每秒的5秒试衣视频。该系统通过CondNet技术统一处理多模态信息,采用分阶段训练策略,支持单件及多件服装同时试穿,在服装细节保真度和动作自然度方面显著优于现有商业产品。
多伦多大学研究团队通过开发SEAM基准测试系统,发现当前最先进的视觉-语言AI模型存在显著的"模态失衡"现象。即便面对语义完全相同的信息,这些模型在处理视觉输入和文字输入时表现差异明显。研究涵盖国际象棋、化学、音乐、图论四个领域,测试了21个主流模型,揭示了分词错误和视觉幻觉两大根本原因。这项工作为评估和改进AI跨模态理解能力提供了重要基准,对推进通用人工智能发展具有重要意义。
亚马逊发布Lens Live AI功能,用户可通过手机摄像头扫描任何物品进行实时购物。该技术利用人工智能识别用户拍摄的物品,并在亚马逊平台上匹配相关商品,提供即时购买选项。这一创新功能将大幅简化购物流程,用户只需"看到即可购买",为在线购物体验带来革命性改变。
谷歌AI研究助手NotebookLM宣布推出三种全新音频摘要格式:简要、评论和辩论模式。这一更新将为用户提供更多选择,让已经备受欢迎的音频概览功能更加丰富多样。简要模式提供1-2分钟的精简概述,评论模式对材料进行建设性反馈,辩论模式则让两个AI主持人就内容展开深入讨论。这些新格式有助于用户从不同角度理解学习材料,使NotebookLM成为更加细致入微的学习工具。
法国生物制药公司赛诺菲正在大规模应用AI技术进行数字化转型,将AI整合到从新分子识别到药物配送的整个价值链中。公司通过数字加速器项目,结合预测模型和机器学习算法,可预测80%的物流中断。与谷歌云等合作伙伴携手,开发内部AI应用plai。巴塞罗那全球创新中心将创造300多个高技能岗位,专注于临床分析和预测模型开发,旨在提供更快速、精准的医疗解决方案。
AI是一把双刃剑,既能解放员工免于繁重工作,也可能夺走创造性任务。虽然今年已有超过8万名科技员工被裁,但企业领导者正寻求通过AI增强而非替代员工的策略。Parsons等公司投资培训项目,提升员工技能,实现了十年来最佳留任率。汤森路透采用"AI优先、人类主导"策略,部署Open Arena平台供员工实验AI工具。专家认为,AI将创造新就业机会,关键是企业要有积极愿景,通过技能提升帮助员工适应新角色。
云网络公司Cato Networks宣布收购以色列AI安全公司Aim Security,收购金额未披露。Aim Security成立于2022年,专注保护员工、应用程序和组织与AI的交互,提供AI使用的可见性、控制和治理。该平台可监控ChatGPT、微软Copilot等公共AI应用的使用,发现影子AI使用情况并降低风险。此次收购将使Cato Networks的SASE云平台扩展新的AI安全功能。
巴黎理工学院研究团队发现了比传统深度伪造更隐蔽的"局部伪造"技术威胁。这种只修改视频局部区域的新型AI造假技术让人类检测准确率下降30%以上,AI检测系统性能下降高达43%。研究团队构建了包含25000个样本的全球首个局部伪造检测数据库FakePartsBench,揭示了现有防御体系面对精细化伪造攻击的脆弱性,为未来开发更强大的检测技术奠定重要基础。
Meta等机构研究发现,让大语言模型学会使用外部工具比死记硬背所有知识更高效。研究通过数学证明和实验验证,传统的参数记忆存在严格容量限制,而工具学习能实现无限扩展且不损害原有能力。这为AI发展提供了新思路:从堆叠参数转向构建智能工具协作系统。
ROSE是一项突破性的视频编辑技术,能够彻底移除视频中的物体及其环境影响。由浙江大学等机构研发,该系统不仅删除目标物体,还智能处理阴影、反射、光照等五种副作用。通过3D渲染生成训练数据,采用引用式擦除和差异掩码预测等创新方法,ROSE在各项性能指标上全面超越现有技术,为视频编辑领域带来了新的可能。
新加坡南洋理工大学研究团队提出TriMM系统,这是首个融合RGB图像、深度图和点云数据的3D生成模型。通过协同多模态编码技术,系统能够同时利用彩色图像的丰富纹理和几何数据的精确结构信息,仅用4秒即可从单张图片生成高质量3D模型。该技术在多个数据集上的表现超越现有方法,为3D内容创作提供了新的解决方案。
戴尔科技推出Dell PowerProtect Data Domain All-Flash数据保护存储设备及多项软件组合更新,为企业安全保驾护航
微软研究院开发的rStar2-Agent是一个仅140亿参数的AI数学推理模型,通过创新的智能体强化学习方法,在AIME24数学竞赛中达到80.6%准确率,超越了6710亿参数的DeepSeek-R1等大型模型。该模型的核心创新包括GRPO-RoC算法、分布式代码执行环境和渐进式训练策略,仅用510个训练步骤和一周时间就达到顶级性能,展示了"小模型大能力"的技术路径,为AI发展提供了高效替代方案。