最新文章
大模型的"认知僵化"问题:ByteDance团队揭示AI为何总是"按套路出牌"

大模型的"认知僵化"问题:ByteDance团队揭示AI为何总是"按套路出牌"

ByteDance团队发现大语言模型存在"认知僵化"问题:当用户要求执行与训练习惯冲突的指令时,AI往往难以遵从。研究团队开发了Inverse IFEval测试体系,包含8种反常规指令类型和1012个测试样本,发现即使最先进的模型在此类任务上表现也不理想。研究揭示了过度标准化训练导致模型缺乏灵活性的根本原因,为开发更适应用户真实需求的AI系统提供了重要指导。

沙特科技大学揭秘:AI推理能力竟然可以像U盘一样"拷贝粘贴"

沙特科技大学揭秘:AI推理能力竟然可以像U盘一样"拷贝粘贴"

沙特阿卜杜拉国王科技大学研究团队首次发现AI推理能力可以像文件一样被提取和转移。通过简单的数学运算从强化学习模型中提取"推理向量",然后添加到其他模型上,实现推理能力的快速传递。实验显示模型在数学、代码生成等任务上性能提升4-12%,且在对抗性测试中保持稳定。这项技术有望让AI推理能力的获取从昂贵训练变为低成本复用,加速AI技术普及。

上海人工智能实验室首创:用学术讲座训练AI研究助手的全新评测方案

上海人工智能实验室首创:用学术讲座训练AI研究助手的全新评测方案

上海人工智能实验室等多所高校联合开发了DeepResearch Arena评测基准,专门评估AI研究助手的真实能力。该系统创新性地使用学术讲座作为测试素材,通过MAHTG系统从200多场讲座中提取研究灵感并生成超过1万个研究任务。实验显示即使最先进的AI模型也面临显著挑战,为未来AI研究能力发展提供了重要参考。

视频AI出现了"幻觉症"?SenseTime研究揭示长视频理解的隐秘缺陷

视频AI出现了"幻觉症"?SenseTime研究揭示长视频理解的隐秘缺陷

SenseTime研究院发现AI在理解长视频时存在"语义聚合幻觉"现象——AI能正确识别每个画面,但会错误地将不同事件的信息混合,如将第一个新闻段落的主持人与第三个段落的星巴克信息错误组合。研究团队创建了全球首个长视频幻觉检测基准ELV-Halluc,测试16个主流模型后发现这一问题普遍存在,并提出了有效解决方案,将错误率降低27.7%。

Google Photos对话式编辑功能向Android用户推出

Google Photos对话式编辑功能向Android用户推出

Google Photos正向美国Android用户推出会话式编辑功能,用户可通过语音或文字提示来编辑照片,而无需手动操作。该功能首先在Pixel 10手机上推出,现已扩展到更多设备。用户需将Google账户设置为英文,并开启人脸分组和位置估算功能。通过点击"帮我编辑"按钮,用户可直接说出编辑需求,如去除背景中的陌生人、调亮颜色或消除眩光。该功能使用先进的Gemini技术,并提供原图与编辑后照片的对比显示。

斯坦福AI安全工作坊展示安全AI发展路径

斯坦福AI安全工作坊展示安全AI发展路径

本文深入分析了斯坦福大学AI安全中心举办的研讨会所展示的AI安全领域最新进展。文章探讨了AI安全的两个重要方向:构建更安全的AI和让AI变得更安全,强调这两种方法需要有机结合。通过分析物理AI(如人形机器人)与生成式AI结合的安全挑战,以及可达性分析在AI安全中的应用,展现了当前AI安全研究的前沿技术和实际应用场景。

Sila在美国开设硅负极材料工厂,助力高能量密度电动汽车电池生产

Sila在美国开设硅负极材料工厂,助力高能量密度电动汽车电池生产

电池材料初创公司Sila在华盛顿州摩西湖的工厂开始运营,这是西方首个大规模硅阳极工厂。该工厂初期可生产供2-5万辆电动车使用的电池材料,未来扩产后可满足250万辆汽车需求。硅阳极技术可将锂离子电池能量密度提升50%,有望实现更长续航和更快充电的电动车。

TechCrunch Disrupt 2025:构建太空新基础设施

TechCrunch Disrupt 2025:构建太空新基础设施

太空经济不仅涉及火箭和卫星,更关乎基础设施、自主性和全新的地外资产建设模式。TechCrunch Disrupt 2025将于10月27-29日在旧金山举办,太空技术舞台将展示这一转变。True Anomaly联合创始人Rogers和Vast CEO Haot将探讨如何构建更可持续、可扩展的太空经济,涵盖政府商业合作伙伴关系到风投支持的轨道平台等前沿策略与技术。

谷歌AI模式全球推出西班牙语版本

谷歌AI模式全球推出西班牙语版本

谷歌搜索宣布向西班牙语用户推出AI模式功能,这是其AI驱动的搜索体验。该功能允许用户使用自然语言查询提问、进行对话交流、上传图片和深入探讨复杂话题。此次西班牙语版本推出是继8月份谷歌将AI模式扩展到全球180个国家之后的又一重要举措。谷歌正在快速推广AI技术,同时还为Android用户带来对话式照片编辑功能,并将更实惠的Google AI Plus订阅计划扩展到40个国家。

米其林级别AI规模化部署:从试点到生产的成功路径

米其林级别AI规模化部署:从试点到生产的成功路径

许多企业停留在AI试点阶段,无法实现企业级转型。成功扩展AI需要从孤立项目转向集成平台建设。关键在于掌握五大核心要素:建立统一数据治理平台、实现系统互操作性、构建MLOps自动化流水线、采用微服务架构设计,以及建立AI治理体系和跨职能协作团队。成功的AI策略20%依赖算法,80%依赖基础建设。

微软推出微流控技术从内部为AI芯片降温

微软推出微流控技术从内部为AI芯片降温

微软推出突破性的微流控冷却技术,可将GPU芯片最高温度降低65%,效果比传统冷板冷却技术高出三倍。该技术在硅芯片上直接蚀刻微小液体通道,模仿叶脉结构实现高效散热。微软计划将此技术集成到未来自研芯片中,有望显著降低数据中心运营成本并提升能效。此外,微软还扩展了中空光纤产品,相比传统单模光纤可提供47%更快的数据传输速度和33%更低的延迟。

谷歌开发工具经理如何让AI编程落地

谷歌开发工具经理如何让AI编程落地

谷歌开发工具项目经理Ryan Salva分享了AI工具如何改变编程方式的见解。他负责Gemini CLI和Gemini Code Assist等工具,引导开发者进入代理编程新时代。最新研究显示,开发者开始使用AI工具的中位时间是2024年4月,恰好对应推理模型的兴起。Salva认为工具调用能力是关键突破,让模型能够自我纠错。他预测未来开发者将更像架构师,专注于将复杂问题分解为可解决的任务。

Komprise推出AI数据清洗工具处理非结构化数据

Komprise推出AI数据清洗工具处理非结构化数据

数据管理公司Komprise正式发布智能AI摄取产品,作为其智能数据工作流摄取引擎的组成部分。该工具旨在解决非结构化数据混乱问题,通过过滤器消除低质量和敏感数据,具备敏感数据分类功能和内置个人身份信息处理能力。基准测试显示其摄取性能比AWS DataSync高出一倍,可自动维护审计跟踪,支持数据治理和合规报告,有效提升AI系统的数据质量和处理效率。

Alloy为机器人行业带来专业数据管理解决方案

Alloy为机器人行业带来专业数据管理解决方案

澳大利亚初创公司Alloy正在为机器人公司构建数据基础设施,帮助处理和组织机器人从传感器和摄像头等各种来源收集的数据。由于单个机器人每天可产生高达1TB的数据,Alloy通过编码和标记数据,允许用户使用自然语言搜索数据以发现错误。该公司已获得450万澳元的预种子轮融资,并与四家澳大利亚机器人公司签署设计合作协议。

开源基础设施危机:OpenSSF警告免费时代即将终结

开源基础设施危机:OpenSSF警告免费时代即将终结

开源安全基金会联合多个重量级开源组织发表声明,警告开源基础设施正被推向崩溃边缘。Maven Central、PyPI等包注册中心每月处理数十亿次下载,但运营机构却依赖捐款和赞助勉强维持。声明指出,商业规模使用却缺乏商业规模支持是不可持续的。持续集成系统和AI代理的大规模请求加剧了基础设施压力。基金会提议建立正式合作伙伴关系、分层访问模式等解决方案,呼吁大型用户承担相应费用。

6个MCP服务器让智能体AI赋能IT运维工作

6个MCP服务器让智能体AI赋能IT运维工作

随着智能AI代理技术的发展,IT运维专业人员可以通过自然语言而非传统工具来执行日常管理任务。本文介绍了六个关键的模型上下文协议服务器,包括文件系统操作、MySQL数据库管理、数据备份管理、SSH远程登录管理、Prometheus监控以及服务台管理等应用场景,展示了如何利用这些工具简化IT运维流程,提高工作效率。

AI项目实施面临的主要挑战与应对策略

AI项目实施面临的主要挑战与应对策略

无论是开发AI游戏引擎、营销推荐系统还是个人导师,AI项目实施都面临诸多挑战。大型创新项目成本高昂,决策者倾向于规避风险;数据隐私和算法偏见带来法律风险;界面设计需要平衡用户控制与AI自主性;获得组织内部支持困难,许多人对AI缺乏信任;竞争环境下各方缺乏协作。尽管存在这些障碍,LLM等AI工具仍具有巨大变革潜力,值得持续探索。

GitHub强化npm安全措施应对钓鱼和恶意软件攻击

GitHub强化npm安全措施应对钓鱼和恶意软件攻击

GitHub宣布将加强npm注册表安全措施以应对近期攻击。9月份npm遭遇多起钓鱼攻击和恶意软件感染,超过500个受损软件包被移除。GitHub将移除传统认证方式,包括经典令牌和一次性密码,缩短令牌生命周期,默认启用可信发布和双因子认证。可信发布通过OpenID Connect验证软件包来源并颁发短期令牌,目前仅支持GitHub Actions和GitLab CI/CD管道。

Verizon成立6G创新论坛推动下一代通信技术发展

Verizon成立6G创新论坛推动下一代通信技术发展

随着6G通信技术在欧洲和亚洲加速发展,美国领先通信服务商Verizon宣布成立6G创新论坛,旨在推动连接技术协作演进,为消费者和企业提供变革性体验。该论坛汇集爱立信、三星电子、诺基亚、Meta和高通等技术生态系统公司,共同定义6G技术,识别潜在新用例、设备和网络技术。论坛将建立专门的Verizon 6G实验室,从洛杉矶开始作为协作研究、原型开发和早期试验的中心。

英特尔也相信具身智能

英特尔也相信具身智能

具身机器人,会否成为继PC、手机后下一个个人计算时代的关键载体?