最新文章
小模型也能推理!Qualcomm用工具替代思考,让1B模型修复Python代码

小模型也能推理!Qualcomm用工具替代思考,让1B模型修复Python代码

Qualcomm AI Research团队提出了一种创新方法,通过让小语言模型使用编程工具而非抽象思考来解决代码修复问题。研究发现,1B和3B参数的小模型在使用这种"编辑链"方法时,成功率分别提升了6倍和2倍,远超传统思维链方法。这种工具辅助策略为小模型的实际应用开辟了新路径。

南洋理工大学突破性研究:让3D物体拥有真实物理属性的革命性技术

南洋理工大学突破性研究:让3D物体拥有真实物理属性的革命性技术

南洋理工大学研究团队开发了PhysXGen系统,首次实现从单张图片生成具有完整物理属性的3D模型。该技术建立了包含2.6万个物体的物理属性数据库,能准确预测物体的尺寸、材质、功能和运动特性。系统在各项指标上显著超越现有方法,为机器人学习、VR游戏和工业设计等领域带来革命性改变。

研究显示:谷歌AI概览功能导致搜索点击率大幅下降

研究显示:谷歌AI概览功能导致搜索点击率大幅下降

皮尤研究中心最新分析显示,谷歌搜索结果页面的AI概述功能显著降低了用户对其他网站的点击率。研究发现,没有AI回答的搜索点击率为15%,而有AI概述的搜索点击率降至8%。目前约五分之一的搜索会显示AI概述,问题类搜索中60%会触发AI回答。尽管谷歌声称AI概述不会影响网站流量,但数据表明用户看到AI生成的信息后更容易结束浏览,这可能导致错误信息的传播。

AI驱动的预测性维护技术日益受到关注

AI驱动的预测性维护技术日益受到关注

GlobalData研究显示,人工智能驱动的预测性维护正成为电力行业追求高可靠性和成本效益的关键组成部分。该技术结合数据分析、机器学习和实时监控,能够更准确预测设备未来状况,有望降低维护成本30%,提高设备可用性20%。GE Vernova、西门子等公司提供先进解决方案,而数字孪生技术、物联网和边缘计算等新兴技术正进一步提升维护策略的准确性和效率。

韩国AI芯片新星FuriosaAI凭借低功耗设计赢得LG青睐

韩国AI芯片新星FuriosaAI凭借低功耗设计赢得LG青睐

韩国AI芯片初创公司FuriosaAI本周获得重大客户突破,LG AI研究部门选择其AI加速器为搭载Exaone大语言模型的服务器提供算力支持。与主流GPU相比,RNGD推理加速器虽然性能指标看似平庸,但凭借仅180瓦的功耗实现了出色的能效比,在LLM推理任务中比GPU节能2.25倍。该芯片采用张量收缩处理器架构,大幅减少矩阵运算指令和数据移动。LG现计划向企业客户提供基于RNGD的服务器解决方案。

iOS 18 beta 4发布:Liquid Glass界面调整与AI新闻摘要功能回归

iOS 18 beta 4发布:Liquid Glass界面调整与AI新闻摘要功能回归

苹果发布iOS 26第四个开发者测试版,对液态玻璃界面设计进行微调,并重新引入AI驱动的新闻通知摘要功能。更新包含欢迎界面、Siri和相机应用介绍页面。由于此前BBC投诉AI摘要功能误报新闻,苹果在新闻娱乐部分添加警告信息,提醒用户"摘要可能改变原始标题含义"并建议验证信息。同时发布了新动态壁纸和CarPlay壁纸,公测版本预计本周稍后推出。

亚马逊收购AI可穿戴设备Bee,实现全天候语音记录

亚马逊收购AI可穿戴设备Bee,实现全天候语音记录

亚马逊宣布收购AI可穿戴设备初创公司Bee,该公司开发了能记录用户所有对话的智能手环和Apple Watch应用。Bee产品售价49.99美元,通过监听对话为用户创建提醒和待办事项。此次收购显示亚马逊对可穿戴AI设备的兴趣,有别于其Echo音箱等家用语音助手产品。尽管Bee承诺保护用户隐私,但此类产品仍存在安全和隐私风险,特别是在被整合到亚马逊生态系统后。

大语言模型如何像人类一样思考和搜索?清华大学团队的深度研究破解AI推理密码

大语言模型如何像人类一样思考和搜索?清华大学团队的深度研究破解AI推理密码

这项由清华大学等多所高校联合完成的研究首次系统性地解析了AI系统如何同时具备知识检索和深度推理能力。研究团队通过分析200多篇论文,揭示了从简单检索到协同推理的技术演进路径,并建立了全面的评估框架。这种"协同RAG推理系统"能够像人类研究者一样主动搜索信息、分析问题,为AI向真正智能助手的转变奠定了基础。

技术绘图也能智能化?麦吉尔大学推出DrafterBench,让AI帮工程师改图纸

技术绘图也能智能化?麦吉尔大学推出DrafterBench,让AI帮工程师改图纸

麦吉尔大学研究团队开发了DrafterBench,这是首个专门评估AI在工程技术图纸修改能力的测试平台。通过对1920个真实工程任务的测试,研究发现即使最先进的AI模型也只能达到80%的准确率,在处理复杂多步骤操作时表现不佳。该研究为工程领域的AI应用提供了重要的评估标准和发展方向。

德州农工大学最新突破:让电脑真正"看懂"人类在街头的一举一动

德州农工大学最新突破:让电脑真正"看懂"人类在街头的一举一动

德州农工大学等多所高校联合发布MMHU数据集,专门针对自动驾驶场景的人类行为理解。该数据集包含57,000个人类行为实例和173万视频帧,覆盖过马路、打电话、骑车等13种关键行为,并提供详细的文字描述和行为标注。实验显示,基于该数据集训练的模型在行为识别准确率上有显著提升,将推动自动驾驶系统更好理解人类行为和意图,提升道路安全。

听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术

听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术

香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术MOSPA,能让虚拟角色像真人一样对不同方向、距离的声音做出自然反应。研究构建了包含超过9小时动作数据的SAM数据集,涵盖27种空间音频场景。技术采用扩散模型架构,在各项评估中显著超越现有方法,为VR/AR、游戏开发、影视制作等领域带来革命性应用前景。

程序员的福音还是噩梦?TikTok团队揭示AI在代码性能优化上的惊人表现与局限性

程序员的福音还是噩梦?TikTok团队揭示AI在代码性能优化上的惊人表现与局限性

本研究首次系统评估了大型语言模型在真实代码性能优化任务中的能力。研究团队构建了包含140个真实案例的SWE-Perf基准,发现当前最先进的AI模型在性能优化方面仍远落后于人类专家。AI倾向于进行基础设施层面的修改,而人类专家更擅长高层次的系统优化。研究揭示了AI在复杂系统优化中的局限性,为未来AI编程工具的发展指明了方向。

超级AI助手Lizard诞生:美国俄勒冈大学联合Adobe让大模型拥有"无限记忆"

超级AI助手Lizard诞生:美国俄勒冈大学联合Adobe让大模型拥有"无限记忆"

俄勒冈大学联合Adobe开发出Lizard框架,通过门控线性注意力和滑动窗口机制,让大型语言模型拥有"无限记忆"能力。该技术解决了传统AI处理长文本时速度下降和内存爆炸的问题,在保持智能水平的同时实现恒定速度处理,在MMLU测试中比之前方法提升18分。

AWS S3对象存储新增矢量功能大幅降低AI存储成本

AWS S3对象存储新增矢量功能大幅降低AI存储成本

亚马逊云服务宣布为S3云对象存储推出向量存储功能S3 Vectors,声称可将AI存储中向量数据的上传、存储和查询成本降低90%。该服务旨在让客户以经济方式在AWS云中存储大量向量数据并进行语义搜索,可替代昂贵的向量数据库。每个S3 Vectors存储桶支持多达1万个向量索引,每个索引可存储数千万个向量。

这家初创公司认为电子邮件是AI智能体实用化的关键

这家初创公司认为电子邮件是AI智能体实用化的关键

AI公司正推动智能体成为下一个职场颠覆者,但专家认为还未成熟。初创公司Mixus推出AI智能体平台,让用户直接通过邮件或Slack与智能体交互,保持人类参与工作流程。该公司已获得260万美元种子轮融资,其最大卖点是易用性。用户可通过文本提示创建智能体,支持多步骤任务执行、团队协作和共享记忆功能。基于Claude 4和OpenAI o3构建,具备网络访问能力,旨在成为不知疲倦的数字同事。

Hailo发布支持边缘生成式AI的Hailo-10H芯片

Hailo发布支持边缘生成式AI的Hailo-10H芯片

人工智能芯片初创公司Hailo Technologies今日宣布推出第二代AI加速器Hailo-10H,具备强大的生成式AI功能。该芯片支持大语言模型、视觉语言模型等生成式架构,无需依赖云连接即可在设备上运行。Hailo-10H功耗仅2.5瓦,可应用于个人设备、智能家居、汽车和电信基础设施等领域,实现首个令牌生成时间不到一秒,在2B参数模型上每秒处理超过10个令牌。

Vertiv与Oklo探索核能数据中心冷却技术

Vertiv与Oklo探索核能数据中心冷却技术

核能技术公司Oklo与Vertiv宣布合作,为超大规模和托管数据中心开发先进的电力和冷却技术。该系统将利用Oklo小型模块化反应堆产生的蒸汽和电力,结合Vertiv的先进电力和热管理系统,为AI和高性能计算提供可靠电力,同时降低环境影响。首个试点演示计划在爱达荷国家实验室进行。此次合作旨在应对数据中心电力需求激增,通过核能技术提升数据中心能源效率。

Composio推出AI技能基础设施服务为智能体赋能

Composio推出AI技能基础设施服务为智能体赋能

企业软件开发者在构建AI应用时面临复杂的架构挑战,包括服务配置、安全、连接和集成等问题。Composio提供AI代理技能基础设施服务,通过捕获和编码代理的连接行为及成功经验,将这些知识存储为可重用的"技能"。当一个代理学会与Salesforce等应用交互后,这些知识可被其他代理共享使用。该平台构建自优化技能层,弥合了智能语言模型与能够从经验中进化的实用代理之间的根本差距。

CIO如何衡量和报告IT价值

CIO如何衡量和报告IT价值

数字化转型永久性地改变了首席信息官的角色。作为业务领导者,CIO必须与其他部门协作,并证明IT部门提供的业务价值。董事会和CEO希望了解IT提供的美元价值,而非技术指标。CIO们正意识到必须更多地作为商业人士而非仅仅是技术专家来行动和运营,专注于结果而非产出,通过季度业务回顾等方式与业务伙伴密切合作,衡量和报告真正的业务影响。

客户担忧超大型云服务商PostgreSQL服务的停机问题

客户担忧超大型云服务商PostgreSQL服务的停机问题

研究显示客户对超大规模云服务商PostgreSQL实例的正常运行时间可靠性感到担忧,为小型替代供应商提供了填补空白的机会。Foundry研究发现,82%的PostgreSQL云服务用户担心云区域故障,21%在过去一年中经历过此类故障。91%使用PostgreSQL的组织要求每月停机时间不超过四分钟,即99.99%的正常运行时间,24%的组织要求停机时间少于30秒。这促使PlanetScale、pgEdge等分布式PostgreSQL服务提供商推出高可用性替代方案。