最新文章
大语言模型如何像人类一样思考和搜索?清华大学团队的深度研究破解AI推理密码

大语言模型如何像人类一样思考和搜索?清华大学团队的深度研究破解AI推理密码

这项由清华大学等多所高校联合完成的研究首次系统性地解析了AI系统如何同时具备知识检索和深度推理能力。研究团队通过分析200多篇论文,揭示了从简单检索到协同推理的技术演进路径,并建立了全面的评估框架。这种"协同RAG推理系统"能够像人类研究者一样主动搜索信息、分析问题,为AI向真正智能助手的转变奠定了基础。

技术绘图也能智能化?麦吉尔大学推出DrafterBench,让AI帮工程师改图纸

技术绘图也能智能化?麦吉尔大学推出DrafterBench,让AI帮工程师改图纸

麦吉尔大学研究团队开发了DrafterBench,这是首个专门评估AI在工程技术图纸修改能力的测试平台。通过对1920个真实工程任务的测试,研究发现即使最先进的AI模型也只能达到80%的准确率,在处理复杂多步骤操作时表现不佳。该研究为工程领域的AI应用提供了重要的评估标准和发展方向。

德州农工大学最新突破:让电脑真正"看懂"人类在街头的一举一动

德州农工大学最新突破:让电脑真正"看懂"人类在街头的一举一动

德州农工大学等多所高校联合发布MMHU数据集,专门针对自动驾驶场景的人类行为理解。该数据集包含57,000个人类行为实例和173万视频帧,覆盖过马路、打电话、骑车等13种关键行为,并提供详细的文字描述和行为标注。实验显示,基于该数据集训练的模型在行为识别准确率上有显著提升,将推动自动驾驶系统更好理解人类行为和意图,提升道路安全。

听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术

听声辨影:香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术

香港大学研究团队开发出全球首个空间音频驱动的人体动作生成技术MOSPA,能让虚拟角色像真人一样对不同方向、距离的声音做出自然反应。研究构建了包含超过9小时动作数据的SAM数据集,涵盖27种空间音频场景。技术采用扩散模型架构,在各项评估中显著超越现有方法,为VR/AR、游戏开发、影视制作等领域带来革命性应用前景。

程序员的福音还是噩梦?TikTok团队揭示AI在代码性能优化上的惊人表现与局限性

程序员的福音还是噩梦?TikTok团队揭示AI在代码性能优化上的惊人表现与局限性

本研究首次系统评估了大型语言模型在真实代码性能优化任务中的能力。研究团队构建了包含140个真实案例的SWE-Perf基准,发现当前最先进的AI模型在性能优化方面仍远落后于人类专家。AI倾向于进行基础设施层面的修改,而人类专家更擅长高层次的系统优化。研究揭示了AI在复杂系统优化中的局限性,为未来AI编程工具的发展指明了方向。

超级AI助手Lizard诞生:美国俄勒冈大学联合Adobe让大模型拥有"无限记忆"

超级AI助手Lizard诞生:美国俄勒冈大学联合Adobe让大模型拥有"无限记忆"

俄勒冈大学联合Adobe开发出Lizard框架,通过门控线性注意力和滑动窗口机制,让大型语言模型拥有"无限记忆"能力。该技术解决了传统AI处理长文本时速度下降和内存爆炸的问题,在保持智能水平的同时实现恒定速度处理,在MMLU测试中比之前方法提升18分。

AWS S3对象存储新增矢量功能大幅降低AI存储成本

AWS S3对象存储新增矢量功能大幅降低AI存储成本

亚马逊云服务宣布为S3云对象存储推出向量存储功能S3 Vectors,声称可将AI存储中向量数据的上传、存储和查询成本降低90%。该服务旨在让客户以经济方式在AWS云中存储大量向量数据并进行语义搜索,可替代昂贵的向量数据库。每个S3 Vectors存储桶支持多达1万个向量索引,每个索引可存储数千万个向量。

这家初创公司认为电子邮件是AI智能体实用化的关键

这家初创公司认为电子邮件是AI智能体实用化的关键

AI公司正推动智能体成为下一个职场颠覆者,但专家认为还未成熟。初创公司Mixus推出AI智能体平台,让用户直接通过邮件或Slack与智能体交互,保持人类参与工作流程。该公司已获得260万美元种子轮融资,其最大卖点是易用性。用户可通过文本提示创建智能体,支持多步骤任务执行、团队协作和共享记忆功能。基于Claude 4和OpenAI o3构建,具备网络访问能力,旨在成为不知疲倦的数字同事。

Hailo发布支持边缘生成式AI的Hailo-10H芯片

Hailo发布支持边缘生成式AI的Hailo-10H芯片

人工智能芯片初创公司Hailo Technologies今日宣布推出第二代AI加速器Hailo-10H,具备强大的生成式AI功能。该芯片支持大语言模型、视觉语言模型等生成式架构,无需依赖云连接即可在设备上运行。Hailo-10H功耗仅2.5瓦,可应用于个人设备、智能家居、汽车和电信基础设施等领域,实现首个令牌生成时间不到一秒,在2B参数模型上每秒处理超过10个令牌。

Vertiv与Oklo探索核能数据中心冷却技术

Vertiv与Oklo探索核能数据中心冷却技术

核能技术公司Oklo与Vertiv宣布合作,为超大规模和托管数据中心开发先进的电力和冷却技术。该系统将利用Oklo小型模块化反应堆产生的蒸汽和电力,结合Vertiv的先进电力和热管理系统,为AI和高性能计算提供可靠电力,同时降低环境影响。首个试点演示计划在爱达荷国家实验室进行。此次合作旨在应对数据中心电力需求激增,通过核能技术提升数据中心能源效率。

Composio推出AI技能基础设施服务为智能体赋能

Composio推出AI技能基础设施服务为智能体赋能

企业软件开发者在构建AI应用时面临复杂的架构挑战,包括服务配置、安全、连接和集成等问题。Composio提供AI代理技能基础设施服务,通过捕获和编码代理的连接行为及成功经验,将这些知识存储为可重用的"技能"。当一个代理学会与Salesforce等应用交互后,这些知识可被其他代理共享使用。该平台构建自优化技能层,弥合了智能语言模型与能够从经验中进化的实用代理之间的根本差距。

CIO如何衡量和报告IT价值

CIO如何衡量和报告IT价值

数字化转型永久性地改变了首席信息官的角色。作为业务领导者,CIO必须与其他部门协作,并证明IT部门提供的业务价值。董事会和CEO希望了解IT提供的美元价值,而非技术指标。CIO们正意识到必须更多地作为商业人士而非仅仅是技术专家来行动和运营,专注于结果而非产出,通过季度业务回顾等方式与业务伙伴密切合作,衡量和报告真正的业务影响。

客户担忧超大型云服务商PostgreSQL服务的停机问题

客户担忧超大型云服务商PostgreSQL服务的停机问题

研究显示客户对超大规模云服务商PostgreSQL实例的正常运行时间可靠性感到担忧,为小型替代供应商提供了填补空白的机会。Foundry研究发现,82%的PostgreSQL云服务用户担心云区域故障,21%在过去一年中经历过此类故障。91%使用PostgreSQL的组织要求每月停机时间不超过四分钟,即99.99%的正常运行时间,24%的组织要求停机时间少于30秒。这促使PlanetScale、pgEdge等分布式PostgreSQL服务提供商推出高可用性替代方案。

英国网络安全巨头Darktrace收购网络流量可视化专业公司Mira

英国网络安全巨头Darktrace收购网络流量可视化专业公司Mira

英国网络安全巨头Darktrace宣布收购网络流量可视化专家Mira Security,以增强其网络安全能力。此次收购将结合Mira的在线解密技术与Darktrace的AI分析能力,为客户提供更深入的网络流量洞察,解决加密数据盲点问题。收购完成后,将扩展Mira在美国和南非的工程团队,利用其高性能网络加速技术改进Darktrace下一代硬件。这是Darktrace继收购Cado Security后的又一重要收购。

关于AI Agent落地,李开复强调了两件事:“价值交付”和“一把手工程”

关于AI Agent落地,李开复强调了两件事:“价值交付”和“一把手工程”

如果把Agent简单理解为客服、问答助手、文档润色工具,那无疑低估了它。AI Agent带给企业的,不仅是效率提升,更是实打实的价值输出。

2025-07-22

中国分布式数据库最新报告:OceanBase居本地部署市场两项第一

IDC发布《2024年下半年中国分布式事务数据库软件市场跟踪》报告,报告显示,OceanBase占据中国分布式事务型数据库本地部署市场份额的21.2% ,位居市场第一。

阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然
2025-07-22

阿里团队突破多角色动画难题:FantasyPortrait让静态照片开口说话更自然

阿里团队开发的FantasyPortrait系统突破了传统人像动画的局限,通过隐式表情表示和掩码交叉注意力机制,实现了高质量的单人和多人肖像动画生成,特别在跨身份表情迁移方面表现出色,为视频制作和虚拟交流等领域带来新的技术可能性。

差异化为杠杆,Akamai如何撬动电商云服务市场?
2025-07-22

差异化为杠杆,Akamai如何撬动电商云服务市场?

Akamai坚持“简而未减、网络先行、拥抱开源”的独特定位。凭借“鱼与熊掌兼得”的特色,过去几年,Akamai在电商、流媒体、广告科技、SaaS、金融科技等行业客户中获得了广泛认可。

复旦大学推出革命性AI工具:一张图片就能生成专业视频,想让什么动起来就动什么

复旦大学推出革命性AI工具:一张图片就能生成专业视频,想让什么动起来就动什么

复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。

计算机视觉新突破:斯坦福大学让视频生成模型学会"追踪"物体运动

计算机视觉新突破:斯坦福大学让视频生成模型学会"追踪"物体运动

斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。