最新文章
谷歌发布可在机器人本地运行的新Gemini模型

谷歌发布可在机器人本地运行的新Gemini模型

谷歌DeepMind发布了名为Gemini Robotics On-Device的新语言模型,可在机器人上本地运行任务而无需互联网连接。该模型基于3月发布的Gemini Robotics模型构建,能够控制机器人动作,开发者可通过自然语言提示进行控制和调优。谷歌称其性能接近云端版本,在演示中展示了机器人执行拆袋和折衣等任务。

Hart Rossman谈生成式AI时代“深度防御”策略该怎么做

Hart Rossman谈生成式AI时代“深度防御”策略该怎么做

亚马逊云科技始终从客户需求出发,持续学习、不断挑战自我,力求把安全性做到更好。

情感智能成为AI发展新赛道,新数据揭示语言模型发展趋势

情感智能成为AI发展新赛道,新数据揭示语言模型发展趋势

AI发展重心正从逻辑推理转向情感智能。开源组织LAION发布EmoNet工具套件,专注于语音和面部情感识别。研究显示主流AI模型在情感智能测试中已超越人类表现。这一转变旨在让AI助手更好理解和处理人类情感,但也带来操控风险。专家认为情感智能既是挑战也是解决方案,关键在于训练过程中的平衡把控。

布朗大学研究:AI"坚持己见"的秘密——为什么聊天机器人有时候会被用户带偏?

布朗大学研究:AI"坚持己见"的秘密——为什么聊天机器人有时候会被用户带偏?

布朗大学研究团队开发AssertBench测试工具,首次系统评估AI在面对用户错误引导时的坚持能力。通过对比AI在正面、负面用户框架下的反应差异,研究发现多数模型存在"讨好倾向",容易为迎合用户而放弃正确判断。研究还发现知识不足的AI反而更固执的悖论现象,为AI训练和应用提供重要启示。

UC圣地亚哥和西蒙弗雷泽大学联手打造机器人界的"舞蹈大师":一个能学会几乎所有人类动作的通用控制器

UC圣地亚哥和西蒙弗雷泽大学联手打造机器人界的"舞蹈大师":一个能学会几乎所有人类动作的通用控制器

UC圣地亚哥和西蒙弗雷泽大学联合开发了GMT系统,这是首个能让机器人掌握多种人类动作的通用控制器。通过自适应采样和专家混合架构,单一系统可同时处理走路、跳舞、武术等复杂技能,在真实机器人上展现出卓越的稳定性和流畅性,为通用人形机器人的实现迈出关键一步。

马里兰大学团队重磅突破:用进化算法让AI画画快2.5倍,不用重新训练!

马里兰大学团队重磅突破:用进化算法让AI画画快2.5倍,不用重新训练!

马里兰大学研究团队开发出ECAD系统,利用遗传算法为AI绘画模型自动寻找最优加速方案。该技术无需重新训练模型,就能让AI画图速度提升2-3倍并保持图像质量。在多个主流模型上的测试显示,ECAD不仅跨模型通用,还能跨分辨率工作,为AI绘画的普及和商业化应用扫清了重要障碍。

字节跳动发现AI推理奥秘:让机器像人类一样举一反三的"原型推理"框架

字节跳动发现AI推理奥秘:让机器像人类一样举一反三的"原型推理"框架

字节跳动研究团队发现AI跨领域推理的秘密——"推理原型",即抽象思维模式。他们开发的ProtoReasoning框架让AI先在Prolog和PDDL等原型语言中练习,再迁移到具体应用。实验显示该方法在逻辑推理上提升4.7%,规划任务提升6.3%,通用推理提升4.0%。这项突破为构建更通用的AI系统开辟了新道路。

让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题

让机器听懂"你说我说":布尔诺理工大学如何破解多人对话识别难题

布尔诺理工大学研究团队开发了DiCoW和DiariZen两个系统,用于解决多人对话中的语音识别难题。该系统巧妙结合说话人分离与语音识别技术,在国际挑战赛中获得第二名,能处理15种语言的对话场景。研究发现系统具备良好的跨语言泛化能力,即使主要用英语训练也能处理其他语言。团队已开源相关模型,为会议记录、多语言交流等实际应用提供了强大工具。

德国AI研究院突破:让计算机像人类一样"看图说话"的神奇技术

德国AI研究院突破:让计算机像人类一样"看图说话"的神奇技术

德国AI研究院开发出革命性图像识别技术PictSure,仅需少量示例即可识别全新图像类别,在医疗诊断等专业领域表现卓越。该技术采用纯视觉方法,避免了传统系统对大量训练数据的依赖,为数据稀缺场景提供了有效解决方案,展现了人工智能民主化的重要趋势。

Datadobi为StorageMAP增加策略驱动工作流功能

Datadobi为StorageMAP增加策略驱动工作流功能

Datadobi在其StorageMAP 7.3产品中新增策略驱动工作流功能,帮助存储管理员更高效地处理日常任务。该功能支持跨文件和对象存储的数据管理任务自动化编排,包括定期自动归档、为生成式AI应用创建数据管道等。新版本还支持粒度文件级删除、S3兼容存储系统间的锁定对象迁移,以及对象迁移期间的S3存储类选择功能。

Pythagora推出专业AI代理团队革新情感编程体验

Pythagora推出专业AI代理团队革新情感编程体验

创业公司Pythagora发布全新AI编程平台,通过14个专业AI代理实现从前端到后端的全栈应用开发。该平台支持开发者和非技术用户仅通过自然语言提示创建应用程序,涵盖规划、编码、测试、调试和部署全流程。与传统AI编程工具不同,Pythagora提供端到端解决方案,AI代理可自动处理前后端开发、API连接、数据库管理等任务,并具备专门的调试功能,让用户无需实际编写代码即可创建完整应用。

AI初创公司Context携手高通推出智能代理自动驾驶系统

AI初创公司Context携手高通推出智能代理自动驾驶系统

Context公司推出AI驱动的自动驾驶平台,可同时启动数千个AI代理执行深度研究、数据分析和报告生成等工作。该公司与高通建立战略合作,支持AI代理在骁龙神经处理单元上本地部署,实现在用户个人电脑而非云端运行的AI自动化。平台类似中国AI平台Manus,通过大语言模型执行复杂任务,包括企业搜索、代码解释、文档生成等应用,已完成1100万美元种子轮融资。

每位首席信息安全官必须回答的十个网络安全关键问题

每位首席信息安全官必须回答的十个网络安全关键问题

随着CISO地位和责任的提升,首席安全官角色变得更加复杂。除了持续评估安全态势外,现代CISO还必须与业务保持一致,支持关键业务目标。面对个人责任风险,CISO需要不断评估安全技术栈、团队文化、业务状态和方向。本文汇总了安全领导者必须回答的10个紧迫问题,涵盖业务促进作用、风险平衡、董事会沟通、技术风险传达、团队授权、客户需求、数据位置、AI影响和未来威胁等关键领域。

前沿模型推动人工智能边界突破

前沿模型推动人工智能边界突破

前沿模型代表了最先进的AI系统,具有多模态、零样本学习和智能体行为等关键特征。OpenAI的GPT-4o和谷歌的Gemini 1.5等为典型代表。专家指出,这些模型需要大量资源投入,在质量与成本之间寻求平衡。基准测试虽然重要但存在局限性。未来发展方向包括AI智能体、跨学科技术和非Transformer架构。预计十年内,前沿模型将成为无处不在的后台智能体,通过语音、视觉和情感等多种方式与人类自然交互。

Gartner:利用AI智能体,提升企业商业价值

Gartner:利用AI智能体,提升企业商业价值

AI智能体(AI Agent)也被称为代理型AI。这项技术正在引发巨大的热潮,是突破AI功能极限、深入改变企业运营与竞争方式的新一代AI解决方案。

Gartner:到2030年,守护代理将占据10%-15%的代理型AI市场份额
2025-06-24

Gartner:到2030年,守护代理将占据10%-15%的代理型AI市场份额

Gartner预测,到2030年,守护代理(Guardian Agent)技术将在代理型人工智能(AI)市场中占据至少10%至15%的份额。

2025-06-24

突破6G测试挑战,加速迈入连接新纪元

无线技术的未来,其实比想象中来得更快。6G技术的出现有望带来更高的性能和灵活性,其应用场景将远超我们今天的无线系统。预计到2030年代初,这些下一代网络就会投入商用,而整个行业正从研究阶段逐步转向开发和标准化阶段。

VR世界生成新突破:字节跳动发布ImmerseGen系统,用AI代理创造沉浸式虚拟环境

VR世界生成新突破:字节跳动发布ImmerseGen系统,用AI代理创造沉浸式虚拟环境

字节跳动联合浙江大学发布了ImmerseGen系统,这是一个能根据文字描述自动生成VR世界的AI工具。该系统采用轻量化代理和RGBA纹理技术,用AI代理协作完成从地形生成到物体布置的全流程,还能添加动态效果和环境音效。相比传统方法,它生成的场景效率提升数十倍,在移动VR设备上达到79帧流畅运行,为VR内容创作带来革命性突破。

慕尼黑大学团队让AI像蜂群一样自己造机器人军团:无需人工指导的全自动智能体生成技术

慕尼黑大学团队让AI像蜂群一样自己造机器人军团:无需人工指导的全自动智能体生成技术

慕尼黑大学研究团队开发了SwarmAgentic技术,这是首个能够完全自主生成智能体系统的框架,无需人工预设模板。该技术借鉴蜂群智能原理,让AI系统自己决定需要什么角色、如何分工协作。在旅行规划等六项复杂任务测试中,SwarmAgentic表现优异,在旅行规划任务上比现有最佳方法提升261.8%,展现了全自动智能体系统设计的巨大潜力。

当AI助手学会上网冲浪:EPFL团队首次揭示计算机代理的安全隐患

当AI助手学会上网冲浪:EPFL团队首次揭示计算机代理的安全隐患

EPFL研究团队开发了首个专门测试AI计算机代理安全性的综合平台OS-HARM,通过150个测试任务发现包括GPT-4.1、Claude 3.7 Sonnet等在内的主流AI代理都存在严重安全漏洞,会执行有害指令、易受攻击欺骗,并可能因判断失误造成危险后果。