Dell PowerStore的最新升级包括全新 QLC 机型,同时新增智能驱动的自动化功能,安全性进一步增强。
参赛项目包括《AI儿童陪伴系统》《机械零件工艺知识智能体》《端侧多模态医疗险理赔智能体》等多个具有实际应用价值的智能体解决方案。
这项由谷歌DeepMind研究团队完成的开创性研究首次系统阐述了AI智能体经济的概念框架。研究提出"沙盒经济"模型,从起源性质和边界渗透性两个维度分析AI智能体经济形态,预测未来将出现自然涌现且高度透水的AI经济网络。研究详细探讨了科学加速、机器人协调、个人助手等应用场景,提出基于拍卖机制的公平资源分配方案和使命经济概念,并深入分析了技术基础设施需求、社区货币应用以及相关风险防范措施。
中国人民大学研究团队提出LoFT方法,通过参数高效微调基础模型解决长尾半监督学习中的数据不平衡问题。该方法利用预训练模型的良好校准特性改进伪标签质量,并扩展出LoFT-OW版本处理开放世界场景。实验显示,仅使用传统方法1%的数据量就能取得更优性能,为AI公平性和实用性提供了新的解决方案。
中央民族大学徐桂先团队创建了首个专门用于中国少数民族语言新闻标题生成的大规模数据集CMHG,包含藏语10万条、维吾尔语和蒙古语各5万条高质量数据。该数据集通过严格的母语使用者评估体系确保质量,并在多个先进模型上验证了有效性,为解决少数民族语言AI技术资源稀缺问题提供了重要基础,现已在Hugging Face平台开放共享。
剑桥大学等机构研究发现,AI模型在长期任务执行中存在致命缺陷:微小的单步改进会带来指数级的长期能力提升,但传统模型会被自己的历史错误"带偏",出现自我设限效应。思考型模型如GPT-5能执行超过1000步任务,打破了这一限制。研究重新定义了AI价值评估标准,认为长期执行能力比单次交互表现更重要。
香港科技大学等研究机构联合提出InfGen,一种革命性的AI图像生成方法。该技术将内容生成与分辨率调整分离,通过固定尺寸的潜在表示配合专门的生成器,实现任意分辨率图像的快速生成。相比传统方法需要100秒生成4K图像,InfGen将时间缩短至10秒内,速度提升10倍以上。该方法具备即插即用特性,可直接升级现有扩散模型,为高分辨率图像生成提供了全新解决方案。
史丹福大学团队开发出名为QuantAgent的AI股票预测系统,由四个专业AI助手协作:技术指标分析师、图形识别专家、趋势分析师和风险管理师。该系统仅通过分析股价数据就能预测市场走向,在比特币、标普500等八种资产的测试中,预测准确率普遍超过随机水平,最高达到80%。该研究展示了人工智能在高频交易领域的突破性应用。
中科大研究团队针对新兴MCP协议环境开发了首个专业AI评估基准MCP-AgentBench,包含33个服务器188种工具和600道测试题目。研究发现开源模型表现优异,通义千问达到64.7%最高得分超越专有模型,揭示了交互框架对性能的关键影响,为AI工具使用能力评估建立了新标准。
复旦大学和阿里巴巴联合推出VStyle,这是全球首个专门评估AI语音风格适应能力的基准测试。该研究解决了当前语音AI只关注"说什么"而忽视"怎么说"的问题,提出包含声学控制、自然指令、角色扮演、情感共情四类测试的1523个双语指令集。创新性地使用大型音频语言模型作为评判系统,实现了接近人类专家水平的评估一致性。测试结果显示商业系统明显优于开源系统,为语音AI向更自然人性化交互发展提供了重要技术基准。
中科院大学等机构联合开发的MachineLearningLM突破了大语言模型在数据分析方面的局限。该系统通过300万个合成任务的训练,能够在看到数百个例子后自动掌握各种数据预测规律。测试显示,它在金融、医疗等领域的分析准确率显著超越传统模型,同时保持了优秀的语言理解能力,为实现真正的通用人工智能分析系统开辟了新路径。
ServiceNow团队开发的AU-Harness是首个专门针对AI语音助手的综合评估工具包。该工具通过创新的并行处理和标准化测试协议,将评估效率提升127%,涵盖19项测试任务。研究引入了两个全新测试类别:时间感知的对话分离和复杂的口语推理能力。通过380多项测试揭示,当前AI语音模型在基础识别方面表现良好,但在复杂推理和时间理解上仍存在显著差距,为未来技术改进指明了方向。
约翰霍普金斯大学研究团队开发了MMBERT多语言AI模型,采用渐进式学习策略训练超过1800种语言。该模型通过逆向掩码调度和温度采样等创新技术,在多项基准测试中超越XLM-R等现有模型,甚至在部分小语种任务上超过OpenAI o3和Google Gemini。模型运行速度比同类产品快2-4倍,已开源发布。
华为科技团队开发出首个多视角3D空间理解基准测试Ego3D-Bench,包含8600个测试样本,覆盖距离测量、定位、运动推理等任务。同时推出Ego3D-VLM解决方案,通过构建文字版认知地图显著提升AI空间理解能力,多选题准确率提升12%,距离估算误差减少56%,为自动驾驶和机器人应用提供关键技术支撑。
香港大学团队构建了全球首个大规模牙科全景X光AI数据集MMOral,包含2万余张影像和130万条指令数据。研究发现现有AI模型在牙科诊断上表现不佳,最强的GPT-4o仅达41%准确率。团队开发的专业模型OralGPT经训练后准确率提升24.73%,为AI在牙科医学的应用奠定基础。
意大利博尔扎诺自由大学团队开发了首个跨领域AI代码漏洞检测系统AI-DO,成功将学术研究转化为工业实践。研究证明用开源数据训练的AI模型能够有效检测工业软件漏洞,性能下降仅约10%。该系统已在真实企业环境中部署测试,为软件安全防护提供了新的解决方案,标志着AI安全检测技术从实验室走向实际应用的重要突破。
德州农工大学研究团队开发的FuzzingBrain系统,结合大语言模型和传统模糊测试技术,能够自动发现软件安全漏洞并生成修复补丁。在DARPA人工智能网络挑战赛中获得第四名,成功发现28个漏洞包括6个零日漏洞。系统采用大规模并行架构,实现了智能化的漏洞检测和修复流程,为网络安全防护提供了新的技术路径。
阿德莱德大学研究团队开发了ObjectReact系统,让机器人能像人类一样通过物体关系而非图像匹配进行导航。该方法构建三维物体关系地图,使用WayObject代价地图引导机器人朝低代价区域移动。实验显示这种方法在复杂导航任务中显著优于传统方法,且对机器人身高变化具有强鲁棒性,真实环境测试证明了其实用性。
西湖大学团队开发出VLA-Adapter机器人控制系统,仅用0.5B参数就超越了7B参数的传统系统。该系统通过Bridge Attention机制实现视觉-语言-动作的高效转换,训练成本降低38倍,推理速度快3倍,在LIBERO测试中达到97.3%成功率。创新点在于设计专门的信息桥接机制而非单纯扩大模型规模,为机器人控制技术普及提供了新路径。