5月12日,华为技术有限公司(下称“华为”)与国美零售控股有限公司(下称“国美”)在华为北京EBC正式签署战略合作协议。国美集团创始人黄光裕,国美控股集团CEO杜鹃,国美零售高级副总裁方巍,国美电器CEO王巍,国美零售副总裁何敬禹,华为高级副总裁、华为云CEO张平安,华为中国区副总裁、华为云中国区总裁张修征,华为云公有云业务部总裁高江海,华为中国政企大企业系统部总经理王辉,华为中国政企大企业物流与零售系统部部长孔维明等以线上线下相结合的方式出席签约仪式。
根据战略协议,双方将充分发挥各自优势,围绕企业数字化转型进行战略合作。华为将从智能交互、智能联接、智能中枢(统一智慧运营管理平台)等方面构建云网边端协同的一体化智能系统,助力国美借助数字化赋能打造持续有效增长的新引擎,持续赋能行业,通过价值共创,实现价值共享。
经过三十五年的发展历程,国美已成长为集零售、金融、地产、投资等业务领域于一体的多元化企业集团。进入数字时代,国美正在不断深化探索平台化集成创新模式,希望借助数字化科技,构建线上与线下一体化、数字与实体融合的服务体系。通过本次合作,华为将全力支持国美零售数字化转型,构建以零售消费者为中心、面向零售数字化的业务能力体系,实现体验提升,效率提升、模式创新的数字化高效运营。
在签约仪式现场,国美控股集团CEO杜鹃表示,2021年,国美构建起“线上、线下、供应链、物流、大数据/云、共享共建”六位一体的“全零售生态共享平台”,开启了“家·生活”战略第二阶段的延展和升级。建设和运营好“全零售生态共享平台”,以更好的产品、服务和体验满足家生活的品质升级需求,离不开信息化、智能化的科技和应用赋能。而华为云一直围绕“深耕数字化,一切皆服务”的宗旨,在数智化门店、数字化精准营销、业务云化、数字基础设施、智能化和信息化解决方案等方面,有着很多领先和成功的实践,相信双方通过本次优势互补的战略携手,定会实现1+1>2的共享共建共赢效应。
国美控股集团CEO杜鹃
华为高级副总裁、华为云CEO张平安表示,进入数字经济时代,各行各业的信息化、数字化、智能化进程不断加快,零售行业新业态也正在蓬勃发展。作为零售数字化转型的基础,云计算的基础设施和服务,也已成为国美“家·生活”战略的重要发力点。华为的产品和解决方案涵盖了咨询服务和云、网、边、端多个领域。其中,华为云致力于将公司30多年来积累的数字化转型经验和产品、解决方案,以云服务的方式开放给客户,帮助客户更容易上云、方便上云、用好云。相信通过本次战略合作,双方将共同建设面向未来的零售数字化能力体系,支持国美和行业的高质量发展做出贡献。
华为高级副总裁、华为云CEO张平安
在本次合作中,华为与国美将重点推进全渠道零售数字化全面升级,持续践行国美“家·生活”战略,进一步激活实体零售新场景。双方将共同打造数字化零售门店样板点、包括零售线下门店IT装备与服务标准化,门店作业管理、设备设施管理等领域展开合作;以华为云为数字底座,搭建门店一站式运营平台打造,全力支持店员/店长灵活高效作战,持续提升门店运营效率;结合广告、CDP等数字化营销工具提升国美公域品牌曝光及私域流量运营,实现零售全渠道一体化的精准数字化营销,提升消费者粘性及满意度。
此外,双方还就零售数字化转型规划咨询、企业集团数据治理,打通各个业务板块、统一会员体系数据资产构建与赋能创新应用,智能终端物联等方面展开了深入讨论。
展望未来,华为云将围绕“深耕数字化,一切皆服务”战略持续加强投入,加速数字技术与实体经济深度融合,助力千行百业智能升级,与客户和伙伴在数字化进程中携手同行,至简共致远。同样的,“以科技提升效益,以智慧创造美好”也是国美一直坚守的初心。华为与国美的战略合作,将为智慧零售行业新业态的发展带来更多想象空间。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。