日前,《中共中央 国务院关于构建更加完善的要素市场化配置的体制机制的意见》(简称《意见》)发布。《意见》指出了土地、劳动力、资本、技术、数据五个要素领域改革的方向。数据作为一种新型要素,成为了《意见》中备受关注的内容。
《意见》提出,要推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合和安全保护,并强调引导培育大数据交易市场,为数据要素市场化配置指明了方向,对推动数字经济高质量发展具有重要指导意义。
浪潮多年来在数据产业领域的呼吁,终于迎来政策层面的呼应。
作为中国数据开放第一人,全国人大代表、浪潮集团董事长孙丕恕在2014年全国“两会”率先提出政府数据开放的必要性,并连续6年围绕数据开放、运营、大数据“双创”等提出建议。近日,孙丕恕在人民日报发表署名文章《更好实现数据共享》,再一次强调数据是国家重要的基础性战略资源,充分利用好这些高价值数据,能进一步提升政府社会治理能力和公共服务水平。
多年来,浪潮极为重视数据价值。2010年开始探索汇聚、盘活数据,2014年提出做领先的大数据服务商,2018年提出向“新三大运营商”——云服务运营商、大数据运营商和智慧城市运营商转型,致力于做领先的“云+数+AI”新型互联网企业,大数据运营商成为重要战略方向。在推动数据开放共享、运营与安全保障等方面,浪潮已率先实践,深度布局。
《意见》提出“推进政府数据开放共享”。政府数据是“钻石矿”,浪潮一直积极推动政府数据共享开放,加快应用创新,通过政府授权数据运营,实现数据的聚、通、用。2014年,浪潮在国内首提“政府数据开放五级技术成熟度模型”,为政府数据开放提供理论依据和实践经验。
近年,浪潮积极参与国家数据共享及开放平台的规划建设工作,参与制定《政府数据标准规范》、《数据管理平台保障制度》两大类17项国家标准,为全国100多个省市政府建立大数据平台,实现数据共享共用;为山东、宁夏、广西、重庆、陕西等省市提供数据开放服务,梳理政府数据目录20000多个。
在政府数据整合、开放、共享的基础上,浪潮“互联网+政务服务”整体解决方案,在全国29个省(自治区、直辖市)、118个地市、800多个区县应用,助力各级政府开展放管服工作,为5.1亿人口,1100万个法人主体提供专业服务。
在济南,患者通过电子健康码授权后,在保障数据安全的情况下,医生可查询患者近年来检查、检验、诊断、治疗等就诊记录。济南医疗数据实现跨区域、跨机构共享的原因是基于国家健康医疗大数据北方中心试点成果,浪潮在试点中全面负责医疗数据全量采集、治理、应用工作。如今,济南健康医疗大数据平台不断深化治理应用,复制推广至天津、内蒙古、厦门、南宁等地。疫情期间,浪潮承建运营的内蒙古自治区互联网医疗服务系统,及时为患者提供了发热专线、门诊就医后复诊、远程诊断等线上医疗服务。
浪潮还基于政府授权数据和社会化数据打造了爱城市网、质量链、一贷通等新型互联网应用,积极探索政府数据开放共享、运营模式。例如,爱城市网App基于政府数据授权,提供便民查询、办事服务、民生互动、交通金融、教育医疗等服务,已覆盖400多个城市,并在天津、济南、重庆等60多个城市落地运营。爱城市网已接入国家政务服务平台,是“国家防疫健康信息码”三大互联网亮码端之一,成为大数据抗疫的重要支撑平台之一。
此外,浪潮倾力数年打造的数据资源与交易平台——天元数据网,基于《意见》明确支持“依法合规开展数据交易”,有望迎来巨量增长。
数据安全一直是数据开放的难点与争议所在,《意见》也强调了“数据的保护”。浪潮始终将数据安全视为生命线,从技术、管理多方面保证授权数据安全。
为了保护政府授权开放的数据接口,浪潮开发了数据防护平台DPP,采用区块链认证、授权和调用留痕。
浪潮还打造了数据铁笼(IDS),利用虚拟化技术实现数据处理过程封闭隔离,通过内存计算实现数据用后即焚,计算结果定向到指定位置,处理过程区块链全程锁定、可追溯,实现数据“非授权不可用”、“可用不可见”、“数据不出笼”。依托数据铁笼打造的数据安全防护产品数安链,已应用在济南公安无犯罪证明核查、电子居住证等服务场景。
专家认为,加快培育数据要素市场,将进一步完善我国现代化治理体系,对经济社会发展产生深远影响。数据生产要素市场化大幕已经拉开,浪潮将继续探索前行。
好文章,需要你的鼓励
这项研究由德累斯顿工业大学等机构的研究团队完成,旨在解决主动学习未被广泛应用的问题。研究者构建了包含460万种超参数组合的实验网格,系统分析了各参数对主动学习性能的影响。研究发现,不同策略实现间存在显著差异,基于边缘的不确定性策略整体表现最佳,随机选择约4000个超参数组合即可获得可靠结果。这些发现为设计可重现、可信赖的主动学习实验提供了明确指导,有助于降低入门门槛,促进技术在实际应用中的普及。
这项由英国爱丁堡大学和上海人工智能实验室研究者共同完成的工作提出了LongBioBench,一种用于评估长文本语言模型的新型基准测试框架。通过使用人工生成的虚构人物传记作为测试环境,该框架在保持可控性的同时,提供了更真实的评估场景。研究对18个长文本模型的测试表明,即使最先进的模型在检索、推理和可信任性方面仍存在显著挑战,特别是上下文长度增加时。研究还揭示了现有合成基准测试的设计缺陷和长上下文预训练的局限性,为未来模型开发提供了重要指导。
SuperWriter是一项来自新加坡科技设计大学和清华大学的突破性研究,通过模仿人类"先思考后写作"的过程,彻底改良了AI长文生成能力。该研究团队开发的框架包含三个关键阶段:规划、写作和修改,使AI能像专业作家一样进行结构化思考。实验结果表明,经过训练的SuperWriter-LM模型不仅超越同等规模的所有AI模型,甚至在某些领域表现优于规模更大的顶级模型,为AI辅助写作开创了新的可能性。
香港大学与阿里巴巴达摩院合作开发的LayerFlow是一种突破性的层级视频生成技术,能同时生成透明前景、完整背景和混合场景视频。该技术通过创新的框架设计将不同视频层级作为子片段连接,并引入层级嵌入使模型区分各层级。面对高质量训练数据稀缺的挑战,研究团队设计了三阶段训练策略,结合Motion LoRA和Content LoRA,实现了图像和视频数据的联合训练。LayerFlow不仅支持多层视频生成,还能实现视频分解和条件层生成,为视频创作领域带来革命性变革。