——智慧城市体验周2020火热进行,上海城市峰会压轴举办
2010年上海率先在全国开启智慧城市建设的探索,作为智慧城市的先行者,上海近十年在经济、社会、民生、文化等多个方面建设成果显著。在近日举行的全球智慧城市大会2020上,上海从全球48个国家和地区的350座申报城市中脱颖而出,荣获“世界智慧城市大奖”,这是中国城市首次荣膺该奖项。能得到来自全球的广泛关注和高度认可,华为等作为上海智慧城市建设重要支持单位共同领奖。
治理数字化,上海十年智慧城市建设成效明显
据《2020上海市智慧城市发展水平评估报告》显示,2020年上海市智慧城市发展水平指数为109.77,较去年提高3.91,七年以来保持持续增长。综合来看,上海的浦东新区、徐汇区、黄浦区依次为2020上海智慧城市发展水平指数的前三名。
与此同时,报告显示现阶段上海智慧城市建设成效显著,新一代信息基础设施建设和应用全面提速;智慧应用智能化、互联度进一步提高,公共服务更加普惠、便捷、智能;政务服务“一网通办”持续深化,办事更加快捷方便;城市运行“一网统管”加快推进,城市治理更加精细化;数字经济活力迸发,产业高质量发展;智慧城市发展环境保障持续优化。
截至目前,上海数字经济活力已经逐步被激活,新生代互联网经济蓬勃兴起,工业互联网加速赋能,一些新模式新业态已经在上海这片土地上生根、开花、结果。与此同时,数字基础设施也在持续完善,当下率先建成了“双千兆宽带”的第一城,实现5G城市全覆盖。
据了解,上海在政府与公共事业、金融、制造、运营商、互联网、交通、能源等领域与华为展开深入合作,通过科技创新助力产业和行业升级,其中:在制造业,达索基于华为云、AI,5G技术,打造智能化作业平台,赋能中国制造突破传统瓶颈;在物流业,德邦携手华为云,通过OCR技术,实现一秒识图高速取件;在医疗业,新华医院基于华为云,提高罕见病的临床诊断及治疗水平,构建了个性化诊疗的精准医疗服务;在政务转型升级领域,华为助力上海一网通办完成“高效办成一件事”,在城市精细化管理方面,助力浦东新区大数据中心制定全国首个政务区块链地方标准;黄浦区打造智慧黄浦综合运营指挥平台;徐汇区构建一网统管12345热线智能感知系统,这些都切实提升了城区治理体系和治理能力和现代化水平。可以说,科技赋能下的上海,其智慧城市的优势特征显著。
加快推进城市数字化转型,打造全球数字城市
上海智慧城市建设水平已处于领先地位,未来的发展需要更高维的发展能级,更务实的发展要素:以人为本,提升城市智慧化建设能级,提升人民生活新体验,促进企业新发展,实现政府新治理;以产为基,加速支柱产业转型升级,培育新型战略产业快速发展,需要政府、行业、伙伴协同,加速“产业+科创”的融合,为未来城市更高质量发展夯实基础。11月25日,上海市第十一届委员会第十次全体会议举行,全会指出,要全面推进城市数字化转型。城市数字化转型是一个全新课题,上海应该如何发力?
借上海智慧城市建设十周年及荣获大奖之际,也是浦东开发开放30周年的重要历史时刻,这是上海发展进程中具有里程碑意义的大事,以“数字化转型下的智慧城市”为主题的2020上海智慧城市体验周活动于12月8日正式开幕,其中即将于12月15日举行的“智慧上海·进而有为”华为上海城市峰会2020将作为大会重磅环节压轴举办。峰会以集聚能力、聚合生态,立足浦东服务于上海城市数字化转型为目的,邀请城市与产业建设者及管理者、行业领袖、学术泰斗、高校及科研院所、上下游生态伙伴等,共同分享智慧城市建设成果和最新理念,共同探讨智慧金融、智能制造等传统支柱行业如何智能化升级,人工智能等新型战略产业如何赋能千行百业高质量发展,未来如何助力上海迈向卓越的全球智慧城市。
更多精彩,敬请期待!
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。