2021年8月,交通运输部发布《交通运输领域新型基础设施建设行动方案(2021—2025年)》。行动方案指出:要建设新一代自动化码头,加快新型自动化集装箱码头、堆场建设和改造,加强码头桥吊、龙门吊等设施远程自动操控改造,推进码头操作系统和设备控制系统的深度融合,形成一批可复制推广的应用场景。
南京港,中国内河主要港口、主枢纽港和对外开放一类口岸,是长江流域水陆联运和江海中转的枢纽港,现有八大港区、码头泊位78个,年货物吞吐量居长江港口企业第一位。
在以南京港为代表的港口工作环境中,兼有船、车、人、重型机械等多种生产元素,工作环节多,作业环境复杂,具有流动分散、操作复杂、人机交叉、点多面广、昼夜连续作业的特点。目前视频监控是主要的生产安全管控手段,但是传统视频监控过于依赖人工,人工监看海量视频难度大,长时间容易疲劳,问题发现不及时,难以实现全面实时监管、安全风险提前预防和实时预警,存在较大安全管理风险。
针对港口生产安全管理痛点需求,联通数科AI团队支撑联通南京市分公司,为南京港研发了一套智慧港口AI平台,实现作业现场生产安全智能监测,包含对人员、设备、车辆、吊机、船舶、道路、通道、堆场等的智能监测和实时预警。
目前一期项目已投入使用,效果显著:安全问题由被动发现变为主动发现,利用AI技术主动智能识别和区分人、事、物,一旦发现异常情况或者突发事件实时报警,极大降低安全风险;码头运营指标将大幅提升,包括提升码头作业综合效率、节省安全事故成本、节约监管人工成本。
该项目在由工信部主办的2021年第四届“绽放杯”5G应用征集大赛中,荣获工业互联网赛道三等奖。
下面选择3个典型应用场景进行介绍:
(一)港区交通合规监测。利用计算机视觉技术实时监测港区内的各类交通违规行为,并实时预警。已实现车辆超速、车辆逆行、车辆违停、行人不走安全通道、车辆违规掉头、临时停车超时等场景的智能识别监测,违规事件识别准确率超过95%,速度测量误差小于3公里/时。

(二)叉车安全作业智能化改造。通过增加摄像头、激光雷达、智能分析控制模组等对叉车进行智能化改造,实时监测叉车前后作业路径一定范围内是否有人,一旦发现有人立即预警。设备主要形态如下:

叉车作业安全监测模组架构如下:

实地应用场景如下:

(三)龙门吊集卡防吊起智能化改造。通过摄像头和激光雷达等多源融合方式对整个龙门吊作业过程进行监控,一旦识别到异常情况,实时告警。此方案可避免因为单独摄像头受到外界干扰而造成的漏检,更灵敏、更稳定、误报率低,对正常作业的影响降到最低。设备主要形态如下:

龙门吊集卡防吊起安全监测模组架构如下:

实地应用场景如下:

联通数科打造的智慧港口AI致力于解决港口核心生产安全,也是AI团队打造的交通物流类“职业技能”之一,核心算法在业界多次实测比拼中排名领先。我们将持续面向客户痛点需求打造具备“职业技能”的行业AI,赋能行业数字化转型和智能化升级。
目前,联通AI已拥有超40项自研原子能力,其中2D/3D场景分割、场景文字识别、人脸识别、音频分类、情感识别、交通路况感知等多项算法在国际/国内评测中排名前五;面向细分行业领域,历经100+真实场景沉淀打造了多种具备“职业技能”的细分行业AI,并以联通云网为基础,为政企重点行业客户做集约化赋能,客户评价“具备业界领先的快速定制化能力”;发挥运营商禀赋构建了用户可参与的AI运营成长机制,实现细分行业AI“越用越聪明”,助力客户持续创造价值。
好文章,需要你的鼓励
谷歌Agent Development Kit(ADK)革新了AI应用开发模式,采用事件驱动的运行时架构,将代理、工具和持久化状态整合为统一应用。ADK以Runner为核心,通过事件循环处理用户请求、模型调用和外部工具执行。执行逻辑层管理LLM调用和工具回调,服务层提供会话、文件存储等持久化能力。这种架构支持多步推理、实时反馈和状态管理,为构建超越简单聊天界面的生产级AI应用提供了完整框架。
上海AI实验室联合团队开发RoboVIP系统,通过视觉身份提示技术解决机器人训练数据稀缺问题。该系统能生成多视角、时间连贯的机器人操作视频,利用夹爪状态信号精确识别交互物体,构建百万级视觉身份数据库。实验显示,RoboVIP显著提升机器人在复杂环境中的操作成功率,为机器人智能化发展提供重要技术突破。
苹果在iOS 26中推出全新游戏应用,为iPhone、iPad和Mac用户提供个性化的游戏中心。该应用包含五个主要版块:主页展示最近游戏和推荐内容,Arcade专区提供超过200款无广告游戏,好友功能显示Game Center动态并支持游戏挑战,资料库可浏览已安装游戏并提供筛选选项,搜索功能支持按类别浏览。iOS 26.2版本还增加了游戏手柄导航支持,为游戏玩家提供更便捷的操作体验。
英伟达研究团队提出GDPO方法,解决AI多目标训练中的"奖励信号坍缩"问题。该方法通过分别评估各技能再综合考量,避免了传统GRPO方法简单相加导致的信息丢失。在工具调用、数学推理、代码编程三大场景测试中,GDPO均显著优于传统方法,准确率提升最高达6.3%,且训练过程更稳定。该技术已开源并支持主流AI框架。