最新文章
2025上海车展| 北斗星通旗下和芯星通发布覆盖车载全场景的产品方案
2025-04-28

2025上海车展| 北斗星通旗下和芯星通发布覆盖车载全场景的产品方案

2025上海车展充满科技范儿,更加聚焦用户价值与安全性。智能化、电动化进一步深入融合,呈现辅助驾驶成熟量产化、舱驾融合一体化、产业链创新本土化、跨界融合生态化的趋势。

仿生机器人技术蓬勃发展,但面临技术和成本障碍
2025-04-28

仿生机器人技术蓬勃发展,但面临技术和成本障碍

我们是否拥有能在不到一毫秒、甚至纳秒的时间内完成操作且不丢失任何连接的基础设施呢?

3DV-TON:基于扩散模型的纹理3D引导一致性视频试穿技术
2025-04-28

3DV-TON:基于扩散模型的纹理3D引导一致性视频试穿技术

想象一下,你是否曾经在网购衣服时犹豫不决,因为无法确定那件衣服穿在自己身上会是什么效果?虚拟试穿技术正是为解决这一问题而生。然而,传统的虚拟试穿技术往往只能处理静态图像,而在处理视频时,则会面临更大的挑战:如何确保人物运动过程中,衣物的细节和纹理保持真实自然的一致性?这正是阿里巴巴研究团队在这项工作中着力解决的核心问题。

DyMU:为高效视觉-语言模型打造的动态合并与虚拟解合并技术
2025-04-28

DyMU:为高效视觉-语言模型打造的动态合并与虚拟解合并技术

想象你有一个超级聪明的朋友,能看懂图片并回答关于图片的问题。但这位朋友有个古怪的习惯:无论你给他看什么图片——简单如一张白纸上的小圆点,还是复杂如一整个城市街景——他都会花同样多的时间仔细研究。这听起来很奇怪,对吧?为什么简单的图片不能更快处理完成呢?

镜中陷阱:AI 伦理与人类想象力的崩溃

镜中陷阱:AI 伦理与人类想象力的崩溃

本文警示:AI仅复制人类表象,非真正创新;不断抹平人性瑕疵,削弱创新活力,迫切需要激发挑战与思辨的系统设计。

人工智能在航空航天产业中是否获准起飞?

人工智能在航空航天产业中是否获准起飞?

本文讨论了AI如何革新航空航天业,从优化航班运营、提升驾驶舱智能化,到加速飞机设计、精益制造和预测性维护,既提高安全性又降低成本,同时强调需平衡技术、监管与伦理挑战。

2025-04-28

44位80后掌控超7000亿,2025中国科创新锐力量榜单发布

和讯财经研究院发布《2025年中国科创新锐力量榜》,榜单列出了今年中国科创板上市公司45岁以下(80后)的青年领导者,并根据上市公司2025年一季度末市值(2025-3-21)进行排序。

时间超越时限的在线视频语言交流:突破80%冗余视觉令牌的新思路
2025-04-28

时间超越时限的在线视频语言交流:突破80%冗余视觉令牌的新思路

想象一下,你正在观看一场长达两小时的烹饪直播。主厨正在展示一道复杂菜品的制作过程,从准备食材到最终装盘。在这个过程中,你可能会在聊天框中提问:"主厨用了多少盐?"或者"之前切洋葱的那把刀现在去哪了?"甚至是"你觉得这道菜最后会是什么味道?"

动态合并与虚拟解合:让视觉语言模型更高效运行
2025-04-28

动态合并与虚拟解合:让视觉语言模型更高效运行

想象你使用一个强大的AI助手来理解图片。这个AI需要将图片转换成大量的"视觉令牌"(visual tokens),就像将图片切成小块进行处理。目前的主流视觉语言模型面临一个严重问题:无论图片内容多么简单或复杂,它们总是使用固定数量的视觉令牌来表示每张图片。

IberBench:面向伊比利亚语言的大语言模型评测框架
2025-04-28

IberBench:面向伊比利亚语言的大语言模型评测框架

想象一下,如果你只会说西班牙语或葡萄牙语,而市面上的AI助手主要针对英语用户优化,这种体验会是怎样的?就像走进一家五星级餐厅,却发现菜单上的美食都不适合你的口味。这正是IberBench项目要解决的问题——它为伊比利亚语系语言(如西班牙语、葡萄牙语、加泰罗尼亚语、巴斯克语和加利西亚语)的大语言模型评估提供了一个全面的测试平台。

当AI与推理深度融合:探索具有思考能力的过程奖励模型
2025-04-28

当AI与推理深度融合:探索具有思考能力的过程奖励模型

我们现代的人工智能模型,尤其是大型语言模型(LLM),在解决复杂问题时往往需要逐步推理。想象一下,当你解决一道复杂数学题时,你不会直接写出答案,而是会一步一步地分析问题,检查每一步的正确性,最终得出结论。人工智能也需要这种能力。但问题是:如何确保AI的每一步推理都是正确的?

图像与特征联合建模:DINOv2技术融入让图像生成如虎添翼
2025-04-28

图像与特征联合建模:DINOv2技术融入让图像生成如虎添翼

想象你在学习绘画。传统方法就像只学习如何混合颜料和画线条(低级细节),而不太关注如何表达情感或主题(高级语义)。这导致你可能画出技术上精确但缺乏内涵的作品。相比之下,一些专门的表征学习方法(如DINOv2)就像是专注于理解艺术构图和表达情感的课程,但它们并不直接教你如何实际创作艺术品。

ViSMaP:使用元提示技术实现长视频无监督摘要的突破性研究
2025-04-28

ViSMaP:使用元提示技术实现长视频无监督摘要的突破性研究

想象一下,你拥有一部记录全家旅行的一小时视频,里面包含了许多琐碎的日常片段,但也有一些珍贵的难忘时刻。如果要向朋友展示这段旅程的精华,你可能需要手动浏览整个视频,找出重要片段,然后制作一个简短的剪辑。这个过程既耗时又繁琐。

以经济利益为驱动的网络犯罪仍然是最大的威胁来源

以经济利益为驱动的网络犯罪仍然是最大的威胁来源

Google Cloud旗下Mandiant最新M-Trends报告显示,金融驱动的网络攻击(如勒索软件)依旧为全球主流威胁,其手段正日益复杂和智能化。

英国初创公司 Isembard 获得 900 万美元资金推动关键产业制造回流

英国初创公司 Isembard 获得 900 万美元资金推动关键产业制造回流

英国初创企业 Isembard 获得 900 万美元种子轮融资,将在西方建立多个自动化精准制造工厂,利用自家 MasonOS 系统为航空、国防和能源等领域提供更快捷低成本的本土生产方案。

Lately 的新游戏化应用助力用户准时出发

Lately 的新游戏化应用助力用户准时出发

Lately 是一款针对 ADHD 用户的游戏化时间管理应用,通过倒计时提醒和积分奖励机制促使用户按时出发,改善时间感知问题,目前支持驾车和步行模式,未来还将推出社交功能与 Android 版本。

打造你自己的拒社交写作设备:使用 DOS 和 2 美元 USB 密钥

打造你自己的拒社交写作设备:使用 DOS 和 2 美元 USB 密钥

本文介绍如何通过 USB 启动 DOS,打造一台独立无干扰的写作系统,详细讲述了技术步骤以及使用经典 DOS 软件的优缺点。

M&S 暂停所有线上销售,因网络攻击恶化

M&S 暂停所有线上销售,因网络攻击恶化

为了应对网络安全事故,M&S 暂停其官网及 APP 接单,但产品页面仍可浏览,实体店正常营业。此前事故导致非接触支付及线上提货服务暂停,疑似勒索软件攻击。公司现正与安全专家及 NCSC 紧密调查,并提醒顾客留意账户安全。

专访|Infobip CBO: CPaaS下半场  Infobip要做中国企业出海的“金钥匙”
2025-04-28

专访|Infobip CBO: CPaaS下半场 Infobip要做中国企业出海的“金钥匙”

在CPaaS这个看似拥挤、实则暗流涌动的赛道上,Infobip是一个值得深度剖析的企业。

HYCU 在 R-Cloud 中推出 R-Shield 提供额外保护

HYCU 在 R-Cloud 中推出 R-Shield 提供额外保护

HYCU在R-Cloud数据保护服务中加入R-Shield功能,提供异常及勒索软件检测、持续监控和即时恢复,有效保护分布式IT环境免受网络攻击与人为错误。