最新文章
牛津大学新研究:股市动荡期,这种新方法比传统风险评估准确25%

牛津大学新研究:股市动荡期,这种新方法比传统风险评估准确25%

牛津大学研究团队开发了基于期望值的新型股市风险评估方法,通过分析FTSE 100指数20年数据发现,该方法在预测极端市场事件方面比传统方法准确25%以上。新方法不仅考虑风险事件的发生概率,还特别关注事件的严重程度,在2008年金融危机等动荡期表现尤为出色,为金融机构提供了更可靠的风险管理工具。

小红书打造社交网络专用AI大脑,聊天购物搜索样样精通

小红书打造社交网络专用AI大脑,聊天购物搜索样样精通

小红书NLP团队开发了专门针对社交网络的AI模型RedOne,通过三阶段训练策略处理社交媒体特有的非正式语言和多元化任务。该模型在社交网络基准测试中比基础模型平均提升14.02%,在实际应用中将有害内容检测准确率提升11.23%,搜索推荐点击率提升14.95%,为社交平台AI应用提供了新的技术方案。

人工智能模型被发现存在重大安全漏洞:上海交通大学团队揭示扩散模型的"面具背后恶魔"

人工智能模型被发现存在重大安全漏洞:上海交通大学团队揭示扩散模型的"面具背后恶魔"

上海交通大学研究团队发现扩散式大语言模型存在严重安全漏洞,其开发的DIJA攻击方法能以接近100%成功率绕过AI安全防护,诱导模型生成危险内容。该攻击利用扩散模型的双向建模和并行解码特性,通过插入掩码标记让AI误以为是填空练习,从而规避安全检查。现有防护措施对此类攻击几乎无效,凸显了新兴AI架构安全评估的紧迫性。

Mono-InternVL-1.5:当AI开始用更少的钱做更多的事——清华大学等机构联合推出的低成本高性能多模态大模型

Mono-InternVL-1.5:当AI开始用更少的钱做更多的事——清华大学等机构联合推出的低成本高性能多模态大模型

清华大学等机构联合发布Mono-InternVL-1.5多模态大语言模型,通过创新的单体式架构设计,实现了用58%更少的训练数据达到更好性能的突破。该模型采用视觉专家嵌入和渐进式训练策略,有效解决了多模态学习中的灾难性遗忘问题,推理速度提升26%,为低成本高性能AI应用开辟新路径。

Voxtral:让机器真正"听懂"人话的多模态AI助手来了!Mistral AI的语音理解革命

Voxtral:让机器真正"听懂"人话的多模态AI助手来了!Mistral AI的语音理解革命

Mistral AI发布了两个开源多模态语音AI模型Voxtral Mini和Small,不仅具备语音识别能力,更能理解语音内容并进行智能对话。模型支持32K上下文窗口,可处理40分钟长音频,在语音识别、翻译和理解任务中达到最先进水平。Small版本超越多个闭源模型,Mini版本可本地运行,两个版本均在Apache 2.0许可证下开源发布。

浙江大学和新加坡国立大学联手打造AI"安全卫士":让多模态大模型既聪明又安全

浙江大学和新加坡国立大学联手打造AI"安全卫士":让多模态大模型既聪明又安全

浙江大学和新加坡国立大学联合开发的AutoSteer系统,为多模态大语言模型提供了创新的安全防护机制。该系统通过安全意识评分自动识别AI内部最佳监控点,结合智能毒性检测器和拒绝机制,实现了既强大又安全的AI防护。实验显示,AutoSteer在显著降低攻击成功率的同时,完全保持了AI系统的正常功能,为AI安全领域提供了实用的解决方案。

HSE大学突破性研究:解决AI模型训练中的"双重困扰"问题

HSE大学突破性研究:解决AI模型训练中的"双重困扰"问题

HSE大学研究团队提出了RiemannLoRA方法,创新性地将黎曼几何引入大型模型的低秩适应训练中。该方法通过统一框架同时解决了初始化选择和过参数化两个关键问题,在常识推理和图像生成任务上都显著优于传统LoRA方法,为人工智能模型的高效训练提供了新的几何视角和实用工具。

浙大团队破解稀疏视频重建难题:AI让几个摄像头拍出电影级人物表演

浙大团队破解稀疏视频重建难题:AI让几个摄像头拍出电影级人物表演

浙江大学研究团队开发的Diffuman4D系统实现了从稀疏视频重建高质量三维人物表演的技术突破。该系统仅需4台摄像头就能生成多视角一致的高分辨率视频,通过创新的滑动迭代去噪机制和人体骨骼引导,解决了传统方法在时空一致性方面的挑战。实验表明该技术在多个评估指标上显著超越现有方法,为电影制作、体育直播和虚拟现实等领域提供了低成本的高质量视频生成解决方案。

清华大学团队揭秘:人工智能如何像人类一样"理解"图像中的物理世界

清华大学团队揭秘:人工智能如何像人类一样"理解"图像中的物理世界

清华大学研究团队开发出能够像人类一样理解物理世界的人工智能系统。该系统采用"子等变图神经网络"架构,内置物理规律,能仅通过观察预测物体运动和相互作用。与传统AI相比,新系统预测精度提升30-45%,且具备强大的泛化能力,可应用于机器人、自动驾驶、游戏开发等领域,代表了从数据驱动向知识驱动转变的重要突破。

AI编程挑战赛首轮结果出炉:最高得分仅7.5%
2025-07-24

AI编程挑战赛首轮结果出炉:最高得分仅7.5%

K Prize是由Databricks和Perplexity联合创始人推出的AI编程挑战赛,首轮比赛结果显示,获胜者巴西工程师Eduardo Rocha de Andrade仅答对7.5%的题目就获得5万美元奖金。该测试基于GitHub真实问题,采用定时提交系统防止针对性训练,与SWE-Bench 75%的最高得分形成鲜明对比。创始人承诺向首个在该测试中得分超过90%的开源模型提供100万美元奖励。

阿里巴巴发布Qwen3-Coder-480B编程模型,可能是最佳编程模型

阿里巴巴发布Qwen3-Coder-480B编程模型,可能是最佳编程模型

阿里巴巴通义千问团队发布开源编程模型Qwen3-Coder-480B-A35B-Instruct,专门用于软件开发辅助。该模型采用混合专家架构,拥有4800亿参数,支持25.6万token上下文长度,可在数秒内创建完整功能应用。在SWE-bench基准测试中得分67.0%,表现优于GPT-4和Gemini。模型基于Apache 2.0开源许可,企业可免费使用。AI研究者称其可能是目前最佳编程模型,特别适合企业级代码库理解、自动化代码审查和CI/CD系统集成。

SecurityPal结合AI与专家团队将企业安全问卷处理速度提升87倍

SecurityPal结合AI与专家团队将企业安全问卷处理速度提升87倍

SecurityPal成立于2020年,专门处理企业间技术采购中的安全合规问卷。该公司结合AI引擎与位于尼泊尔加德满都的240人分析师团队,帮助供应商和买方快速完成安全评估。平台维护着250万个安全问题的专有语料库,采用"人机协作"模式确保准确性。客户包括OpenAI、Figma等知名企业,服务承诺24小时内完成问卷处理,相比传统手动流程速度提升高达87倍。

皮查伊对谷歌云与OpenAI合作表示"非常兴奋"

皮查伊对谷歌云与OpenAI合作表示"非常兴奋"

谷歌CEO桑达尔·皮查伊在财报电话会议上表示,对与OpenAI在云计算领域的合作感到"非常兴奋"。尽管OpenAI是谷歌在AI领域的最大竞争对手,但这一合作为谷歌云带来了重要客户。谷歌云第二季度收入增长至136亿美元,同比增长32%。该合作关系颇为微妙,OpenAI可能会利用谷歌的云基础设施来挑战谷歌的核心搜索业务。

我们正在见证机器心理学的诞生吗?

我们正在见证机器心理学的诞生吗?

最新调查显示,32%的受访者表示有兴趣使用AI进行心理治疗而非人类治疗师。专家认为,AI聊天机器人具有超强耐心,在快节奏社会中颇具吸引力。年轻人因习惯单向网络关系而更易接受AI治疗。研究表明AI在预测自杀倾向方面准确率达70%,但也存在风险,包括过度肯定和缺乏真实人际连接。专家建议应谨慎整合AI与传统心理治疗,既发挥技术优势又保持人性化关怀。

Google将AI驱动的照片生成视频功能扩展至更多应用

Google将AI驱动的照片生成视频功能扩展至更多应用

谷歌正在将其基于人工智能的图片转视频技术推广到更多应用程序中。这项技术能够将静态图片转换为动态视频内容,利用先进的AI算法分析图片内容并生成流畅的视频效果。此举标志着谷歌在AI视觉处理领域的进一步布局,预计将为用户提供更丰富的多媒体创作体验。

承包商如何加速数据中心建设进度

承包商如何加速数据中心建设进度

随着数字基础设施需求激增,数据中心成为非住宅建筑增长的主要驱动力。开发商正在加快建设步伐,面临更紧迫的时间表和更高期望。Gray建筑公司数据中心副总裁Ben Burgett分享了加速时间表的关键做法:早期协调配合、预制化施工、多建筑同步建设等。同时,AI芯片产生的高热量推动液冷技术应用,电力需求从40兆瓦增至100-120兆瓦。新数据中心选址主要考虑电力供应和人力资源两大因素。

Google DeepMind推出Aeneas模型,可修复古拉丁文残缺文本

Google DeepMind推出Aeneas模型,可修复古拉丁文残缺文本

谷歌DeepMind推出名为Aeneas的AI模型,专门用于修复和解读古代拉丁铭文。该工具能够快速识别相似文本,填补未知长度的文本空缺,并支持文本和视觉输入的多模态分析。Aeneas可在数秒内找到数千条拉丁铭文的相似内容,为历史学家提供可解释的建议。该模型现已开源免费使用,同时DeepMind还升级了古希腊文本模型Ithaca。

老旧的AI理解工具有了新升级:T-Tech公司的"助推器"让AI更懂专业领域

老旧的AI理解工具有了新升级:T-Tech公司的"助推器"让AI更懂专业领域

T-Tech公司研究团队开发了SAE Boost助推器系统,通过训练专门的"错误补偿器"来增强AI理解工具对专业领域的理解能力。该系统在化学、俄语和外交等领域测试中显示出显著改进效果,同时完全保持原有通用能力。这种模块化设计为AI系统的持续优化提供了安全可靠的路径,对AI可解释性研究具有重要意义。

AI主机销售助力IBM二季度业绩超预期

AI主机销售助力IBM二季度业绩超预期

IBM第二季度业绩超预期,得益于新型大型机硬件强劲销售。该硬件能处理海量数据,适用于AI工作负载。每股收益2.80美元,超过华尔街预期的2.64美元;营收169.8亿美元,增长8%,高于预期的165.9亿美元。公司推出IBM z17大型机新品,配备更先进处理器用于生成式AI和金融应用。生成式AI业务达75亿美元。

当AI学会"看懂"蛋白质:斯坦福大学揭示机器如何像生物学家一样理解生命分子

当AI学会"看懂"蛋白质:斯坦福大学揭示机器如何像生物学家一样理解生命分子

斯坦福大学研究团队开发出革命性AI系统,能够像生物学家一样"看懂"蛋白质三维结构并预测功能。该系统通过多层次分析方法,在蛋白质功能预测方面达到90%以上准确率,为新药开发和精准医疗开辟新道路。这项技术不仅加速了蛋白质研究进程,更为解决复杂疾病提供了强大的AI助手,预示着人工智能与生物医学融合的美好前景。