最新文章
美光科技成为先进AI领域的关键供应商

美光科技成为先进AI领域的关键供应商

在AI发展中,GPU备受关注,但AI训练和推理还需要存储和内存来管理数据和模型。美光科技正迅速崛起为AI数据层的关键供应商。该公司在HBM3E和HBM4内存技术方面取得突破,性能效率比竞争对手高30%,已成为AMD和英伟达下一代AI平台的主要内存供应商。美光还制定了2000亿美元的制造扩张计划,支持美国本土制造业发展。

低频段频谱对5G演进"不可或缺"

低频段频谱对5G演进"不可或缺"

全球移动供应商协会研究显示,随着移动行业迈向普遍接入和6G时代,低频段5G频谱在支持物联网、应急服务和数字基础设施方面仍具战略意义。中频段作为5G流量主要承载者,在6G时代仍将保持关键地位,而毫米波5G可能成为通往6G的桥梁。数据显示,低频段频谱价格呈下降趋势,中频段尤其是C频段价格在2023年后大幅下跌。

Snowflake与Databricks争夺企业AI市场核心地位

Snowflake与Databricks争夺企业AI市场核心地位

Snowflake和Databricks已成为企业AI项目中最受CIO青睐的两大平台。两家公司起初定位不同,Databricks专注非结构化数据处理和实时分析,Snowflake则专注云端数据仓库的抽象化和简化。随着生成式AI的爆发,两家公司在数据科学和机器学习平台市场展开直接竞争。专家认为,Snowflake在易用性、安全性和结构化数据分析方面表现出色,而Databricks则提供开发者友好的环境和强大的AI工具支持。

锁定9月13日,2025 AI创新者大会暨第二届提示工程峰会即将来袭
2025-08-04

锁定9月13日,2025 AI创新者大会暨第二届提示工程峰会即将来袭

2025年9月13日,“2025 AI创新者大会暨第二届提示工程峰会”将在北京召开。

新型卫星助力天气预报研究突破

新型卫星助力天气预报研究突破

面对全球气候挑战,美国NOAA数据显示近年来每年发生至少10起损失超10亿美元的天气灾害。Tomorrow.io公司开发了微波探测卫星星座,采用多光谱成像、高分辨率成像、无线电掩星、合成孔径雷达等五种数据技术,构建首个商业化大气3D研究架构。该项目旨在解决全球覆盖数据不足问题,提供更精确的天气预报和灾害预警能力。

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

本文深入分析OpenAI新发布的ChatGPT学习模式背后的自定义指令机制。学习模式通过教育专家协作制定的自定义指令,引导AI采用循序渐进的教学方式,而非直接给出答案。文章将自定义指令分为五个部分:总体目标、严格规则、行动指南、语调方法和重点强调。这些指令体现了优秀的提示工程技巧,可应用于其他AI场景。作者强调自定义指令的强大功能,建议用户通过分段结构化方式制定指令,并进行充分测试和调试以确保效果。

生成式AI如何改变我们的工作方式

生成式AI如何改变我们的工作方式

生成式AI正从理论概念转变为实用工具,深刻改变着各行业的工作模式。从营销到财务,从客服到开发,AI不再是简单的自动化工具,而是成为智能协作伙伴。它帮助团队快速生成内容、分析数据、优化流程,将员工从繁琐事务中解放出来,专注于战略思考和创新。然而,技能不足、信任缺失和组织准备不充分仍是主要障碍,企业需要通过系统培训、明确治理和有目的的实验来充分发挥AI潜力。

创始人进行C轮融资前需要考虑的关键要素

创始人进行C轮融资前需要考虑的关键要素

蓝宝石创投合伙人高凯茜指出,2025年创业公司面临矛盾的资本市场:资本并不稀缺,但获取资本变得更加困难。她强调,只有五分之一的A轮公司能进入C轮融资。投资者不再追逐增长势头,而是寻求确定性和市场领导地位。C轮公司需具备类别领导者地位、高效增长和可持续发展能力。创始人应将融资视为市场推广活动,提前建立投资者关系,并确保获得多家公司兴趣信号后再启动融资。

未来顶尖开发者不再只是编码,而是策划、协调和指挥AI

未来顶尖开发者不再只是编码,而是策划、协调和指挥AI

随着AI技术不断发展,初级编程工作正在消失。ChatGPT、GitHub Copilot等AI助手已能处理重复性脚本、HTML布局等基础任务。初学者现在需要具备系统级思维和产品管理能力。未来开发者将更像拥有技术专长的产品经理,负责指导AI完成工作。团队结构也在改变,一个AI增强的开发者可能替代整个团队。成功的关键在于培养无法自动化的技能,学会与AI协作而非竞争。

2025-08-04

一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

一句话生成虚拟世界的时代到来,腾讯混元团队发布3D世界生成框架HunyuanWorld 1.0

施耐德电气:当AI进入产业主场,核心技术+场景知识带来价值最大化

施耐德电气:当AI进入产业主场,核心技术+场景知识带来价值最大化

当前,破解AI规模化的关键,在于破解三大难题:如何构建可复制、可验证的系统性落地路径;如何通过场景实证实现企业到行业的跃迁曲线;如何借助开放协同,激活更具生命力的AI产业生态。

加州大学圣克鲁兹分校发布革命性图像编辑数据集:让开源AI模型首次逼近GPT-4o的专业水准

加州大学圣克鲁兹分校发布革命性图像编辑数据集:让开源AI模型首次逼近GPT-4o的专业水准

加州大学圣克鲁兹分校研究团队创建了包含150万高质量样本的GPT-IMAGE-EDIT-1.5M图像编辑数据集,通过利用GPT-4o优化现有数据质量,使开源AI模型在多项测试中达到接近GPT-4o的性能水平,在GEdit-EN测试中获得7.24分的突破性成绩,显著缩小了开源与商业模型的差距,为AI图像编辑技术的民主化奠定了基础。

拍照文档歪歪扭扭?这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整!

拍照文档歪歪扭扭?这套清华等顶尖院校联合开发的AI系统让文档瞬间变平整!

这项由清华旗下奇虎科技等机构联合开发的研究,提出了ForCenNet前景中心网络来解决手机拍摄文档变形问题。与传统均匀处理方法不同,该系统重点关注文档中的关键信息区域如文字和表格线条,采用创新的前景分割、掩码引导和曲率一致性优化技术,在四个主流数据集上达到最优性能,为移动文档数字化提供了高效解决方案。

当AI学会了听音乐:卡内基梅隆大学推出史上首个音乐生成模型竞技场

当AI学会了听音乐:卡内基梅隆大学推出史上首个音乐生成模型竞技场

这项研究首次为音乐生成AI建立了大规模实时评测平台Music Arena,通过让真实用户比较不同AI模型的音乐作品并投票,解决了传统评测成本高、标准不统一的问题。平台采用智能路由系统处理不同模型的异构特性,详细记录用户聆听行为,并承诺定期公开数据,为音乐AI研究提供了宝贵的用户偏好数据和标准化评估方法。

JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字

JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字

新加坡科技设计大学研究团队开发了JAM音乐生成系统,能够根据歌词生成完整歌曲,并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统,在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制,JAM为AI音乐创作提供了新的技术路径。

突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。

印第安纳大学团队:让机器人"眼睛"更聪明的视觉理解新方法

印第安纳大学团队:让机器人"眼睛"更聪明的视觉理解新方法

印第安纳大学研究团队提出AFRDA方法,通过自适应特征精炼模块解决跨域语义分割问题。该方法巧妙融合全局语义理解和局部细节分析,引入不确定性引导的双重注意力机制,在城市和森林环境适应任务中显著提升性能。轻量级设计确保计算效率,成功部署到真实机器人系统,为视觉导航和自动驾驶提供新技术路径。

斯科尔科沃科技学院新发现:用"透视镜"揭开AI文本的真面目

斯科尔科沃科技学院新发现:用"透视镜"揭开AI文本的真面目

斯科尔科沃科技学院团队开发了一种基于稀疏自编码器的AI文本检测新方法,能够像"透视镜"一样看穿文本表面,识别AI生成内容的内在特征。研究发现AI文本具有三大类特征:话语特征、噪声特征和风格特征,不同AI模型表现出独特的"写作个性"。这种方法不仅检测准确率高,还能解释检测原理,为教育、媒体等领域提供了更可靠的AI内容识别工具。

没有标准化的未来:Meta推出DyT技术颠覆Transformer架构设计思维

没有标准化的未来:Meta推出DyT技术颠覆Transformer架构设计思维

Meta研究团队提出DyT技术,用极简的动态双曲正切函数替代传统标准化层,在视觉、语言、语音等多领域测试中均达到或超越原有性能。这项研究挑战了标准化层不可或缺的传统观念,证明简单直接的方法有时比复杂方案更有效,为神经网络架构设计开辟了新思路。

阿里Qwen团队重磅发布:一个AI助手同时懂看听说,还能实时"思考+说话"

阿里Qwen团队重磅发布:一个AI助手同时懂看听说,还能实时"思考+说话"

阿里Qwen团队发布了突破性多模态AI模型Qwen2.5-Omni,能同时理解文字、图片、音频和视频输入,并实时生成文字和语音回应。该模型采用创新的TMRoPE时间对齐技术和Thinker-Talker架构,实现了真正的流式多模态交互,在多项基准测试中达到最先进性能。