未来五年,地球人口将在历史上首次突破八十亿。我们错综复杂的食品供应链在已经承受着气候变迁和水资源匮乏的压力下,未来仍将经受进一步的考验。为了满足未来更多人口的需求,我们需要全新的技术和设备,需要科学上的创新和突破,还需要对于食品安全的全新思考。
IBM全球各地的研究人员正在研发针对食品供应链各个环节的解决方案,他们正努力帮助农民最大限度地增加农作物产量,并寻求遏制浪费扩张的方法,这种浪费会让食品供应链蒙受45%的损失。我们的科学家正在创造一种安全网络来捕捉病原体和污染物以避免传播疾病,同时他们也正在发明从垃圾填埋场和海洋中回收塑料制品的新方式。
本周晚些时候,我们将会在IBM今年规模最大的客户活动——旧金山Think 2019大会现场举行的科技创新秀上介绍今年IBM“5 in 5”幕后的科学家。2月13日星期三太平洋时间上午10点-11点,您可观看现场直播,或点击这里观看重播。科技创新秀让我们的研究人员有机会在一定时间内(大约五分钟)向公众讲述他们所做工作的重要性。我们发现这是一种极其有效的方式,将创新技术提炼为核心要素,使之更易于被人们所理解。
研究人员鼓励我们想象今后五年哪些事情会成为可能。当第八十亿个人在地球上出生时,她面临的世界会比她的父母曾经想象的世界更加互连,更加相互依赖,对变化的响应更加快速。这就是我们所有人将面对的未来。
你如何给一个从未踏足银行的农民提供信用贷款?答案是数字化以及对农业全方位数据的采集,包括从土壤质量到拖拉机驾驶员的技能,再到市场上出售的甜瓜价格等。这种数字化技术对行业的全方位渗透、刻画、塑造就像创造了“数字孪生子” (Digital Twin)。在未来五年内,我们将借助人工智能技术,利用这些数据准确地预测作物产量,反之为银行和金融机构提供授予信贷所需的数据,从而帮助农民实现拓展——或许,树木终究会结出财富的果实。
到收获……
五年之内,我们将消除食品供应链中许多代价高昂的未知因素。从农民到杂货店供应商,食品供应链中的每个参与者都将确切地了解种植、订购和运输等信息。当区块链技术、物联网设备和AI算法结合在一起,食品浪费将会大幅减少,最终出现在消费者购物车中的商品也将变得更新鲜。
到货架……
未来五年,全球各地的食品安全检查员将会获得一种超能力:利用数百万种微生物来保护我们的食物。这些微生物(其中一些对人类健康有益,而有一些则不是)将会在农场、工厂,以及食品商店中使用。借助一种让我们可以经济且高效地分析微生物基因组成的新技术,微生物将会告诉我们很多关于我们所购买食物的安全信息。
到餐桌……
五年之内,全世界的农民、食品加工商、食品商店,以及数十亿的家庭厨师将能轻松检测食物中的危险污染物。他们所需的仅仅是带有AI传感器的手机或工作台。IBM研究人员正在开发功能强大的便携式AI传感器,它可以在任何可能出现食源性病原体的地方进行检测。这些移动式细菌传感器可将病原体检测的速度从几天时间缩短到几秒钟,让食品供应链上下游的人们可检测有害的大肠杆菌(E.coli)或沙门氏菌(Salmonella),以避免细菌的爆发。
到垃圾……
未来五年,垃圾处理和塑料制品生产的方式将会彻底改变。牛奶盒、饼干盒、购物袋和奶酪包装袋等所有东西都将是可回收的,聚酯制造商将能回收垃圾并将其变成有用之物。VolCat等创新技术将推动这种转变,作为一种催化化学工艺,VolCat可将某些塑料(聚酯,Polyesters)分解成为可直接送入塑料制造机器,用于生产新产品的物质。
好文章,需要你的鼓励
来自香港科技大学和MiniMax的研究团队开发了SynLogic,一个可合成35种逻辑推理任务的框架与数据集,填补了AI逻辑训练资源缺口。研究表明,在SynLogic上进行强化学习训练显著提升了模型逻辑推理能力,32B模型在BBEH测试中超越了DeepSeek-R1-Distill模型6个百分点。更值得注意的是,将SynLogic与数学和编程数据混合训练不仅提高了这些领域的学习效率,还增强了模型的泛化能力,表明逻辑推理是构建通用AI推理能力的重要基础。
这项研究揭示了大型语言模型的惊人能力:只需两个特殊训练的向量,冻结的语言模型就能在一次计算中生成数百个准确词汇,而非传统的逐词生成。研究者发现,这种能力要求特定的输入排列方式,且生成速度比自回归方法快约279倍。这一发现不仅展示了语言模型未被充分探索的并行生成潜力,还为快速文本重建开辟了新方向。
腾讯混元团队提出的"ConciseR"是一种通过两阶段强化学习实现大模型简洁推理的新方法。研究遵循"先走后跑"原则,先确保模型具备准确推理能力,再优化输出简洁性。第一阶段通过改进的群体相对策略优化(GRPO++)提升推理能力,第二阶段通过长度感知的群体相对策略优化(L-GRPO)减少输出长度。实验结果显示,该方法在AIME、MATH-500等多个基准测试中既减少了输出长度(平均20%以上),又保持或提高了准确率,展现出高效率-高准确率的理想平衡。
这项由香港科技大学团队开展的研究首次全面评估了压缩对大语言模型Agent能力的影响。研究发现,虽然4位量化能较好地保留工作流生成和工具使用能力(仅下降1%-3%),但在实际应用中性能下降达10%-15%。团队提出的ACBench基准测试横跨工具使用、工作流生成、长文本理解和实际应用四大能力,评估了不同压缩方法对15种模型的影响。结果显示,AWQ量化效果最佳,蒸馏模型在Agent任务上表现不佳,大型模型对压缩更具韧性。研究还提出ERank等创新分析方法,为实际部署提供了切实指导。