如今,人工智能常被称为一种灵丹妙药,成为一种能够帮助我们解决众多社会、商业以及健康问题的改进性自动化技术手段。然而,AI在多样性方面的表现却不够理想,这极大限制了其潜在实用性,甚至有可能进一步放大当今世界上业已存在的隐含偏见。
AI Now研究院最近发布的一份报告发现,80%的AI教授、85%的Facebook公司AI研究人员以及90%的谷歌研究人员都是男性。另外,有色人种在大型科技企业员工当中的占比也非常有限。
这种多样性匮乏有可能直接给最终技术带来缺陷。举例来说,亚马逊公司最近决定停止使用AI工具进行招聘,因为这种工具会在不得不当中针对少数族裔。事实上,AI研究与开发团队当中的女性与少数族裔越多,他们打造出的技术成果才会越稳健、越强大。
Qure.ai是一家医疗初创企业,计划利用AI技术识别X射线与CT扫描影像中的异常情况。Qure.ai公司联合创始人兼研发负责人Pooja Rao解释称,她非常担心AI领域缺少多样性,特别是在医疗保健方面。她正在努力提高其认知能力并促进多样性融合,同时推动业务发展以确保这种新的AI工具能够更好地服务于他们想要支持的一切患者群体。
Rao向我们讲解了AI技术如何在测试领域成为医疗与医疗服务供应方的重要盟友。她指出,目前美国每年要进行超过2.8亿次成像测试——包括X射线、核磁共振成像以及超声波成像等等,但只有4万名放射科医生有能力阅读成像结果。由此带来的影响就是,过重的工作负担往往令患者难以获得准确的诊断结论。AI技术能够以自动化方式完成这一过程,从而克服人力技能方面的匮乏,提高全部患者的诊断准确性。
AI技术是指能够复制人类智能当中某些方面的一切技术或者算法的总称。正如上世纪九十年代受到全世界追捧的,足以击败国际象棋大师的IBM深蓝计算机一样,如今的AI技术实际上也是要执行与人类大脑相同的计算过程,只是速度更快、结果更准确。
目前,凭借着复杂的深度学习算法与增强计算能力的加持,AI已经变得无比强大。AI方案现在能够像人类一样全面实现图像的可视化与内容发现,并通过训练准确识别出目标图像中的特定物体——这将有效弥补美国本土巨大的放射科医师缺口。
Rao最初的职业规划其实是医生,而非技术专家。她在马克斯普朗克研究所攻读博士学位时才第一次接触并应用AI技术,当时她希望利用AI解码大量基因组数据,从而预测阿尔茨海默病的发病原因。在此过程中,她开始对利用机器学习推动研究与发现的巨大前景产生兴趣,并自学了Python编程,用以批量处理大规模数据集。毕业之后,她开始从事数据科学与生物信息学方面的工作,并逐步从对AI抱有兴趣的临床医生成长为面向临床问题的AI科学家。
Rao为目前的AI技术将是对医疗保健专业人士的有力补充,而非替代性方案。她在公司正在构建AI方案,旨在接管各类繁琐的日常工作,从而帮助从业者腾出更多时间与患者接触、填补专业人士不足带来的技能空白,并防止意外错误的发生。
她也一直保持着谨小慎微的态度,注意确保自己的AI工具始终拥有多样性以及经过权衡的深度学习经验。为了说明自己的观点,她以安必奎(一种安眠药)制药试验为例表示,科学家原本只在雄性小鼠的发育过程中进行安必奎测试。该药物随后经FDA批准并公开使用之后,人们发现其在女性体内的有效成分释放周期更长。这也迫使FDA最终不得不发布了新的药品使用指南。
Rao希望确保自己的团队对多样性拥有同样的高关注度,并在训练过程中强调这一点以防止AI方案出现类似的错误。她建议其他开发人员认真检查程序的训练日期,并配合更为广泛的数据网络对部分算法进行重塑,从而解决这个问题。她还表示,团队也可以创建一套竞争性的AI方案,比较二者的计算结果,从而测试固有偏见是否得到解决。
最后,Rao呼吁更多不同的人群加入到AI技术的开发、训练与测试中来。她坚信,这将为AI领域以及正在发展的AI技术成果带来更为平衡的世界观。她也希望有更多女性能够进入这一领域,协助发现当今系统中存在的偏见因素,并避免在未来的AI中出现新的偏见。
好文章,需要你的鼓励
WhatsApp正式向更多iOS用户推送Liquid Glass界面重设计的第一阶段更新。此前,Meta自去年10月起在小范围内测试该设计,将其应用于底部导航栏及聊天标签页部分元素。目前,多名用户已在社交平台确认收到更新,新界面覆盖底部导航栏、聊天内部分元素及主界面顶部导航栏,但语音消息播放器和消息反应菜单等组件仍沿用旧设计,预计后续将陆续跟进更新。
FORTIS是专门测量AI代理"越权行为"的基准测试,研究发现十款顶尖模型普遍选择远超任务需要的高权限技能,端到端成功率最高仅14.3%。
OpenAI近日在ChatGPT Pro中推出个人财务功能预览版,目前面向部分美国用户开放测试。用户需通过Plaid连接银行账户,ChatGPT可接入逾12,000家银行数据,并生成支出图表、投资组合分析等可视化看板。用户可用自然语言查询财务状况、识别可取消的订阅或检测高风险股票。该功能由GPT-5.5 Thinking驱动,未来将支持自动提交信用卡申请等主动操作,并计划向所有用户开放。
荷兰Nebius团队提出SlimSpec,通过低秩分解压缩草稿模型LM-Head的内部表示而非裁剪词汇,在保留完整词汇表的同时将LM-Head计算时间压缩至原来的五分之一,端到端推理速度超越现有方法最高达9%。