案例名称:【员工智能化报账应用场景】
公司名称:【科大讯飞股份有限公司(002230)】
案例简述:
财务报销与管理是企业财务的重要场景之一。本案例将科大讯飞国际领先的智能语音、自然语言处理、图像识别等AI技术与财务管理相结合,依托票据OCR智能填单、NLP设置审单模型,AIUI 语音问答,并搭建以流程、规则等引擎为主的平台层,以任务管理、影像管理等为主的运营层,来支撑报销、费控、商旅、认领等核心业务应用层,从而完整构建报账机器人,满足企业财务报销与管理刚需。
目前,讯飞报账机器人已深入应用于讯飞生态140余家公司,并取得显著应用成效。财务审单差错率由每月11.64%下降到3.8%,财务审核效率提升52%,年节约成本约1044万。此外,报账机器人在企业数字化转型中的应用也具有显著的社会价值。一方面,采用发票OCR查重、验真,提升了付 款及税务合规性,统一进项税发票入口,保证了业务进项数据的完整性和规范化;另一方面,推行电子发票免打印,有利于带动产业链上下游全面普及使用电子发票,促进形成绿色、低碳的发展方式,降低纳税人经营成本,节约社会资源。
扫码查看详细案例
好文章,需要你的鼓励
这篇研究论文揭示了多模态大语言模型(MLLMs)存在严重的模态偏差问题,即模型过度依赖文本信息而忽视图像等其他模态。研究团队通过理论分析和实验证明,这种偏差主要源于三个因素:数据集不平衡、模态骨干能力不对称以及训练目标设计不当。他们提出了系统的研究路线图和解决方案,包括增强视觉模态在数据集中的贡献、改变模型关注点和应用偏好优化策略。未来研究方向则包括开发更客观的评估指标、探索更多模态组合中的偏差问题以及应用可解释AI技术深入分析偏差机制。
ComfyMind是香港科技大学研究团队开发的一个协作式AI系统,旨在解决当前开源通用生成系统面临的稳定性和规划挑战。该系统基于ComfyUI平台,引入了两项关键创新:语义工作流接口(SWI)和带本地反馈执行的搜索树规划机制。SWI将低级节点图抽象为语义函数,而搜索树规划将生成过程视为分层决策任务。实验表明,ComfyMind在ComfyBench、GenEval和Reason-Edit三个基准测试中均大幅超越开源基线,并达到与GPT-Image-1相当的性能,为开源通用生成AI开辟了新路径。
这项研究介绍了一种名为"热带注意力"的新型注意力机制,专为解决神经网络在组合算法推理中的困境而设计。传统注意力机制使用softmax函数产生平滑的概率分布,无法精确捕捉组合算法所需的锐利决策边界。
这项研究揭示了RAG系统中位置偏见的真实影响——虽然在受控环境中明显存在,但在实际应用中却微不足道。研究人员发现,先进的检索系统不仅会找出相关内容,还会将具有干扰性的段落排在前列,超过60%的查询中至少包含一个高度干扰段落。由于相关和干扰内容同时出现在检索结果前列,位置偏见对两者都有惩罚作用,从而抵消了偏见效应。因此,基于位置偏好的复杂排序策略并不比随机排序更有效,这一发现将优化方向从段落排序重新导向检索质量提升和模型抗干扰能力增强。