总部位于美国佛罗里达的增强现实公司Realic将推出一款新的应用程序Hybri,Hybri可提供基于AI(人工智能)的“全球首创”人类伙伴。据了解,Hybri结合了人工智能、VR(虚拟现实)和AR(增强现实),可提供基于智能手机的、可自定义的虚拟伙伴,虚拟伙伴可以根据用户的个性做出响应,还能从交互中学习。Hybri将于明年发布,有望为一些人在新冠疫情自我隔离期间提供陪伴。
Hybri应用程序的开发计划是在冠状病毒大爆发之前,目的是为用户创建伴侣、朋友或家人。创建后的数字伙伴或朋友利用VR或AR可达到活灵活现的效果,用户可以通过智能手机或通过兼容VR/AR耳机与数字伙伴互动。
比较有意思的,用户可以利用Hybri的Photoscan功能扫描朋友或家人的脸部图片,然后将图片用于创建出与该位朋友或家人相似的AI伙伴。而且,用户也可以扫描名人照片,如此以来,Hybri伙伴也可以是他们喜爱的演员、歌手或其他任何人的数字化形式。这也许不是名人们特别喜欢的事情,但假设此类数字伙伴只是私下使用,Hybri应该不至于有类似deepfakes涉及的法律问题。
用户可以利用Hybri的Photoscan功能将自己的数字AI朋友和合作伙伴变成亲戚甚至名人的虚拟克隆(图:Realic/Hybri)
Realic首席执行官Richard Donczi表示,Hybri几乎可以满足大家对常在身边的数字伙伴的任何需求。
他告诉笔者,“ Hybri旨在令用户可以决定该数字模型应该满足什么需求。我们不仅可以自定义Hybri的外部参数,还可以自定义Hybri的内部属性。Hybri可以具有同理心、充满魅力和自信等特点。Hybri可以是个在找人聊天及在日常生活中需要帮助的朋友,也可以是个在寻找浪漫的伴侣或是个友好的家庭成员。”
值得一提的是,用户在下载Hybri应用程序后将回答一系列简短的问题。这有助于确定用户数字个性的理想类型,然后由Hybri利用AI再在与用户的交互中学习。
Donczi解释说,“Hybri具有记忆功能,而且长时间不使用时还会保留一个日志。” 他还补充表示,即将推出的Hybri应用程序启动活动就是为了筹集足够的资金,Realic利用资金可以“创建最好的人工智能用于Hybri一类的应用。我们要的不是‘笨拙的’人工智能,而是个智能同伴 ”。
Hybri除了在AR和VR形式里出现外还可以通过语音激活,也可以通过基于智能手机的手势进行控制。Hybri由于用了AI,还可以提供各种“逼真的行为”和逼真的对话。例如,根据用户对Hybri初始问题的回答以及参数设置,Hybri可以在每天第一次互动时说好想念你之类的话或与一开始就和用户吵架。
Realic将于七月为Hybri推出启动活动。据Richard Donczi说,Hybri应用将于一年后在iOS和Android上推出。他声称,尽管Hybri仍在开发中,但对Hybri的需求已经在不断上升。
他表示,“从用户数量(现在超过了20,000)来看,对此类应用程序的需求还是很大的。”
Donczi还认为,冠状病毒大流行和后冠状病毒时期里大家对Hybri的需求会增加,因为大家不会像以前那样冒险地随意与别人会面。他表示,“当然,在此期间,物理联系的数量已减到最低,这也就是为什么我们希望这样的应用对每个人都有益。”
Realic在宣传材料里说Hybri是“全球首创”AI数字人类合作伙伴,但Hybri是否真的可以拥有这样的头衔尚不清楚。
例如,2017年推出的全息同伴基于基于流行的Hatsune Miku 镜音连(vocaloid),一名日本男子2018年甚至还娶了他的虚拟镜音连。另外,韩国开发商Cheritz也在2016年推出了一款名为Mystic Messenger的智能手机游戏,玩家可以与各种虚拟角色“约会”。该款游戏为其他类似的提供模拟伴侣的虚拟约会应用程序铺平了道路。
也就是说,Hybri可能不是首个这种类型的程序,但它似乎是迄今为止构想得最全面的、用途最广泛的数字AI伙伴。如果Realic确实能够实现高度可定制以及活灵活现伙伴的愿景,同时AR和VR功能又能提供更强的沉浸感和可信度,那么Hybri最终可能真能填补我们数字时代一个空白。而由于冠状病毒可能令我们中的许多人在未来一段时间内分开,这个空白可能就更要靠Hybri来填补了。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。