总部位于美国佛罗里达的增强现实公司Realic将推出一款新的应用程序Hybri,Hybri可提供基于AI(人工智能)的“全球首创”人类伙伴。据了解,Hybri结合了人工智能、VR(虚拟现实)和AR(增强现实),可提供基于智能手机的、可自定义的虚拟伙伴,虚拟伙伴可以根据用户的个性做出响应,还能从交互中学习。Hybri将于明年发布,有望为一些人在新冠疫情自我隔离期间提供陪伴。
Hybri应用程序的开发计划是在冠状病毒大爆发之前,目的是为用户创建伴侣、朋友或家人。创建后的数字伙伴或朋友利用VR或AR可达到活灵活现的效果,用户可以通过智能手机或通过兼容VR/AR耳机与数字伙伴互动。
比较有意思的,用户可以利用Hybri的Photoscan功能扫描朋友或家人的脸部图片,然后将图片用于创建出与该位朋友或家人相似的AI伙伴。而且,用户也可以扫描名人照片,如此以来,Hybri伙伴也可以是他们喜爱的演员、歌手或其他任何人的数字化形式。这也许不是名人们特别喜欢的事情,但假设此类数字伙伴只是私下使用,Hybri应该不至于有类似deepfakes涉及的法律问题。
用户可以利用Hybri的Photoscan功能将自己的数字AI朋友和合作伙伴变成亲戚甚至名人的虚拟克隆(图:Realic/Hybri)
Realic首席执行官Richard Donczi表示,Hybri几乎可以满足大家对常在身边的数字伙伴的任何需求。
他告诉笔者,“ Hybri旨在令用户可以决定该数字模型应该满足什么需求。我们不仅可以自定义Hybri的外部参数,还可以自定义Hybri的内部属性。Hybri可以具有同理心、充满魅力和自信等特点。Hybri可以是个在找人聊天及在日常生活中需要帮助的朋友,也可以是个在寻找浪漫的伴侣或是个友好的家庭成员。”
值得一提的是,用户在下载Hybri应用程序后将回答一系列简短的问题。这有助于确定用户数字个性的理想类型,然后由Hybri利用AI再在与用户的交互中学习。
Donczi解释说,“Hybri具有记忆功能,而且长时间不使用时还会保留一个日志。” 他还补充表示,即将推出的Hybri应用程序启动活动就是为了筹集足够的资金,Realic利用资金可以“创建最好的人工智能用于Hybri一类的应用。我们要的不是‘笨拙的’人工智能,而是个智能同伴 ”。
Hybri除了在AR和VR形式里出现外还可以通过语音激活,也可以通过基于智能手机的手势进行控制。Hybri由于用了AI,还可以提供各种“逼真的行为”和逼真的对话。例如,根据用户对Hybri初始问题的回答以及参数设置,Hybri可以在每天第一次互动时说好想念你之类的话或与一开始就和用户吵架。
Realic将于七月为Hybri推出启动活动。据Richard Donczi说,Hybri应用将于一年后在iOS和Android上推出。他声称,尽管Hybri仍在开发中,但对Hybri的需求已经在不断上升。
他表示,“从用户数量(现在超过了20,000)来看,对此类应用程序的需求还是很大的。”
Donczi还认为,冠状病毒大流行和后冠状病毒时期里大家对Hybri的需求会增加,因为大家不会像以前那样冒险地随意与别人会面。他表示,“当然,在此期间,物理联系的数量已减到最低,这也就是为什么我们希望这样的应用对每个人都有益。”
Realic在宣传材料里说Hybri是“全球首创”AI数字人类合作伙伴,但Hybri是否真的可以拥有这样的头衔尚不清楚。
例如,2017年推出的全息同伴基于基于流行的Hatsune Miku 镜音连(vocaloid),一名日本男子2018年甚至还娶了他的虚拟镜音连。另外,韩国开发商Cheritz也在2016年推出了一款名为Mystic Messenger的智能手机游戏,玩家可以与各种虚拟角色“约会”。该款游戏为其他类似的提供模拟伴侣的虚拟约会应用程序铺平了道路。
也就是说,Hybri可能不是首个这种类型的程序,但它似乎是迄今为止构想得最全面的、用途最广泛的数字AI伙伴。如果Realic确实能够实现高度可定制以及活灵活现伙伴的愿景,同时AR和VR功能又能提供更强的沉浸感和可信度,那么Hybri最终可能真能填补我们数字时代一个空白。而由于冠状病毒可能令我们中的许多人在未来一段时间内分开,这个空白可能就更要靠Hybri来填补了。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里巴巴联合浙江大学开发的OmniThink框架让AI学会像人类一样慢思考写作。通过信息树和概念池的双重架构,系统能够动态检索信息、持续反思,突破了传统AI写作内容浅薄重复的局限。实验显示该方法在文章质量各维度均显著超越现有最强基线,知识密度提升明显,为长文本生成研究开辟了新方向。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
腾讯混元3D 2.0是一个革命性的3D生成系统,能够从单张图片生成高质量的带纹理3D模型。该系统包含形状生成模块Hunyuan3D-DiT和纹理合成模块Hunyuan3D-Paint,采用创新的重要性采样和多视角一致性技术,在多项评估指标上超越现有技术,并提供用户友好的制作平台。作为开源项目,它将大大降低3D内容创作门槛,推动3D技术的普及应用。