如果不是这场席卷全美的COVID-19疫情,关于改进美国医疗体系以及疾病治疗能力的消息可能永远不会出现在媒体头条当中。好在如今大部分美国人都只能老老实实待在家中,出于对疾病的恐惧,他们开始在网络上主动了解与新冠病毒的专业知识。在今天的文章中,我们将主要聊聊区块链技术如何帮助我们判断各类消息的准确性与及时性。
美国民众在家中自我隔离
在这个信息触手可及的时代,美国全国公共广播电台进行了一项民意调查,希望了解老百姓最信任由谁发布的新冠病毒信息。在包括总统、新闻媒体、州/地方官员以及公共卫生专家在内的众多选项当中,老百姓表示对于公共卫生专家的发言更加认可。
其中一位公共卫生专家,专门负责为焦虑而紧张的民众提供关于新冠病毒的第一手准确信息。Jim Nasr是Acoer公司CEO,他们正在为COVID-19开发一款数据可视化工具,用于提供实时且可信的疫情状况信息。作为奥巴马政府疾控控制中心的前任首席软件架构师,他在美国民众当中拥有良好的口碑与可信度。
文件夹标签上的冠状病毒字样
当然,单靠个人形象并不足以支撑全民范围内的可信度——他还在利用区块链技术创建新冠病毒(COVID-19)跟踪器,由计算机在其中提供数据可信度支持。Nasr将区块链定义为一种“可计算信任协议”,并利用公共分布式分类账技术Hedera Hashgraph为该可视化工具中使用的数据建立信任基础。
Nasr认为,结合当前疫情大流行且信息来源愈发重要这一背景,区块链技术成为向公众提供可信数据的重要方式。他指出,“对于大多数美国人来说,区块链这个技术术语长期以来与比特币密不可分。作为数字货币的点对点交换载体,区块链在2009年诞生后的第一个用例确实就是比特币。”不过在他看来,这样的固有印象不利于区块链技术在医疗保健领域的应用。
“我们多讨论一些其他用例,人们对于区块链跟比特币之间的僵化印象就会少一些。”在他看来,区块链的独特之处更多在于“这是一种具有可计算性的信任平台。”
为了理解区块链对于可视化工具的助益,他们将来自疾控中心、世界卫生组织以及Clinicaltrials.gov的数据摘录整理至系统当中,并创建出一份包含数据与元数据的参考文件(用于将信息内容与信息来源匹配起来)。这份文件通过区块链(即分布式分类账技术)获得确认,其中信息接收时间与信息来源都将以安全形式被记录为“时间戳”,并可公开供其他人随时查看验证。
Nasr指出,他使用的分布式分类账技术为Hedera Hashgraph,这是一种“向公众发布Hedera所有动态的防篡改交易日志”。Hedera Hashgraph具有高效且合理的计算成本,因此成为市面上颇受信任的平台选项之一。Nasr用它“建立可计算的信任层,从而证明我的一切行动。”
区块链行业意见领袖Victoria Adams指出,“最重要的是,我们必须了解这些数据的来源并有能力追溯其使用方式。区块链在这方面发挥着不可或缺的作用。我们不仅要知道自己知道什么,也要明确这种「知道」到底有多可靠。Hedera Hashgraph分布式分类账等工具将成为证明信息可靠性的关键前提。”
在对抗COVID-19疫情的同时,保障医疗隐私安全
ConsensSys Health公司创始人兼CEO Heather Leigh Flannery同样选择区块链技术以实现对公共卫生数据的“可计算信任”。“在ConsenSys Health,应对COVID-19疫情已经成为我们首要任务。随着疾病的继续传播,我们正立足技术领域为人们提供应对办法。”
Heather认为,应对流行病当然非常重要,但我们同时也不必放弃自己对于个人医疗隐私方面的数据归属权利。“目前的主导思路,是要求我们放弃所有个人隐私。从长远角度看,这种作法问题很多,我们应该考虑如何在保护个人隐私的同时促进公共卫生技术的发展。单凭区块链当然不足以支撑起这样的隐私保障要求,但将其与零知识密码学以及联合分析/机器学习两大技术家族结合起来,实现这项统一目标将不再是梦想。”
随着美国民众逐渐接受病毒大流行这一现实,加之关于新冠病毒的信息变得愈发重要,区块链技术迎来了前所未有的发展机遇。如果能够切实增强新冠病毒相关信息的可信度,相信这项新技术将在未来得到更为广泛的认可与应用。
好文章,需要你的鼓励
本文探讨了一种防范通用人工智能(AGI)和人工超级智能(ASI)存在性风险的方法:将它们置于计算机仿真世界中进行测试。虽然这种方法看似合理,但存在诸多挑战。AGI可能会隐藏恶意行为,或因被欺骗而转向恶意。此外,仿真环境可能无法完全模拟真实世界,导致测试结果不准确。构建高质量仿真系统的成本和技术难度也不容忽视。文章认为,仿真测试虽有价值,但并非万能解决方案。
这项研究关注语音中的句子强调(即说话时对特定词的重音),它能传达说话者的潜在意图。耶路撒冷希伯来大学的研究团队发现,尽管现代语音语言模型进步显著,它们在理解句子强调方面表现不佳。团队创建了StressTest基准测试和Stress-17k合成数据集,并开发了StresSLM模型,使强调理解能力大幅提升。研究表明,通过特定训练策略,可以让AI不仅理解"说了什么",还能理解"怎么说的",从而捕捉人类交流中的微妙含义。
尽管AI在围棋等复杂游戏中表现出色,但在简单的井字棋游戏中却屡屡失败。研究显示,AI代理在模拟商业环境中的表现同样令人失望,经常出现幻觉、欺骗和任务未完成等问题。游戏测试为评估AI能力提供了直观方式,帮助普通用户理解AI的真实水平。面对当前AI行业的过度宣传,通过游戏化测试揭示AI的实际局限性,对于防范AI泡沫具有重要意义。
ViStoryBench是一个全面的故事可视化评估基准,由StepFun团队打造,用于测试AI将文字故事转化为连贯图像序列的能力。它包含80个多样化故事和344个角色参考,评估包括角色一致性、提示遵循度等多个维度。研究测试了20多种方法,发现UNO在开源方法中表现最佳,而商业软件如豆包和GPT-4o在提示一致性方面表现突出。该基准为故事可视化研究提供了统一标准,推动这一领域的创新发展。