前几天看到李艺老师发了一篇文章,我觉得很有意思,而且触及到了一些我们在生活中真实存在的顾虑。

这篇文章我总共看出来三个问题:

  1. 用几条可以冲出星巴克超大杯美式的效果?

  2. 如果 AI 参考的网页内容也是 AI 生成的呢?2022 年 11 月 30 日以后产生的网页内容,谁能保证它们没有幻想的成分呢?

  3. 源于我没有从事过星巴克咖啡师的工作,还有,我得到的答案不直接来源于一位星巴克咖啡师的回答。

我对这些问题都很感兴趣,这篇文章展开讲讲我的看法。

第一个问题:用几条可以冲出星巴克超大杯美式的效果

前提:星巴克超大杯美式为592ml(星巴克菜单可以查到);一条 2g 的袋装黑咖啡大约含有 70mg 咖啡因(李艺老师文章的说明)

假设:咖啡因含量相等,效果相等,效果包含“耳聪目明精神抖擞,绝无嗑睡之症状”。

所以这个问题,关键是要确定星巴克超大杯冰美式有多少咖啡因。

我做的第一个检索,是用谷歌搜索引擎检索关键词“星巴克超大杯美式“,看到了台湾星巴克官网的介绍

alt text

这个数据告诉我是364mg原来冷饮和热饮的咖啡因含量居然不一样。

既然有台湾星巴克,肯定有美国和大陆内地,美国星巴克官网显示是300mg,和台湾的数据差异好大。美国星巴克超大杯是700多ml,和我们不一样,但是热饮美式是一样的,4杯浓缩,所以我们认定这个600ml左右的冰美式也是4份浓缩,300mg

alt text

不过由于成本或者口味差异,茶饮行业做本土化差异也能理解,所以最靠谱的还是得着大陆内地星巴克的数据。很不幸,大陆内地星巴克没有参数,出来3条搜索条目,没有一个有用的。

alt text

看来我得换个中文搜索引擎,用必应,关键词需要更精准点:星巴克超大杯美式咖啡因含量,找到了2024年深圳市消费者委员会现制咖啡饮品比较试验

alt text

一线城市政府背书,我们暂且起个假设,认为这是靠谱的,这个实验结果如图所示。

本次比较试验依据GB 5009.139-2014《食品安全国家标准 饮料中咖啡因的测定》标准对24款样品的咖啡因进行检测。https://www.anan.gov.cn/anan/cpbz/201801/c9ed443d6c7a44c4aa6dd77275ed9769/files/d81f86d084cc4211bcc73268d3273188.pdf>

我们调研的是592ml的冰美式,由于主要成分是水,质量大概是0.592kg,所以咖啡因含量是229mg。和美国和台湾的数据差很大,不知道为啥。

所以,从这个数据看,一杯超大冰美式的效果,等同于3.3条黑咖啡。

当然,上面所有的数据都值得怀疑,最好用控制变量法,拿自己做实验测一下,思路是这样的:用600ml水泡3条黑咖啡,在你每天喝星巴克的时候,替换喝这个,观察自己是不是也能“状态至少可以管 6 小时,6 小时内耳聪目明精神抖擞,绝无嗑睡之症状。”

如果不能,那就第二天加一条;

如果超过6小时,那就第二天减一条。

用这种不断修正和测量的方法,找到满意的数量,找到后,甚至可以以这个数据为基准,反推星巴克冰美式的真实咖啡因含量。

第二个问题:如果 AI 参考的网页内容也是 AI 生成的呢?2022 年 11 月 30 日以后产生的网页内容,谁能保证它们没有幻想的成分呢?

这个问题我分为两部分回答:

  1. 本质问题:“如何确保信息的可靠性”
  2. AI对于“如何确保信息的可靠性”的正反面影响

先回答本质问题:“如何确保信息的可靠性”,这个问题可不是有了AI才出现的,也不是有了互联网才出现的。

可以用第一性原理回答这个问题,也就是想清楚什么是信息,信息有什么特性,什么是可靠性。

信息是经过加工、整理和解释的数据,是有意义的,且可传播。信息的可靠性来源于两个基本条件:事实性和可验证性。

所以,要确保信息的可靠性,就是要从源头出发,找到信息的产生点,理清信息的传播链,交叉验证每个环节的信息是否都具有事实性的特征。

这句话有点太理论,没什么操作性,我换种方式讲。

找到信息的产生点,拿本文的第一个问题“用几条可以冲出星巴克超大杯美式的效果”来讲,其实就是找星巴克的官方代表,比如官网,或者星巴克的工作人员,知道冰美式的制作公式。官网对于我们来说最好找,那就用可靠的搜索引擎检索一下。

这种方式,我们找到了台湾和美国星巴克的冰美式咖啡因数据。这个过程还用到了交叉验证的方法,发现了这两个地区官网的数据差异,为了进一步验证,还需要本土数据。

本土数据是通过必应搜索的,看到了新浪财经的条目,为什么在众多检索结果中,这个数据我会选择进去看呢?

alt text

主要是有数据,比如24,有明确的单位:mg/kg,还有关键词“测评”。进入这个网页,提取到了新的关键词“广东省深圳市消费者委员会发布的现制咖啡饮品”

alt text

知道这个新闻的信息来源的上一级是深圳市消费者委员会发布的一个测评结果。那就去深圳市消费者委员会官网找,检索“现制咖啡饮品”关键词,找到了来源。

alt text

看到这个报告,我们暂且认为这是目前为止可靠的数据。

虽然这个报告也值得怀疑,我们作为普通人拿不到拍摄记录,他们也没有发表学术论文。所以还是得保留疑虑,所以我就提出可以以这个为基准,自己做实验多次测试。

alt text

这一套流程下来,可以总结下验证信息可靠性的经验:

  1. 溯源。比如原始论文、官方文件
  2. 交叉验证。多个关键词检索,选择权威媒体、受同行监督的渠道,避免单一来源偏差
  3. 逻辑批判。即使是深圳市消费委的数据,也值得怀疑,因为数据来源不透明
  4. 技术辅助验证。自己做实验验证
  5. 建立可靠的认知:动态更新,逼近真相。这里我分享kyte的话,他和我观点一样。

alt text

下一问题:AI对于“如何确保信息的可靠性”这个问题的正反面影响

AI生成了大量没有任何权威性的内容。AI生成内容的特点在于快速整合和重组海量信息,信息生成速度很快,但是这些信息没有任何权威性认证。

虽然大模型在训练和微调过程中,确实有人工干预的痕迹,比如人工标注、审核、微调等,但这些人为介入也算不上权威,而是基于预先定义的准则,例如伦理规范、社会共识以及特定群体对“合规性”的标准。

但是另一方面,借助AI,我们可以实现广度和泛化搜索。AI的综合性与泛化能力很强,能够从海量资料中“学习”到规律和相关性,进行快速整合和推理,说明AI看到的信息比我们更全面,搜索的范围比我们更大且更快,那他可以帮助我们在验证信息可靠性的过程中,起到提效作用,比如快速给我们列举多个可能的验证渠道。

第三个问题:源于我没有从事过星巴克咖啡师的工作,还有,我得到的答案不直接来源于一位星巴克咖啡师的回答

这个严格来说不是问题,是一段描述,但是背后反映的是直接经验和间接经验的可靠性问题。

首先,我们得先明确这两种经验的差异性和优缺点。

直接经验是你亲身经历得到深刻、具体的认知与技巧,优势是直接感知,深度理解,但是只局限于个人,很主观,存在偏见;间接经验是你从书本或者其他信息源获得的见解,汇集了很多人、不同时间和空间的观点和信息,可以进行对比、归纳和验证,但是信息比较杂乱,准确性参差不齐。

直接经验和间接经验本身是一种信息,不管是你亲身经历的,还是从别处看到的,那要验证它的可靠性,还是要通过上面提到的方法来验证。