当前位置:首页 > 杂谈 > 正文内容

ChatGPT和文心一言的汽车对比评价,谁更靠谱?-chat下载手机版

2024-06-18 02:56:09TONY杂谈188

懂保汇懂保汇,一个专业、客观、中立的第三方保险信息服务平台。104篇原创内容

近期在不断体会如何调整Prompt以便让大模型智能工具的应用更加高效。

突然产生了一个让 ChatGPT和文心一言做车评的念头。为此,就尝试用汽车之家的评测工具作为参考,来比较一下二者做车评是否可以给出用户可以信赖的结论。

于是,就拿奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车来做一下试验。

拿汽车之家的答案作为标准答案,先展示出来:

由图看出,前三项(动力、空间和安全)是奥迪胜出;后三项(配置、操控和油耗)是宝马胜出。

一,第一次比较

第一次比较,模仿人们通常的Prompt来进行的。

给ChatGPT和文心一言输入同样的Prompt:

请按照下面 6 点比较一下:奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车,需要每一项都有谁胜出的结论:

1,动力

2,空间

3,安全

4,配置

5,操控

6,油耗

将ChatGPT和文心一言的回答放入下面表内并与汽车之家的结论进行比较。黄色底块的说明该结论与汽车之家的结论一致。

​如果以汽车之家的答案作为标准答案来比较,ChatGPT在6题中只答对了2题,而文心一言答对了3题。

这么说,文心一言微弱胜出ChatGPT。

但是,后来仔细研究汽车之家的结论,发现汽车之家在第二项空间和第六项油耗上,疑似是错误的。后面会详细说一下。

如果这样,评价的正确性结论会变成:

ChatGPT:2/6(5、6项正确),

文心一言:5/6(1、2、4、5、6项正确),

汽车之家:4/6(1、3、4、5项正确)。

二,第二次比较

第二次比较的时候,建议ChatGPT和文心一言参考汽车之家的品库后再比较这两款车。

当然,不知道他们二位是否真的参考了汽车之家的品库了,但结论是发生了变化了的。

输入的Prompt如下:

请参考汽车之家汽车产品库,按照下面 6 点比较一下:奥迪 A6L 2023款 TFSI型和宝马5系525Li 2022款这两款车,需要每一项都有谁胜出的结论:

1,动力

2,空间

3,安全

4,配置

5,操控

6,油耗

得出的结论如下表:

将这张表和上面那张表比较,可以发现,ChatGPT和文心一言在参考了汽车之家品库后,比较的结论发生了变化。

先说结论(假设汽车之家的第2和第6项是错的):

ChatGPT:2/6(1、6项正确),

文心一言:5/6(1、2、3、5、6项正确)

虽然正确率没有变,但看细节,ChatGPT和文心一言都有一本正经胡说的本事。

先看一下这两款车的动力数据

这是汽车之家的数据。可以看出,奥迪的马力为190而宝马为184,奥迪的扭矩为320而宝马为290。

但是,ChatGPT却说

奥迪 A6L 2023款 TFSI型搭载了2.0T发动机,最大功率为245马力,最大扭矩为370牛·米。

宝马5系525Li 2022款搭载了2.0T发动机,最大功率为231马力,最大扭矩为350牛·米。奥迪 A6L在动力方面胜出。

真不知道ChatGPT是从哪里得到这样的数据的。

再看一下两辆车的外观空间数据

这也是汽车之家的数据。可以看出:

❶两辆车的轴距,奥迪为3024,宝马为3105。宝马胜出

❷两辆车的外部尺寸,奥迪为5038x1886

x1475,而宝马为5106x1868x1500。宝马在长度和高度上胜出,奥迪则在宽度上胜出。

这里,汽车之家将胜出的章子盖在奥迪上,是否是误盖了?

但是,ChatGPT说

奥迪 A6L 2023款 TFSI型的车身尺寸为5038mm×1886mm×1498mm,轴距为3012mm。

宝马5系525Li 2022款的车身尺寸为4963mm×1868mm×1479mm,轴距为2975mm。奥迪 A6L在空间方面胜出。

如果汽车之家的数据是对的,则ChatGPT的数据有很多错误。

再看文心一言说的:

奥迪 A6L 2023款 TFSI型的轴距为3024mm,车身长度为5038mm,宽度为1886mm,高度为1463mm;

宝马5系525Li 2022款的轴距为3105mm,车身长度为5106mm,宽度为1868mm,高度为1500mm。因此,在空间方面两者相差不大,但宝马5系525Li 2022款略胜一筹。

文心一言的数据也不全对,只是偏差比ChatGPT小一些。

还看一下油耗数据:

汽车之家的数据可以看出WLTC综合油耗奥迪是7.02(疑似为7.2),而宝马为7.4。奥迪胜出

之前说汽车之家的比较结论说宝马在油耗上胜出可能是错误的,就是因为有这两个数据比较。

来看一下ChatGPT的说法

奥迪 A6L 2023款 TFSI型的综合工况油耗为7.2L/100km。

宝马5系525Li 2022款的综合工况油耗为7.4L/100km。

奥迪 A6L在油耗方面略胜一筹。

这次,ChatGPT的数据和结论是正确的。

文心一言的说法

奥迪 A6L 2023款 TFSI型的工信部综合油耗为7.7L/100km;

宝马5系525Li 2022款的工信部综合油耗为7.9L/100km。

因此,在油耗方面两者相差不大,但奥迪 A6L 2023款 TFSI型略胜一筹。

文心一言的结论也是对的。但不知道它为什么会用工信部综合油耗这个指标。

总结

❶,做车型比较时,如果参照汽车之家的正确答案,文心一言的两车比较更靠谱些。

❷,大模型和垂直领域的结合还有不短的路要走。当要求参考汽车之家的品库来做比较,似乎对ChatGPT和文心一言没有什么作用,甚至出现不少数据错误。

❸,整体上,ChatGPT和文心一言都能正儿八经地给出结论,但结论是否靠谱,需要仔细分辨。

❹,未来大模型和垂直领域小模型的结合,有很大空间

懂保汇创想懂保汇创想以我本人的原创为主,偶尔转发其它内容。本公众号主要聚焦企业经营和管理、年轻人成长。同时,集中对保险行业的分析和探索。还有自己的创业感想。欢迎订阅!97篇原创内容

“ChatGPT和文心一言的汽车对比评价,谁更靠谱?-chat下载手机版” 的相关文章

电讯报:利物浦申请推迟与沃特福德的开球时间,被英超拒绝(英超利物浦队)

电讯报:利物浦申请推迟与沃特福德的开球时间,被英超拒绝(英超利物浦队)

直播吧10月5日讯《每日电讯报》报道,利物浦近期曾提出申请,希望将目前定于当地时间10月16日中午12点30分(北京时间19点30分)开场的联赛推迟至晚上7点45开打,以让队内的巴西国脚能够有机会参赛,但该申...

快递哪个公司最快便宜呢?京东顺丰中通ems三通一达大比拼!(哪个快递公司速度比较快)

快递哪个公司最快便宜呢?京东顺丰中通ems三通一达大比拼!(哪个快递公司速度比较快)

快递现在是很常见了因为现在网购太发达了,甚至可以说网购改变了现在的商业模式。而为网购源源不断的提供动力的,自然就是快递了。如果没有快递,网购之后货物送不上门,这也是个事。但有了快递之后,这些问题都迎刃而解了。快递哪个公司最快便宜?一起看看下面的介绍。 一、常用快递的介绍...

物业第三方南京诚平—江苏省物业管理条例之“前期物业管理”-南京银城物业工资怎么样

物业第三方南京诚平—江苏省物业管理条例之“前期物业管理”-南京银城物业工资怎么样

原标题:物业第三方南京诚平—江苏省物业管理条例之“前期物业管理” 小区物业选聘—南京诚平物业服务评估第三方,“小区治理议事厅” 第四章 前期物业管理 第三十一条 新建住宅物业实行前期物业管理。 在业主、业主大会选聘物业服务企业之前,前期物业管理由建设单位...

阳台可种的7味中草药,养眼又养生!-阳台种什么花草

阳台可种的7味中草药,养眼又养生!-阳台种什么花草

很多人都有种一些花花草草的习惯,既可以美化环境,又可以怡情。其实除了普通的花花草草外,也可以在阳台上种一点中草药,漂亮又养生,一举两得。今天就介绍一下常用的可以食用,又可以观赏的7味中草药:   1、紫苏   紫苏是多年生草本植物,适应性强,对土样要求不高,非常...

五体投地是什么生肖(五体投地:探寻属于它的生肖之谜)

五体投地是什么生肖(五体投地:探寻属于它的生肖之谜)

五体投地是什么生肖?这个问题引发了人们的兴趣和好奇心。在中国传统文化中,生肖是一个重要的概念,每个人都有属于自己的生肖。而五体投地则是一种特殊的生肖,它具有独特的特征和象征意义。本文将探寻属于五体投地的生肖之谜,并提供相关的背景信息。 五体投地是指在尊敬、...

56岁富豪被曝光:为永葆青春,竟替换18岁小鲜肉血液

56岁富豪被曝光:为永葆青春,竟替换18岁小鲜肉血液

千百年来,人类为了青春永驻,做了太多疯狂的事。古代西方皇帝曾做过换血术,抽取108个童男童女的血液,加上人参、鹿茸等补品注入本体中,妄图重返青春。但最后,因血液排异反应而驾崩西去。 血液注射有很大的风险,包括排异,感染和疾病等等。但随着现代医学的发展,这些风险被逐步降低和规避,某些...