人机对话比拼,Chat GPT和文心一言谁更接近真实交流?”
创始人
2025-05-30 14:31:07

目录

文心一言初体验

一、登录体验难易对比

 二、测试对比--哲学类

第一个问题:《三体》的作者是谁?

第二个问题:总结以下《三体》的核心内容,如果要续写的话可以从哪个角度出发?

第三个问题:你认为智能交通最适合在哪个城市发展?

三、测试对比--理科类

四、测试对比--绘图类 

五、测试对比--程序代码类

1、代码生成:html+js+css编写一个爱心代码

2、代码分析:帮分析一段代码实现了什么功能;

3、找BUG测试


2月7日上午,经百度确认,类似Chat GPT的项目已经确定命名为文心一言,因为命名ERNIE Bot,3月16日,下午14点,召开新闻发布会,完成内测,面向公众开放。据发布会消息,目前该产品已经可以在百度上面申请体验!

相关链接:文心一言 (baidu.com) 

当然,作为一个中立者,我也会在体验之后,比较一下文心一言和Chat GPT的异同和体验感满意程度在哪里。所以,跟随我的脚步,我们出发咯!


文心一言初体验

由于是刚开始公测,需要到“百度智能云”上面去填报自己的个人信息,才能通过体验请求!

经过一天的申请等待时间,终于得到了体验的机会,那作为一名开发者,我就来一次理性的测试一下文心一言和ChatGPT之间的差异是什么,,这边通过几项测试关卡来对比,那跟着我的步伐,一起来看一看!


一、登录体验难易对比

对于“文心一言”,大家只要在百度云网站体检实名申请,提交申请之后等待审核通过,就可以了。申请通过,我们进入到测试界面!如下,

再,点击“开始测试”,我们就进入到了内测的界面,如下:

 登录网址:文心一言 (baidu.com)

 那接下来,我们看一看chatGPT的登录体验的准备操作:

首先,因为chatGPT,再国内没有办法直接登录体验,需要使用国外的电话账号,加上国外的VPN,再此之前,捣鼓了好久才搞定了chatGPT的登录;

在一系列的操作之后,才进入到了opanAi,才使用上了,chatGPT!

 虽然,这个步骤我轻描淡写一笔带过,但是有能使用到OpenAI的小伙伴,就能知道使用GPT的前期工作还是相对而言很麻烦的!在登录体验两者方面,对比起来,那就是文心一言方便于GPT,毕竟是自己国内的内测体验,只需要认证申请就大概率能申请得到,当然,也要看你脸红还是脸黑,要是脸黑,那还是申请不了的!所以,个人而言,在这一关卡,文心一言在我心中优胜一点!


 二、测试对比--哲学类

这个项目,决定使用当天“文心一言“新闻发布会上所展示的几个问题,以相同的问题来问一下chatGPT,看看以下两者给出的答案有什么不同!

第一个问题:《三体》的作者是谁?

对于这个问题,由上图来看,二者的回答几乎相差不大,文心一言回答的更加的详细,GPT相比较就更像一问一答的回答模式,所以这一对比,给一个平局!


第二个问题:总结以下《三体》的核心内容,如果要续写的话可以从哪个角度出发?

 文心一言的回答:

GPT的回答:

对于这个问题,文心一言只是回答了角色塑造、艺术背景、哲学的方面总结了三体的内容,但是没有在续写方面提及到建议;而GPT在总结方面在自然灾难、文化危机和哲学这三方面进行总计,在续写方角度也罗列方向,所以这一回合GPT优胜一局!


第三个问题:你认为智能交通最适合在哪个城市发展?

GPT的答案:

 文心一言的答案:

二者相比而言,GPT直接罗列了四个适合发展的城市,文心一言没有罗列出来,以一个较为笼统委婉的回答来回答!


三、测试对比--理科类

接下来,我们来问个理科类的问题来测试两个人工只能,看看他们给出的答案有什么不一样!

问题:鸡兔同笼游戏。鸡有2个脚1个头,兔子4只脚1个头,那么在一个9头40只脚的笼子,应该有多少只鸡和兔子?

 我们根据上图,可以看得出来chatGPT给出了完整的答案(也提示题目有误),而文心一言给出了一个题目出错的答案!一个是给出了详细的解题过程,一个给出了相对俏皮的回答,感觉就像一个是理科生一个是文科生!

接下来,我们将40只脚改为30只脚,看看二者的回答!

 由此我们可以看到,两者都给出了正确的答案,只不过一个严谨一i但,一个相对于俏皮,那么你喜欢哪一种风格呢?


四、测试对比--绘图类 

我们问题问题是:为2023世界智能交通大会制作海报;

这其实是一个相对超纲得问题,那我们看看两者给出得回答是什么?

GPT:

GPT给出得答案是:作为一款文本AI,它无法生成图像和海报,但是GPT罗列出制作海报方面得建议!那我们看一下文心一言给出得答案:

文心一言:

 相对于GPT,文心一言直接给我们制作了一张海报,这一比还是文心一言更加胜一筹!


五、测试对比--程序代码类

作为开发人员,还是需要这两款AI能在程序方面能给与到一些辅助作用的,那么我们就从测试生成代码和代码分析以及找BUG三个方面测试对比以下二者!

1、代码生成:html+js+css编写一个爱心代码

GPT: 

 效果:

 GPT得爱心代码效果:可以在浏览器中打开此 HTML 文件,点击页面上的爱心,就可以看到爱心变成了实心红色,再次点击则变回原来的样子,个人觉得还是可以的;程序不到50行!

那我们测试以下文心一言:

文心一言:

效果:

 相比于上面GPT,还是可以的,有种中国人的浪漫!个人还是喜欢第二种,可能我是颜控吧!哈哈哈!


2、代码分析:帮分析一段代码实现了什么功能;

这里我们使用到一个:求直角三角形两个边长的长度:已知斜边长度L,求2个直角边:X,Y长度;的这么一个程序题,看看二者能不能分析出来!

题目:

#include #include void main(){float a,b,R,L,r;printf("请输入斜边长度:");scanf("%f",&L);printf("请输入其中一斜角度数:");scanf("%f",&r);R=r/180*3.1415926;  //计算弧度a=sin(R)*L;  //计算一直角边b=cos(R)*L; //计算另一直角边printf("%.2f\n",a);printf("%.2f\n",b);}

GPT的回答:

文心一言的回答:

 由此可以看出,二者还是不相伯仲,都能分析出程序的正确回答!所以这一关,两个还是平手!


3、找BUG测试

我们将第二题的程序分析里面的float改成char类型,scanf写成scan,看看二者能不能找到程序的错误!

GPT的回答:

 文心一言的回答:

 这一关上面,GPT给出了再到的错误分析,但是文心一言没有找到,只是复制了我改错的代码就没下文了,所以GPT优胜一筹!

好了,对比总结下来,GPT和文心一言都各有各的优缺点,个人觉得文心一言的缺点还是训练时间不够长,训练模型还不够,所以加油吧,毕竟好不容易申请到内测的机会,提出了自己的宝贵意见!个人保持中立且理性的看法去看待二者!都加油吧!我是丘比特惩罚路!喜欢的话,给个关注吧!

相关内容

热门资讯

SpringMVC-前后台协议... SpringMVC-前后台协议联调 4,前后台协议联调 4.1 环境准备 创建一个We...
【C语言】你真的了解结构体吗 引言✨我们知道C语言中存在着整形(int、short...),字符型(char)&#x...
一人一世界一叶一菩提什么意思,... 一人一世界一叶一菩提什么意思目录一人一世界一叶一菩提什么意思一花一世界,一叶一菩提的意思是什么?佛家...
国家的含义是什么 极速百科网 ... 国家的含义是什么目录国家的含义是什么国家的含义是什么对国家最本质的解释是什么?国家的含义是什么?国家...
如何用word制作宣传单,wo... 如何用word制作宣传单目录如何用word制作宣传单word业务传单在哪如何利用word排版制作广告...
怎么练习穿高跟鞋,很多女生穿不... 怎么练习穿高跟鞋目录怎么练习穿高跟鞋很多女生穿不惯高跟鞋,该如何舒适的驾驭高跟鞋呢?请问一下..怎么...
linux交换分区和逻辑卷 交换分区 查看交换分区: [root@localhost ~]# free ...
AGV小车的运动是怎么控制的呢... 随着市场的竞争加剧,有一家位于城市中心的酒店开始引入一些新的科技设备来提高服务水平&#...
火车票开售时间,火车票早上几点... 今天给各位分享火车票开售时间,火车票早上几点开售的知识,其中也会对火车票预订早上几点开始发售进行解释...
康熙容妃历史原型 极速百科网 ... 康熙容妃历史原型目录康熙容妃历史原型康熙容妃历史原型康熙大帝里面的容妃是历史上的真人真事吗?死后被追...
怎么鉴别镀银和纯银,纯银和镀银... 怎么鉴别镀银和纯银目录怎么鉴别镀银和纯银纯银和镀银怎么区别怎么能看出是纯银还是镀银如何鉴别银饰物品是...
麻辣烫的菜单有哪些,麻辣烫的菜... 麻辣烫的菜单有哪些目录麻辣烫的菜单有哪些麻辣烫的菜单麻辣烫的菜品有哪些?麻辣烫菜单(尽享中国特色小吃...
dhtmlx.Gantt 8.... 最新消息 如果您的当前版本的 dhtmlxGantt 早于 2.0,请查看从旧版本迁...
docker版jxTMS使用指... 本文讲解docker版jxTMS的数据查询,整个系列的文章请查看:doc...
Class文件解析 目录 Class文件格式总览 常量池(Constant Pool) 数据类型描述规则 成员变量描述规...
瑞士是什么之国,瑞士是什么之国... 瑞士是什么之国目录瑞士是什么之国瑞士是什么之国?意大利,加拿大,日本,瑞士,泰国的别称是什么?瑞士是...
带坏字的成语,带“坏”字的成语... 带坏字的成语目录带坏字的成语带“坏”字的成语有哪些?表示坏的成语?坏字开头的成语带坏字的成语 ...
伤痕累累怎么读,伤痕累累的拼音... 伤痕累累怎么读目录伤痕累累怎么读伤痕累累的拼音是什么伤痕累累的意思伤痕累累的累发什么音?伤痕累累怎么...
随车电话的咨询方法(随车电话是... 本篇文章极速百科给大家谈谈随车电话的咨询方法,以及随车电话是什么意思对应的知识点,希望对各位有所帮助...
九九乘法表-第14届蓝桥杯ST...  [导读]:超平老师的《Scratch蓝桥杯真题解析100讲》已经全部完成࿰...
DS1307 RTC模块使用 主要特性DS1307是Maxim的串行、I2C实时时钟芯片。主要特性有:工作电压&#x...
Vue学习之Vue的生命周期详... Vue学习之Vue的生命周期详细解释概览详细解释每个生命周期的应用beforeCreate(创建前)...
手机键盘输入法怎么设置,手机输... 方法一: 2. 找到并点击“系统设置”。 3. 在“系统设置”中,点击“键盘与输入法”。...
水泥由什么组成,水泥组成材料有... 水泥由什么组成目录水泥由什么组成水泥组成材料有哪些水泥的主要成份是什么?它是用什么做的?水泥的主要成...
一个银行卡可以绑几个微信,银行... 一个银行卡可以绑几个微信目录一个银行卡可以绑几个微信银行卡能绑定几个微信号一张银行卡可以绑几个微信一...
表结构是什么(表结构是啥) 表... 本篇文章极速百科给大家谈谈表结构是什么,以及表结构是啥对应的知识点,希望对各位有所帮助,不要忘了收藏...
微信小程序实现多语言方案|中英... 不管哪个系统,多语言方案套路都是一样的 1、建立多语言映射库 2、记录并存储用户选...
管理技术债 管理技术债 Philippe Kruchten, Robert Nord, Ipek Ozkaya ...
Matlab中exp(x)函数... 目录1.语法2.说明3.示例e的数字表示形式欧拉恒等式为指数函数绘图4.参考来源: 1...
拯救会议纪要!快用这三个音频转... Hello,大家好,我是指尖科技君~不知道小伙伴们平时有录音的习惯吗&#...