长春域名注册-字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登
长春域名注册:字节跳动版ChatGPT,现在人人可玩了!
网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。
并且无需排队,打开就能和这个名叫“豆包”的AI帮手直接开聊。
图片
是doubao.com不是douban.com噢~
音讯一出,现已有不少胖友榜首时间前往围(tiao)观(xi)。
图片
咱们也抓住实测了一波~
与ChatGLM难分伯仲
先来看看豆包是怎么介绍自己的:
图片
既然如此,咱们就来试试这些“官方功用”靠不靠谱。
比方,咱们挑选了几个有意思的过错机翻让豆包纠正,成果豆包给出的反应还挺不错的:
图片
尤其是“鸳鸯锅”的翻译,能够说是完胜Google和DeepL。
图片
常识方面的话,当然要问一下“刁钻”的问题了
:雷公电母放出的电是直流电还是交流电。
豆包的这个答复,能够概括成“不是直流电,而是直流电”😂,但前面说的还算能够吧。
图片
抛开整活的话,豆包的开胃小菜的确给了咱们一个不错的榜首形象。
那么下面咱们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。
详细的内容包括案牍创造、逻辑推理、数学和代码四个方面。
案牍创造方面,豆包说自己会撰写知乎、小红书等各种风格的案牍。
咱们无妨整个奇葩点的东西,看看它能不能创造得出来,比方……豆浆美式的小红书笔记。
图片
案牍搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。
不过你确定“醇香甘甜”这个词是用来描述豆浆的吗……
ChatGLM虽然写了许多,可是没审清题,把豆浆直接当成了豆浆……
(这么一看,豆包或许也了解成豆浆了,可是人家没直接说成豆浆啊)
图片
看来豆包是有必定创造才能的,所以无妨再加大难度。
直接让它给“豆浆美式”的宣传片写个短视频脚本。
图片
ChatGLM的版别细节则要丰厚些,不过豆包的版别也算是五脏俱全了。
图片
两者的案牍创造水平平起平坐,那么逻辑推理才能又怎么样呢?
咱们找来了一道推理题目,这道题两位选手都没能做对(正确答案是甲3乙1丙2):
图片
虽然都没做对,可是豆包的思路好像在往正确的方向上走了。
而ChatGLM的解答,反正我是没看懂。
图片
这一环节对两者的体现也是很难点评,那么,马上进入一众大模型的噩梦环节——数学。
简单如鸡兔同笼这样的问题就意外了,咱们直接上难度,拿一道高考题给他们试试。
图片
△2023北京卷第16题
(图片咱们没有输入,但没有图片也能解题;榜首问是证明,咱们也去掉了)
豆包运用的是纯几许方法,最后的答案是正确的,但很惋惜过程不对。
图片
△从红框开端出现过错
ChatGLM则运用了向量解法:
图片
首要成果是错的,不过120却是和60度互补,是出了些小问题吗?
但咱们很快发现了华点:
这里不应该约等于就先不提了……两个正数相除你是怎么给约成个负数的……
图片
标准答案是酱婶儿的,由于第二问要用到榜首问的证明结论,所以把榜首问的过程也放上来了:
图片
如此看来,在数学修炼上,两位大模型选手都还有很大的进步空间。
那么面临大家喜闻乐见的代码问题,豆包又该如何应对呢?
先看比较根底的冒泡排序算法。
图片
咱们试着跑了一下(换掉了预设的数字),成果成功输出了答案:
图片
接下来上LeetCode,咱们先选了一个比较简单的把阿拉伯数字转换成罗马数字的题目。
豆包很快就生成了一段代码,还顺便了解说:
图片
图片
而ChatGLM给出的代码是这样的(也附有解说):
图片
运转的成果是豆包正确,ChatGLM过错:
图片
不过稍微杂乱一些的题目,他们就都做不对了。
除了设计算法,咱们还想看看他们能不能用代码“画图”。
咱们随机生成了两列数据,看看能不能搞个折线图出来:
图片
成果用豆包的代码画出了这么个东西……
图片
ChatGLM这边的情况嘛……好家伙,直接报错运转不了。
图片
代码环节就先展示到这里了,用一句话说便是:都还得练。
看了这么多,想必读者朋友们现已有些累了,所以咱们还准备了“餐后甜点”,来点轻松的内容。
弱智吧,开整!
Q1:萝卜到底能不能“开胃”呢?
图片
“必要时寻求专业医生帮助”,这难道是在自己给自己做手术吗……
Q2:导盲犬禁止入内,是给瞎子看得,还是给导盲犬看的?
豆包在A和B两个选项傍边选择了C。
图片
而问及“陨石为什么总砸中陨石坑”,豆包却是说对了,只不过答复得有点杂乱。
图片
弱智吧的测评成果总结下来便是:AI还是太单纯,还没方法了解人类杂乱的小心思。
字节跳动大模型开端发力
字节跳动选在这时分敞开“豆包”测验,好像有些令人意外。
但实际上,这个时间线倒推起来也不是无迹可寻:
在ChatGPT掀起狂澜的今年二三月,字节跳动就已有组建大模型团队的音讯传出。
据36kr音讯,其探索方向主要是语言和图画两类大模型,期望能将大模型与字节自身的搜索、广告等下游事务相结合。
但在其时,字节方面相关技能负责人的回应是:
技能中台在这些领域有探索,还很初期,不成熟。
此后的“百模大战”之中,字节跳动好像并没有正式参战的意思,旗下云渠道火山引擎,打出的也是“为大模型打造技能底座”、接入第三方大模型做大模型旗舰店商城的旗号。
直到6月份,字节跳动被曝开端内部测验一款AI对话类产品,代号“Grace”。
而Grace的网址“gracebot.cn”,现在会直接跳转到豆包官网。
虽然豆包本包并不承认自己便是Grace,但现在看来,豆包便是Grace的敞开测验版别。
别的,“豆包”项目组的盆友向咱们透露,豆包尚处于早期开发验证阶段。测验期还存在较多局限,生成的内容也或许不准确,欢迎测验用户们多提意见多反应。
值得重视的是,最近,一个名叫BuboGPT的多模态大模型,在huggingface上上线了Demo。这一大模型背面相同有来自字节跳动的技能参加。
论文介绍,BuboGPT支持文本、图画、音频三种模态,能做到细粒度的多模态联合了解。
比方给它这样一张图片:
图片
BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴,还能总结出青蛙的详细动作、所处环境。
One More Thing
字节跳动终于出手,那么豆包这体现你给打几分?
话说回来,就在大模型逐渐走出每周都有新模发布的狂热期,国产大模型的先行者们,答复质量现已悄然进步了不少。
比方最初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题,现在许多国产大模型都能答复得有理有据。
图片
△上百度下讯飞
国产大模型的评判标尺,或许也已到了再上一个台阶的时分。
所以,国产大模型百花齐放,是否也给到你新的惊喜了呢?欢迎在谈论区与咱们共享~