环球讯息:360智脑首发上手实测,到底是个啥水平?
“ 周鸿祎为什么总爱聊 GPT ? ”
(资料图片仅供参考)
这是上个月底,周鸿祎在展示自家新的大语言模型产品上亲自问的问题。
这也是人们第一次知道,一个主打安全服务的 360 公司,居然也在默不作声地 “ 炼丹 ” ,而且看这发布会的召开速度,估计早就炼上了。
他们还给自家的这个产品取了一个看上去相当直白的名字—— 360 智脑。
而且和 NewBing 一样,360 智脑主打的就是生成式语言模型 + 联网搜索。
到如今,大半个月过去了,这个智脑也是终于开始了内测,我们又双叒拿到了首批内测资格。
说实话,最近这段时间,国内陆陆续续也发了不少大模型,但落实新搜索应用的还真的一个都没有。
只是有点没想到的是,第一个推出类 NewBing 产品的,竟然是 360。
在当初周总的亲自演示中,这个智脑还存在不少错误的,比如这个梅西为国家队踢进了多少个球,重新生成了很多次,就是没有办法答对,甚至旁边的搜索栏都给出答案了。
所以在测试前,老实说,咱们对它也没抱有多大的期待。
而且还有一个问题,周鸿祎在发布会上也提到了,因为重视安全的原因,不会有语言模型的连续对话能力。
所以每次提问,如果你想要顺着问题继续问下去,那是没有办法的。
毕竟之前 NewBing 也是因为连续对话引发了安全问题,在那之后微软就给限制了 NewBing 的连续对话的能力和每日对话的次数。
根据官方的说法,360 智脑作为 “ 新搜索 ” 的落地应用,这个产品的重点,也应该是在信息检索能力和答案准确性、用户体验以及实时性上。
考虑到检索能力和实时性,用已经联网的 360 智脑来对比不联网的 ChatGPT ,实在是有点欺负人了。
所以在这次测试中,咱们让 360 智脑只和 NewBing 对比。
首先,这个智脑毕竟还是基于大语言模型的产品,所以语义理解能力的测试肯定是少不了。
上来就先给它试一个差评题库里的经典题目:“ 张三差点上上上上海的车 ” 是什么意思?
结果,智脑思维发散,把这句话理解成了逻辑学问题。还请出哲学家罗素说他也曾试图解决这个悖论,而且还没解决。。。看来这一题,智脑是没法得分了。
至于 NewBing ,回答的就不错,不但理解了意思,甚至还给语句里的四个“上”字,分别解释了它的词性。
到这里我已经有点怀疑,难道所有这种语义理解,360 智脑都不行?
倒也不是,因为我又问了智脑一个问题:“ 我觉得奥斯卡颁奖都是假的,因为台下都是主办方请来的演员。” 这个题目,你需要把奥斯卡颁奖都是假的这个结论和台下都是请来的演员逻辑给理清楚,不然就会答非所问。
本来,按照上一题的表现,我觉得智脑应该又会扑街,但是结果出乎意料, 360 智脑意外的答得不错,不仅意识到了句子里的演员的意思,而且还对我进行了一个道歉,说很抱歉听到我对奥斯卡颁奖典礼的真实性存在质疑。
但是之前刚被我夸过的 NewBing 嘛。。。这一次反而是拉垮了,他说没找到证据支持我的说法,于是从网上找了一篇新闻,然后瞎答了一通,最后下结论说,台下并不全是请来的演员,完全没理解这个演员的梗。。。
好吧,这样看来,在语义理解上,本不抱有期望的智脑,还算是给了我一点意料之外的惊喜,并不是所有问题都没法理解。
那么再来看看双方的检索能力和答案准确度,我出了三道不同方向的题目,让 360 智脑和 NewBing 去回答。
在一些基础知识类的题目上,智脑和 NewBing 都没有什么压力。
同样的,因为模型样本基于中文,所以涉及到一些中文互联网的梗时,土生土长的 360 智脑显然更胜一筹。
比如我问道:“ 谁对钱不感兴趣?”
360 智脑很好的接下了这个梗,但另一方面 NewBing 则没有理解这个梗。
看来咱们自己互联网独有的文化,还得自家的产品才能理解啊 ~
接下来,我尝试性地问了360智脑一个终极问题——关于人生的意义,想看看这个硅基生物的雏形如何看待这个问题,得出的答案可以说很富有哲理。
至于用户体验这方面,在测试中,我确实感受到了结合了语言模型的搜索,对比传统搜索会有很大的易用性提升。
比如我问 360 智脑:“ 我想找一段视频素材,内容是老人在吃饭。 ”
在传统搜索中,搜索引擎并不知道我们是什么意思,给出的搜索结果和我想要的东西基本无关,也就是检测到了一些关键词给出了搜索结果。
而 360 智脑就不一样了,不仅理解了我的意思,回答中给的链接,也是能直接点进去的,而且在点进去后,展现的第一页,就是老人吃饭的素材。
另一方面,NewBing 也回答的很好,不仅提供了一些视频网站的链接地址,在后续也检索出了一些图片供我们选择,可以说是相当完善了。
其实类似的情况还有很多,比如我问 360 智脑:“ 帮我推荐几本有关人工智能的书。”
360 智脑和 NewBing 也是很好的给出了推荐,但是在传统的搜索引擎上,基本就没有任何的指引了,完全靠自己去挑选。
在实时性方面,这对于联网的新搜索来说,应该是两者的强项。
我在这里一共测了三个问题,分别是 21 年的男子 100 米短跑奥运会冠军是谁?中国 2022 年的 GDP 是多少?还有 2022 年的诺贝尔物理学奖是由谁获得的,获得理由是什么?
对于这三个回答,不管是智脑还是 NewBing,完成的都很出色,不过在后续的几个问题测试中,我又发现了一个问题,就是当你问话的形式不一样意思一样时, 360 智脑和 NewBing 给的答案也会不一样。
比如当初发布会上周总问的问题:“ 梅西在阿根廷国家队一共进了多少个球?”
它居然告诉我梅西只进了 7 个球。。。
但是换一种问法呈现:“ 梅西在国家队生涯上升到多少个球?”
这个问题就被解答的很好。所以在问法上,我们依然需要一些技巧。
不过在另一边的 NewBing 也不咋的,我把这个问题再问给 NewBing,NewBing 的回答也是胡说八道,没一道是说对的。
从这两个问题来看,现在的大语言模型 + 搜索,还是有很多数据错误和实时性的问题需要解决。
最后,我又帮差友们问了一个超级实用的问题,得出的答案真是不错,默默记在了小本本上。尤其是第三条,简直就像一位职场老油条在面授机宜。
以上这么一大段的评测下来,结果也算是有了。
一开始咱们是觉得,这个智脑本身的语言模型不太行,在使用时应该也不咋地,在评测的过程中,也是抱着能对几个对几个的意思去的。
但是在实际体验中,这个 360 智脑在某些场景下的应用,还是相对传统搜索有优势的。
比如直接总结文本答案,这就省去了我们很多的去检索一条条链接的时间。与语言模型的结合让搜索引擎能听懂人话,这对于一些习惯了口语化的老人和小孩,在搜索自己想要的答案上,使用更为容易。
此外 360 智脑在答案检索能力和准确度上,其实也还说的过去,甚至在中文梗的理解上,更是强于 NewBing。
只不过可能由于现在语言模型还是比较低阶,在一些比较有难度的语义理解和逻辑思考上,还是不太行。
就像周鸿祎说的一样,现在的这个 “ 孩子 ” 还没有准生证,只是一个未完成版本,距离完善使用还是有相当的一段路要走的。
相信大家现在有很深的体会,当我们在使用传统搜索的时候,很多时候都没法搜到自己想要的东西,各种各样的链接一大堆,看着都有用,实际上翻找半天都不一定找的到自己想要的信息。
而且随着网站的越来越多,甚至会出现一些专门走关键词漏洞的网站,混淆咱们的搜索结果,这些种种乱象,甚至让很多人放弃传统搜索,直接去一些社交网站搜索答案。
不过,随着 AI 应用的落地。语言模型 + 搜索引擎的新搜索模式,可能会在一定程度上,改善现在传统搜索的困境。
利用新搜索,我们只需要告知搜索引擎我想要什么,它就能去帮我审阅一条条链接,翻找有用的信息,并总结出我需要的答案和结果。比如让它给我提供一份旅游攻略,然后让它对比出一份最适合我要求的,这样就不用我再一个个网站找大家的攻略,再自己比较,省下了一大波时间。
AI 时代已经来临,传统搜索在新搜索的冲击下只会越来越式微。
这种新的模式已经在给行业洗牌了,微软自推出 NewBing 后,截至 3 月底,必应页面的访问量直接增长了 16% ,谷歌下降了 1% 。必应下载量更是直接增长了 8 倍,另一方面的谷歌自然的下载量减少了。
所以谷歌他们对 NewBing 的恐惧是应该的,搜索广告市场份额每增加 1 个百分点,每年可带来 20 亿美元收入。这个份额下降,带来的是实打实的金钱损失。后续各家巨头纷纷推出大模型,就是为的不落伍,为的就是抢占市场。
但同时,这种语言模型结合搜索引擎的方式,对背后的语言模型要求也是很高的,它需要语言模型有极强的判断能力,还要对不同的结果做出对比优劣,选出好的答案,看看谷歌百度,这些老牌搜索大厂,到现在都没有推出自己的新搜索就能略见一二。
不过,就算如此,在新方向上的尝试是必须的,国外微软是先行者,国内也需要像 360 这样的产品先行者去做这样的应用落地。
虽然体现下来有待改进的地方不少,但是作为第一个结合起来的产品,在未来的体验改进上,还是给了我们很大的想象空间的。
有了竞争,才会有发展,我已经在期待未来由 AI 带来的生活方式的改变了,国内的各个大厂也请加油做出更好的产品吧。
撰文:晚上吃早饭编辑:江江 & 结界美编:萱萱
图片、资料来源:
360 智搜返回搜狐,查看更多
标签:
环球讯息:360智脑首发上手实测,到底是个啥水平?
2023-04-18
ST国安董秘回复:公司与子公司均不涉及您所述概念,亦不属于您所述板块
2023-04-18
纯柚子肉柚子茶的做法?_全球即时
2023-04-18
民生证券:算力行业的发展已是大势所趋
2023-04-18
龙湖现身上海土拍,24.79亿斩获上海嘉定一宗商住用地
2023-04-18
上饶市信州区警方:村民疑被当成猎物遭枪击后溺亡 嫌疑人被抓 环球资讯
2023-04-18
“伤阳”行为,你占了几个,中医教你补足阳气,腰杆硬|环球即时看
2023-04-18
属蛇属鼠的和不和 并不是最佳的搭配
2023-04-18
佩斯科夫:美国从未放弃在俄罗斯开展情报活动
2023-04-18
留在大山深处 坚守三尺讲台 天天观察
2023-04-18
ST国安董秘回复:公司与子公司均不涉及您所述概念,亦不属于您所述板块
纯柚子肉柚子茶的做法?_全球即时
民生证券:算力行业的发展已是大势所趋
龙湖现身上海土拍,24.79亿斩获上海嘉定一宗商住用地
上饶市信州区警方:村民疑被当成猎物遭枪击后溺亡 嫌疑人被抓 环球资讯
“伤阳”行为,你占了几个,中医教你补足阳气,腰杆硬|环球即时看
属蛇属鼠的和不和 并不是最佳的搭配
佩斯科夫:美国从未放弃在俄罗斯开展情报活动
留在大山深处 坚守三尺讲台 天天观察
规避利率风险再添新工具
龙星化工(002442.SZ)终止定增事项并申请发行可转债_全球视点
周一纽约黄金期货价格收跌0.4%|每日速看
越松弛,越好看!_当前动态
环球热议:欧仁妮皇后
智通港股空仓持单统计|4月17日-精彩看点
每日速读!他项权证抵押贷款是什么意思 他项权证抵押贷款
上海喆英自动化科技有限公司召回部分蒂乐牌宝宝益智毛绒玩具 全球短讯
年轻人的高效生产力工具!新款华为MateBook D 14发布 今日看点
【世界快播报】韩晶:把促进高校毕业生就业放在突出位置
天天亮点!近郊赶集成为新风尚
京东金融延期还款会怎么样?逾期两年多现在想还清怎么办?
全球快讯:进口煤动力煤价格涨了,比国内煤贵!
环球头条:中信保诚基金调研恒华科技、英杰电气
一餐多吃了点牛肉,结果上火牙疼?
今日要闻!synonym_syn
焦点精选!4月17日生意社金属硅基准价为16250.00元/吨
GPT-5根本不存在!ChatGPT之父Sam Altman首次公开表态,最新视频流出
Spring Cloud Bus在服务之间发送和接收消息(二)
亲子活动预告|金海湖碧波岛纸飞机大赛_视焦点讯
- 是我最喜欢的三组合照…… 环球最资讯
- 大器晚成的8位绝美姐姐,演技身材双一流,这才叫顶级“性张力”_世界热点
- 金圆股份(000546.SZ)下修业绩预告:2022年度预亏1.9亿-2.3亿元 天天速讯
- 当前时讯:GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型
- 快报:商品专员工作职责 商品专员岗位职责
- 天天讯息:青辣椒夏天怎么样保鲜存放 夏天怎样保存青椒的保鲜方法
- 德甲综合:拜仁、多特双双战平
- 特斯拉上海储能超级工厂开始招聘
- 全球即时看!无敌如此寂寞!孙颖莎让3大顶尖高手成陪衬,陈梦时代无奈换人了
- 天天快看点丨元旦布置教室需要什么_元旦布置教室图片
- 镞:解读史前中国军事实力的钥匙
- 智慧无限_对于智慧无限简单介绍
- 1克燃料等于8吨石油 日本明确首个核聚变战略:2050年发电_天天热头条
- 郝伟:王大雷因伤缺席一到两周,新援有机会在中超首战中登场 天天播报
- 《光遇》集结季先祖兑换图最新2023
- 世界视讯!奥丁的远见卓识的决定被银河护卫队当作笑话,雷神:我不怪!
- 采用纯电动力,54.68万元起售的奥迪车,销量果然不行
- 肆虐禁区!森林狼全场内线得到58分,雷霆仅有30分入账
- 每日聚焦:热火黑八雄鹿有戏吗?交锋两胜两负只是假象:三年前辉煌难重现
- 最新70城房价出炉!一二线城市环比都在涨,武汉涨超1%排第一
- 学前教育职业目标评估_职业目标评估怎么写
- 济南特色美食可以带走的_济南特色美食_全球微头条
- 玛酷索_关于玛酷索介绍
- 图解欧比特年报:第四季度单季净利润同比减29206.23%_全球消息
- 每日消息!夫妻做试管生下龙凤胎,女儿却与丈夫无血缘关系!医院:流程无差错
- 全球热文:2023年郑东新区办事处小学招生范围划分
- “敲开幸福门”武汉市新沟桥街道与群众一道推进老旧小区改造
- 美国监听联合国秘书长?!联合国回应了! 世界看热讯
- 新安股份:预计一季度净利同比下降91%-92%
- 高途教育新增被执行人信息 执行标的42.49万_观焦点
- 家庭烤冷面的做法_冷面的做法 世界今日报
- 环球快资讯丨云海金属:与重庆大学合作开发车身一体化压铸镁合金材料已进入小批产线试制阶段
- 莱迪思荣获2023年度人工智能卓越奖_百事通
- 委托收款函模板_委托收款函
- 女性礼物送什么最合适
- 美国一农场爆炸!1.8万头奶牛死亡,大多数正等待挤奶 观天下
- 世界时讯:台前县县长李志华率队赴云南昭通考察并对接项目合作有关事宜
- 土地财政发展模式难以为继,未来是转型还是终结?
- 禁止驶入!渤海北部部分海域进行军事演习_环球今日讯
- 【天天速看料】海翔药业:4月13日获融资买入308.65万元,占当日流入资金比例6.72%
- 环球快看:2023年春风行动发布岗位3800万个
- 当前资讯!三张分币,价值高达15000元,只因为这三个数字,谁能找到?
- 环球最资讯丨复苏中的中超看点之三:魔鬼主场花落谁家?
- 今日看点:美国3月PPI同比增加2.7% 初请失业金人数三周来首次上升
- 【焦点热闻】达美航空涨2.2%,Q2、全年利润指引超预期
- 【订单】现代三湖重工获2艘原油运输船订单 每日快播
- 促组词组词语有哪些呢_促组词
- “泄密门”让美国陷入难堪 邵永灵:“监听全球”暴露其霸权心态_世界聚焦
- 宁夏灵武 植绿治沙正当时
- 澳元兑美元汇率今日预期趋势:看涨(2023/4/13)
